理论

淘宝吴雪军:自然语言处理技术在搜索和广告中的应用

1

xsmile 发布于 2017-02-25

本文为淘宝广告技术部广告算法负责人、淘宝网研究员吴雪军在8月3日CTO俱乐部沙龙演讲实录,全文如下: 我今天演讲的题目是自然语言处理技术在搜索和广告中的应用。搜索和广告是技术非常密集两个互联网产品,它们前端都非常简单,但后台系统架构极其复杂。 今天主要讲三个方面的内容:第一、主要...

阅读(10)评论(0)赞 (0)

Python 的十个自然语言处理工具

xsmile 发布于 2017-02-25

from http://www.kawabangga.com/posts/1264 1.NLTK NLTK 在使用 Python 处理自然语言的工具中处于领先的地位。它提供了 WordNet 这种方便处理词汇资源的接口,以及分类、分词、词干提取、标注、语法分析、语义推理等类库。 ...

阅读(66)评论(0)赞 (0)

SAS CTO告诉你统计建模、机器学习与人工智能的区别

2

xsmile 发布于 2017-02-22

关于统计建模、机器学习与人工智能之间的关系和区别,近来无论是在国内外像知乎一类的知识网站上,还是在业内业外爱好者的线下活动组织间,都引发了激烈讨论。今天,SAS首席技术官  Oliver Schabenberger 先生为我们带来了他的见解,希望能对各位小伙伴们有一些启发。 统计...

阅读(125)评论(0)赞 (0)

运用SAS文本分析,海量资料秒分析

3

xsmile 发布于 2017-02-22

我们常常会因为会议笔记内容过多难以归整而发愁?会因为论文众多却无暇浏览而苦恼?会因为短时间内处理巨大数据而绝望?面对这些困扰,SAS北京研发中心分析产品开发部总监高燕女士运用SAS文本分析,通过两个实验快速有效分析IALP大会论文。我们看看她是如何做到的? 不久前,我参加了在台湾...

阅读(58)评论(0)赞 (0)

分析大师系列:商业智能的前世今生

7

xsmile 发布于 2017-02-22

(一)从数据到智能 Google的首席经济学家 Hal Varian 在2010年指出“在接下来的岁月里,最时髦的工作将是统计学家…领悟数据的能力——理解数据、处理数据、提炼价值、可视化数据、沟通数据——必将成为一种极其重要的技能”。言犹在耳,大数据、数据可视化都已成了当下商业分...

阅读(83)评论(0)赞 (0)

大规模机器学习:将数据科学引入生产系统架构的典型模式

10

xsmile 发布于 2017-02-17

from 网络 文作者 Mikio Braun 是 Zalando 的推荐和搜索系统的交付带头人,Mikio拥有机器学习的博士学位。本文概述了一个能把数据科学引入生产系统的架构的典型模式。想了解更多的大规模复杂数据分析的内容,可以查看Mikio Braun的培训视频《大规模机器学...

阅读(92)评论(0)赞 (0)

关于机器学习的领悟与反思

xsmile 发布于 2017-02-17

 作者介绍  张志华 北京大学数学学院教授,北京大数据研究院高级研究员。曾在浙江大学和上海交通大学计算机系任教。主要从事机器学习与应用统计等领域的教学与科研工作。 ◆ ◆ ◆ ◆ 近年来,人工智能的强势崛起,特别是去年AlphaGo和韩国九段棋手李世石的人机大战,让我们深刻地领略...

阅读(187)评论(0)赞 (1)

大数据时代的 9 大Key-Value存储数据库

9

xsmile 发布于 2017-02-15

from http://www.iteye.com/news/27628 在过去的十年中,计算世界已经改变。现在不仅在大公司,甚至一些小公司也积累了TB量级的数据。各种规模的组织开始有了处理大数据的需求,而目前关系型数据库在可缩放方面几乎已经达到极限。 一个解决方案是使用键值(K...

阅读(135)评论(0)赞 (0)

15个开源的顶级人工智能工具

15

xsmile 发布于 2017-02-14

from 51cto 人工智能artificial intelligence,AI是科技研究中最热门的方向之一。像 IBM、谷歌、微软、Facebook 和亚马逊等公司都在研发上投入大量的资金、或者收购那些在机器学习、神经网络、自然语言和图像处理等领域取得了进展的初创公司。考虑到...

阅读(226)评论(0)赞 (0)

通俗理解T检验与F检验的区别

xsmile 发布于 2017-02-08

from http://blog.sina.com.cn/s/blog_4ee13c2c01016div.html 1,T检验和F检验的由来 一般而言,为了确定从样本(sample)统计结果推论至总体时所犯错的概率,我们会利用统计学家所开发的一些统计方法,进行统计检定。 通过把所...

阅读(224)评论(0)赞 (1)

网络爬虫框架Scrapy简介

14

xsmile 发布于 2017-01-24

一、 网络爬虫 网络爬虫(又被称为网页蜘蛛,网络机器人),是一种按照一定的规则,自动地抓取万维网信息的程序或者脚本;它是一个自动提取网页的程序,它为搜索引擎从万维网上下载网页,是搜索引擎的重要组成部分。 网络爬虫分类: 通用网络爬虫 通用网络爬虫又称全网爬虫(Scalable W...

阅读(316)评论(0)赞 (0)

SPSS数据分析—单因素及多因素方差分析

29

xsmile 发布于 2017-01-24

t检验可以解决单样本、两个样本时的均值比较问题,但是对于两个以上样本,就不能用t检验了,而要使用方差分析。t检验是借助t分布,方差分析是借助F分布,基于变异分解的思想进行。 在算法上,由于线性模型的引入,在SPSS中,方差分析在比较均值、一般线性模型菜单中都可以做。 在适用条件上...

阅读(284)评论(0)赞 (0)

SPSS数据分析——t检验

6

xsmile 发布于 2017-01-24

SPSS中t检验全都集中在分析—比较均值菜单中。关于t检验再简单说一下,我们知道一个统计结果需要表达三部分内容,即集中性、变异性、显著性。 集中性的表现指标是均值 变异的的表现指标是方差、标准差或标准误 显著性的则是根据统计量判断是否达到显著性水平 由于t分布样本均值的抽样分布,...

阅读(237)评论(0)赞 (0)

tensorflow学习笔记五:mnist实例–卷积神经网络(CNN)

xsmile 发布于 2017-01-23

mnist的卷积神经网络例子和上一篇博文中的神经网络例子大部分是相同的。但是CNN层数要多一些,网络模型需要自己来构建。 程序比较复杂,我就分成几个部分来叙述。 首先,下载并加载数据: import tensorflow as tf import tensorflow.examp...

阅读(214)评论(0)赞 (0)