理论

文本分类与SVM

9

xsmile 发布于 2017-03-16

from http://blog.csdn.net/zhzhl202/article/details/8197109 之前做过一些文本挖掘的项目,比如网页分类、微博情感分析、用户评论挖掘,也曾经将libsvm进行包装,写了一个文本分类的开软软件Tmsvm。所以这里将之前做过一些关...

阅读(126)评论(0)赞 (0)

常见机器学习方法总览

48

xsmile 发布于 2017-03-08

原文链接:http://www.chinakdd.com/article-oyU85v018dQL0Iu.html 朴素贝叶斯 1. 如果给出的特征向量长度可能不同,这是需要归一化为通长度的向量(这里以文本分类为例),比如说是句子单词的话,则长度为整个词汇量的长度,对应位置是该单...

阅读(593)评论(0)赞 (1)

数据可视化

24

xsmile 发布于 2017-03-08

from http://blog.sina.com.cn/s/blog_7ed6001f0102x1vh.html 1、数据可视化概述 1.1、数据可视化的作用     数据可视化是指将数据通过图表的方式传递出来,让用户能够快速、准确地理解信息所要表达的内容,从而提高沟通效率。数...

阅读(403)评论(0)赞 (1)

使用sklearn优雅地进行数据挖掘

18

xsmile 发布于 2017-03-04

from http://www.cnblogs.com/jasonfreak/p/5448462.html 目录 1 使用sklearn进行数据挖掘 1.1 数据挖掘的步骤 1.2 数据初貌 1.3 关键技术 2 并行处理 2.1 整体并行处理 2.2 部分并行处理 3 流水线处...

阅读(281)评论(0)赞 (2)

一天搞懂深度学习

187

xsmile 发布于 2017-03-01

深度学习 ( Deep Learning ) 是机器学习 ( Machine Learning ) 中近年来备受重视的一支,深度学习根源于类神经网络 ( Artificial Neural Network ) 模型,但今日深度学习的技术和它的前身已截然不同,目前最好的语音识别和影...

阅读(345)评论(1)赞 (1)

淘宝吴雪军:自然语言处理技术在搜索和广告中的应用

1

xsmile 发布于 2017-02-25

本文为淘宝广告技术部广告算法负责人、淘宝网研究员吴雪军在8月3日CTO俱乐部沙龙演讲实录,全文如下: 我今天演讲的题目是自然语言处理技术在搜索和广告中的应用。搜索和广告是技术非常密集两个互联网产品,它们前端都非常简单,但后台系统架构极其复杂。 今天主要讲三个方面的内容:第一、主要...

阅读(310)评论(0)赞 (1)

Python 的十个自然语言处理工具

xsmile 发布于 2017-02-25

from http://www.kawabangga.com/posts/1264 1.NLTK NLTK 在使用 Python 处理自然语言的工具中处于领先的地位。它提供了 WordNet 这种方便处理词汇资源的接口,以及分类、分词、词干提取、标注、语法分析、语义推理等类库。 ...

阅读(370)评论(1)赞 (0)

SAS CTO告诉你统计建模、机器学习与人工智能的区别

2

xsmile 发布于 2017-02-22

关于统计建模、机器学习与人工智能之间的关系和区别,近来无论是在国内外像知乎一类的知识网站上,还是在业内业外爱好者的线下活动组织间,都引发了激烈讨论。今天,SAS首席技术官  Oliver Schabenberger 先生为我们带来了他的见解,希望能对各位小伙伴们有一些启发。 统计...

阅读(277)评论(0)赞 (0)

运用SAS文本分析,海量资料秒分析

3

xsmile 发布于 2017-02-22

我们常常会因为会议笔记内容过多难以归整而发愁?会因为论文众多却无暇浏览而苦恼?会因为短时间内处理巨大数据而绝望?面对这些困扰,SAS北京研发中心分析产品开发部总监高燕女士运用SAS文本分析,通过两个实验快速有效分析IALP大会论文。我们看看她是如何做到的? 不久前,我参加了在台湾...

阅读(195)评论(0)赞 (1)

分析大师系列:商业智能的前世今生

7

xsmile 发布于 2017-02-22

(一)从数据到智能 Google的首席经济学家 Hal Varian 在2010年指出“在接下来的岁月里,最时髦的工作将是统计学家…领悟数据的能力——理解数据、处理数据、提炼价值、可视化数据、沟通数据——必将成为一种极其重要的技能”。言犹在耳,大数据、数据可视化都已成了当下商业分...

阅读(201)评论(0)赞 (0)

大规模机器学习:将数据科学引入生产系统架构的典型模式

10

xsmile 发布于 2017-02-17

from 网络 文作者 Mikio Braun 是 Zalando 的推荐和搜索系统的交付带头人,Mikio拥有机器学习的博士学位。本文概述了一个能把数据科学引入生产系统的架构的典型模式。想了解更多的大规模复杂数据分析的内容,可以查看Mikio Braun的培训视频《大规模机器学...

阅读(207)评论(0)赞 (0)

关于机器学习的领悟与反思

xsmile 发布于 2017-02-17

 作者介绍  张志华 北京大学数学学院教授,北京大数据研究院高级研究员。曾在浙江大学和上海交通大学计算机系任教。主要从事机器学习与应用统计等领域的教学与科研工作。 ◆ ◆ ◆ ◆ 近年来,人工智能的强势崛起,特别是去年AlphaGo和韩国九段棋手李世石的人机大战,让我们深刻地领略...

阅读(362)评论(0)赞 (1)

大数据时代的 9 大Key-Value存储数据库

9

xsmile 发布于 2017-02-15

from http://www.iteye.com/news/27628 在过去的十年中,计算世界已经改变。现在不仅在大公司,甚至一些小公司也积累了TB量级的数据。各种规模的组织开始有了处理大数据的需求,而目前关系型数据库在可缩放方面几乎已经达到极限。 一个解决方案是使用键值(K...

阅读(222)评论(0)赞 (0)

15个开源的顶级人工智能工具

15

xsmile 发布于 2017-02-14

from 51cto 人工智能artificial intelligence,AI是科技研究中最热门的方向之一。像 IBM、谷歌、微软、Facebook 和亚马逊等公司都在研发上投入大量的资金、或者收购那些在机器学习、神经网络、自然语言和图像处理等领域取得了进展的初创公司。考虑到...

阅读(405)评论(0)赞 (0)