数据挖掘

征信业必将大有可为?从拒绝推断说起

6

xsmile 发布于 2017-05-24

作者:KPMG专业数据挖掘团队 从“拒绝推断”说起 如果你读过我们先前发布的《解读芝麻信用与FICO评分的差异》,一定已经对“信用评分”的工作方式有所了解啦。除了打开支付宝就可以看见的芝麻信用评分之外,目前,较为权威的第三方信用评分机构包括FICO,Vantage,Experia...

阅读(257)评论(0)赞 (0)

R语言之Apriori算法应用

3

xsmile 发布于 2017-05-14

from http://www.cnblogs.com/dm-cc/p/5737147.html 一. 概念 关联分析用于发现隐藏在大型数据集中的有意义的联系。所发现的联系可以用关联规则(association rule)或频繁项集的形式表示。 项集:在关联分析中,包含0个或多个...

阅读(251)评论(0)赞 (1)

信用卡评分模型(R语言)

18

xsmile 发布于 2017-05-09

from http://blog.csdn.net/csqazwsxedc/article/details/51225156 信用卡评分 2016年1月10日 一、数据准备 1、 问题的准备 •            目标:要完成一个评分卡,通过预测某人在未来两年内将会经历财务危...

阅读(795)评论(0)赞 (7)

使用sklearn做单机特征工程

8

xsmile 发布于 2017-04-19

from http://www.cnblogs.com/jasonfreak/p/5448385.html 目录 1 特征工程是什么? 2 数据预处理 2.1 无量纲化 2.1.1 标准化 2.1.2 区间缩放法 2.1.3 标准化与归一化的区别 2.2 对定量特征二值化 2.3...

阅读(446)评论(0)赞 (1)

神经网络编程入门

27

xsmile 发布于 2017-03-26

  本文主要内容包括: (1) 介绍神经网络基本原理,(2) AForge.NET实现前向神经网络的方法,(3) Matlab实现前向神经网络的方法 。 第0节、引例  本文以Fisher的Iris数据集作为神经网络程序的测试数据集。Iris数据集可以在http://en.wik...

阅读(611)评论(0)赞 (1)

机器学习中的相似性度量

24

xsmile 发布于 2017-03-26

from http://www.cnblogs.com/heaad/archive/2011/03/08/1977733.html 在做分类时常常需要估算不同样本之间的相似性度量(Similarity Measurement),这时通常采用的方法就是计算样本间的“距离”(Dist...

阅读(866)评论(0)赞 (0)

文本分类与SVM

9

xsmile 发布于 2017-03-16

from http://blog.csdn.net/zhzhl202/article/details/8197109 之前做过一些文本挖掘的项目,比如网页分类、微博情感分析、用户评论挖掘,也曾经将libsvm进行包装,写了一个文本分类的开软软件Tmsvm。所以这里将之前做过一些关...

阅读(589)评论(0)赞 (0)

常见机器学习方法总览

48

xsmile 发布于 2017-03-08

原文链接:http://www.chinakdd.com/article-oyU85v018dQL0Iu.html 朴素贝叶斯 1. 如果给出的特征向量长度可能不同,这是需要归一化为通长度的向量(这里以文本分类为例),比如说是句子单词的话,则长度为整个词汇量的长度,对应位置是该单...

阅读(1068)评论(0)赞 (2)

使用sklearn优雅地进行数据挖掘

18

xsmile 发布于 2017-03-04

from http://www.cnblogs.com/jasonfreak/p/5448462.html 目录 1 使用sklearn进行数据挖掘 1.1 数据挖掘的步骤 1.2 数据初貌 1.3 关键技术 2 并行处理 2.1 整体并行处理 2.2 部分并行处理 3 流水线处...

阅读(793)评论(0)赞 (2)

一天搞懂深度学习

187

xsmile 发布于 2017-03-01

深度学习 ( Deep Learning ) 是机器学习 ( Machine Learning ) 中近年来备受重视的一支,深度学习根源于类神经网络 ( Artificial Neural Network ) 模型,但今日深度学习的技术和它的前身已截然不同,目前最好的语音识别和影...

阅读(737)评论(1)赞 (2)

淘宝吴雪军:自然语言处理技术在搜索和广告中的应用

1

xsmile 发布于 2017-02-25

本文为淘宝广告技术部广告算法负责人、淘宝网研究员吴雪军在8月3日CTO俱乐部沙龙演讲实录,全文如下: 我今天演讲的题目是自然语言处理技术在搜索和广告中的应用。搜索和广告是技术非常密集两个互联网产品,它们前端都非常简单,但后台系统架构极其复杂。 今天主要讲三个方面的内容:第一、主要...

阅读(529)评论(0)赞 (1)

Python 的十个自然语言处理工具

xsmile 发布于 2017-02-25

from http://www.kawabangga.com/posts/1264 1.NLTK NLTK 在使用 Python 处理自然语言的工具中处于领先的地位。它提供了 WordNet 这种方便处理词汇资源的接口,以及分类、分词、词干提取、标注、语法分析、语义推理等类库。 ...

阅读(758)评论(1)赞 (0)

SAS CTO告诉你统计建模、机器学习与人工智能的区别

2

xsmile 发布于 2017-02-22

关于统计建模、机器学习与人工智能之间的关系和区别,近来无论是在国内外像知乎一类的知识网站上,还是在业内业外爱好者的线下活动组织间,都引发了激烈讨论。今天,SAS首席技术官  Oliver Schabenberger 先生为我们带来了他的见解,希望能对各位小伙伴们有一些启发。 统计...

阅读(668)评论(0)赞 (0)

运用SAS文本分析,海量资料秒分析

3

xsmile 发布于 2017-02-22

我们常常会因为会议笔记内容过多难以归整而发愁?会因为论文众多却无暇浏览而苦恼?会因为短时间内处理巨大数据而绝望?面对这些困扰,SAS北京研发中心分析产品开发部总监高燕女士运用SAS文本分析,通过两个实验快速有效分析IALP大会论文。我们看看她是如何做到的? 不久前,我参加了在台湾...

阅读(545)评论(0)赞 (2)