理论

征信业必将大有可为?从拒绝推断说起

6

xsmile 发布于 2017-05-24

作者:KPMG专业数据挖掘团队 从“拒绝推断”说起 如果你读过我们先前发布的《解读芝麻信用与FICO评分的差异》,一定已经对“信用评分”的工作方式有所了解啦。除了打开支付宝就可以看见的芝麻信用评分之外,目前,较为权威的第三方信用评分机构包括FICO,Vantage,Experia...

阅读(325)评论(0)赞 (0)

R语言之Apriori算法应用

3

xsmile 发布于 2017-05-14

from http://www.cnblogs.com/dm-cc/p/5737147.html 一. 概念 关联分析用于发现隐藏在大型数据集中的有意义的联系。所发现的联系可以用关联规则(association rule)或频繁项集的形式表示。 项集:在关联分析中,包含0个或多个...

阅读(279)评论(0)赞 (2)

信用卡评分模型(R语言)

18

xsmile 发布于 2017-05-09

from http://blog.csdn.net/csqazwsxedc/article/details/51225156 信用卡评分 2016年1月10日 一、数据准备 1、 问题的准备 •            目标:要完成一个评分卡,通过预测某人在未来两年内将会经历财务危...

阅读(864)评论(0)赞 (7)

偏最小二乘法介绍及应用

1

xsmile 发布于 2017-04-30

本文由一起大数据网整理,转载请保留原文链接。 为了更好的理解PLS,推荐大家先学习回归分析、典型相关分析和主成分分析相关知识内容(这些内容在SPSS视频教程里都有)。 第一部分:概念与诊断(来自百度百科) 偏最小二乘法,它通过最小化误差的平方和找到一组数据的最佳函数匹配。 用最简...

阅读(395)评论(0)赞 (3)

使用sklearn做单机特征工程

8

xsmile 发布于 2017-04-19

from http://www.cnblogs.com/jasonfreak/p/5448385.html 目录 1 特征工程是什么? 2 数据预处理 2.1 无量纲化 2.1.1 标准化 2.1.2 区间缩放法 2.1.3 标准化与归一化的区别 2.2 对定量特征二值化 2.3...

阅读(467)评论(0)赞 (1)

SAS聚类分析

3

xsmile 发布于 2017-04-12

from http://blog.163.com/zzz216@yeah/blog/static/16255468420121105146675/ 1 用CLUSTER过程和TREE过程进行谱系聚类 一、CLUSTER过程用法 CLUSTER过程的一般格式为: PROC CLUS...

阅读(407)评论(0)赞 (0)

SAS回归分析

2

xsmile 发布于 2017-04-12

from http://blog.163.com/zzz216@yeah/blog/static/16255468420121665447465/ 1.用SAS/INSIGHT进行曲线拟合    拟合回归直线,“analyse-fit”,选择相应的自变量和因变量,既可以自动拟合出...

阅读(538)评论(0)赞 (1)

SAS多变量分析-因子分析

4

xsmile 发布于 2017-04-11

from http://blog.163.com/zzz216@yeah/blog/static/16255468420121105745404/ FACTOR过程使用 SAS/STAT的FACTOR过程可以进行因子分析、分量分析和因子旋转。对因子模型可以使用正交旋转和斜交旋转,...

阅读(485)评论(0)赞 (1)

神经网络编程入门

27

xsmile 发布于 2017-03-26

  本文主要内容包括: (1) 介绍神经网络基本原理,(2) AForge.NET实现前向神经网络的方法,(3) Matlab实现前向神经网络的方法 。 第0节、引例  本文以Fisher的Iris数据集作为神经网络程序的测试数据集。Iris数据集可以在http://en.wik...

阅读(636)评论(0)赞 (1)

机器学习中的相似性度量

24

xsmile 发布于 2017-03-26

from http://www.cnblogs.com/heaad/archive/2011/03/08/1977733.html 在做分类时常常需要估算不同样本之间的相似性度量(Similarity Measurement),这时通常采用的方法就是计算样本间的“距离”(Dist...

阅读(883)评论(0)赞 (0)

文本分类与SVM

9

xsmile 发布于 2017-03-16

from http://blog.csdn.net/zhzhl202/article/details/8197109 之前做过一些文本挖掘的项目,比如网页分类、微博情感分析、用户评论挖掘,也曾经将libsvm进行包装,写了一个文本分类的开软软件Tmsvm。所以这里将之前做过一些关...

阅读(615)评论(0)赞 (0)

常见机器学习方法总览

48

xsmile 发布于 2017-03-08

原文链接:http://www.chinakdd.com/article-oyU85v018dQL0Iu.html 朴素贝叶斯 1. 如果给出的特征向量长度可能不同,这是需要归一化为通长度的向量(这里以文本分类为例),比如说是句子单词的话,则长度为整个词汇量的长度,对应位置是该单...

阅读(1089)评论(0)赞 (2)

数据可视化

24

xsmile 发布于 2017-03-08

from http://blog.sina.com.cn/s/blog_7ed6001f0102x1vh.html 1、数据可视化概述 1.1、数据可视化的作用     数据可视化是指将数据通过图表的方式传递出来,让用户能够快速、准确地理解信息所要表达的内容,从而提高沟通效率。数...

阅读(1179)评论(0)赞 (4)

使用sklearn优雅地进行数据挖掘

18

xsmile 发布于 2017-03-04

from http://www.cnblogs.com/jasonfreak/p/5448462.html 目录 1 使用sklearn进行数据挖掘 1.1 数据挖掘的步骤 1.2 数据初貌 1.3 关键技术 2 并行处理 2.1 整体并行处理 2.2 部分并行处理 3 流水线处...

阅读(821)评论(0)赞 (2)