资讯

盘点互联网金融大数据公司十大模式:反欺诈、评分评级、数据银行……

xsmile 发布于 2017-03-01

大数据不只是玩概念,还要干实事。数据日渐成为各个平台的底层架构、核心基础设施。据鸣金数据研究院互联网金融大数据模式现有反欺诈、评级、征信、数据银行/数据平台、不良资产处置、资产证券化等十大模式! 1 反欺诈 反欺诈在国内是个刚需,尤其是企业端需要反欺诈服务去防止用户造假、盗刷等行...

阅读(620)评论(0)赞 (1)

决策树之ID3和C4.5

10

张龙祥 发布于 2017-02-23

一、决策树 一种树状分类结构模型,是一种通过对变量值拆分建立起来的分类规则,又利用树形图分割形成的概念路径的数据分析技术。 二、决策树的两个关键步骤 三、决策树的构建步骤 注: ⑴第一步中:先找出各个可以作为分类变量的自变量的所有可能的划分条件,再对每一个自变量比较各个划分下所得...

阅读(531)评论(0)赞 (0)

朴素贝叶斯算法的案例实现

15

张龙祥 发布于 2017-02-19

一、朴素贝叶斯分类的R函数介绍 1、朴素贝叶斯分类算法的实现函数 R中的e1071包中的naiveBayes()函数可以实现朴素贝叶斯算法,具体的函数格式如下: naiveBayes(x, y, laplace=0) 常用变量具体的参数解释如下: naiveBayes(formu...

阅读(624)评论(0)赞 (1)

朴素贝叶斯的理解

10

张龙祥 发布于 2017-02-16

一、统计学基础知识(虽然枯燥,但是硬着头皮也要看) 二、基于朴素贝叶斯定理的条件概率 三、朴素贝叶斯分类的工作流程 四、朴素贝叶斯分类中需要注意的问题 ⑴假设条件:每一个属性值在给定类上面的影响是独立于其他属性的,也就是说属性与属性之间是相互独立的,称之为“类条件独立性”。 ⑵如...

阅读(741)评论(0)赞 (0)

Logistic回归及其在Python中的一个实现

10

张龙祥 发布于 2016-09-25

一、回归分析的不足 我们大家对回归分析很清楚,但是有这样一类变量,它们的因变量不是连续型变量,而是分类变量。比如这件商品是买还是不买;某个病人是否已经痊愈。这种现象是经常出现的。 我们以这件商品买和不买来进行讨论。用“1”来表示“买”,用“0”来表示“不买”。在这里,我们记“买”...

阅读(752)评论(0)赞 (3)

支持向量机中的战斗机 — One class SVM

3

张龙祥 发布于 2016-07-21

  SVM 支持向量机(support vector machine),简称SVM,是一种基于监督的二类分类模型。 通俗的说,SVM是通过选取高维空间上的一个超平面(hyperplane)来进行数据分类,这个超平面即为分类平面,构成这个超平面的向量,即为支撑向量。SVM先已广泛应...

阅读(2481)评论(1)赞 (5)

PCA:必须知道的降维手段

11

张龙祥 发布于 2016-07-21

            (principal components analysis) 1.前期需要掌握的知识点及其相关课程: ⑴高等代数/线性代数:线性方程组、特征值和特征向量 ⑵统计学:方差分析等 2.主成分分析思想: 主成分分析是利用降维的思想,在损失较少信息的前提下,用几...

阅读(1863)评论(0)赞 (4)

2014年最佳的大数据,数据科学文章

xsmile 发布于 2015-05-22

KDNuggets分别总结了2014年14个阅读最多以及分享最多的文章。我们从中可以看到多个主题——深度学习,数据科学家职业,教育和薪酬,学习数据科学的工具比如R和Python以及大众投票的最受欢迎的数据科学和数据挖掘语言。 其中,阅读最多的文章超过10000次阅读,分享最多文章...

阅读(960)评论(0)赞 (0)