一起大数据

最新发布 第4页

R

在R语言中进行局部多项式回归拟合(LOESS)

原文  http://xccds1977.blogspot.com/2011/12/rloess.html 局部多项式回归拟合是对两维散点图进行平滑的常用方法,它结合了传统线性回归的简洁性和非线性回归的灵活性。当要估计某个响应变量值时,先从...

动态

数据分析招聘(06.21)

小编建议: 求职者请把简历发布到http://www.datathinking.com,需要协助宣传的,请准备好个人介绍和求职意向,附带简历链接一起发给小编,小编会帮忙咨询下圈内朋友. 招聘者可以直接把整理好的职位,包括公司介绍,薪资范围和...

动态

嘉道信息招聘大数据人才(长期招募实习生)

上海嘉道信息技术有限公司(TIMER INFO),“应用大数据系统”专家 关键词:大数据、垂直搜索、数字营销、机器学习、文本挖据、自然语言处理、知识图谱 核心能力:信息技术、市场服务、研究咨询、数据服务 主要产品:数字营销系列、舆情监测系列...

Python

Sklearn 快速入门

from http://blog.csdn.net/aliceyangxi1987/article/details/71079505 学习资料:大家可以去莫烦的学习网站学到更多的知识。 本文结构: Sklearn 简介 选择模型流程 应用模...

Python

用scikit-learn和pandas学习线性回归

from http://www.cnblogs.com/pinard/p/6016029.html by 刘建平Pinard 十年码农,对数学统计学,数据挖掘,机器学习,大数据平台,大数据平台应用开发,大数据可视化感兴趣。 对于想深入了解线...

动态

数据分析招聘(06.15)

小编建议: 求职者请把简历发布到http://www.datathinking.com,需要协助宣传的,请准备好个人介绍和求职意向,附带简历链接一起发给小编,小编会帮忙咨询下圈内朋友. 招聘者可以直接把整理好的职位,包括公司介绍,薪资范围和...

数据挖掘

交叉验证(Cross Validation)原理小结

作者 刘建平Pinard 原文 http://www.cnblogs.com/pinard/p/5992719.html 交叉验证是在机器学习建立模型和验证模型参数时常用的办法。交叉验证,顾名思义,就是重复的使用数据,把得到的样本数据进行切...

数据挖掘

k-近邻算法

作者:王哲 from http://www.cnblogs.com/qwertWZ/p/4582096.html 转载请在显著位置注明作者及出处 目录 1. k-近邻算法概述 2. 示例:使用k-近邻算法改进约会网站的配对效果 3. 示例:...

数据挖掘

决策树

作者:王哲 from http://www.cnblogs.com/qwertWZ/p/4960755.html 转载请在显著位置注明作者及出处 目录 1. 决策树的构造 2. 测试和存储分类器 3. 示例:使用决策树预测隐形眼镜类型 系列...

数据挖掘

关联规则评价

      前面我们讨论的关联规则都是用支持度和自信度来评价的,如果一个规则的自信度高,我们就说它是一条强规则,但是自信度和支持度有时候并不能度量规则的实际意义和业务关注的兴趣点。 一个误导我们的强规则 看这样一个例子,我们分析一个购物篮数...

数据挖掘

数据挖掘之KNN分类

from http://www.cnblogs.com/fengfenggirl/archive/2013/05/27/knn.html 分类算法有很多,贝叶斯、决策树、支持向量积、KNN等,神经网络也可以用于分类。这篇文章主要介绍一下KN...

数据挖掘

异常检测算法–Isolation Forest

  南大周志华老师在2010年提出一个异常检测算法Isolation Forest,在工业界很实用,算法效果好,时间效率高,能有效处理高维数据和海量数据,这里对这个算法进行简要总结。 iTree 提到森林,自然少不了树,毕竟森林都是由树构成...

数据挖掘

Scorecard 评分卡模型

from http://blog.csdn.net/textboy/article/details/46975985 公式 woe=ln(odds),beita为回归系数,altha为截距,n为变量个数,offset为偏移量(视风险偏好而定...

数据挖掘

征信业必将大有可为?从拒绝推断说起

作者:KPMG专业数据挖掘团队 从“拒绝推断”说起 如果你读过我们先前发布的《解读芝麻信用与FICO评分的差异》,一定已经对“信用评分”的工作方式有所了解啦。除了打开支付宝就可以看见的芝麻信用评分之外,目前,较为权威的第三方信用评分机构包括...

R

R语言之Apriori算法应用

from http://www.cnblogs.com/dm-cc/p/5737147.html 一. 概念 关联分析用于发现隐藏在大型数据集中的有意义的联系。所发现的联系可以用关联规则(association rule)或频繁项集的形式表...

R

信用卡评分模型(R语言)

from http://blog.csdn.net/csqazwsxedc/article/details/51225156 信用卡评分 2016年1月10日 一、数据准备 1、 问题的准备 •            目标:要完成一个评分卡...