一起大数据

最新发布 第4页

数据挖掘

SMOTE

from http://blog.sina.com.cn/s/blog_7103b28a0102wpqm.html 这是应对非均衡训练数据集的一种方法。 针对非均衡训练数据,可以采用的方法包括:1)对多数类进行欠采样,去除一些样本使样本数目...

数据挖掘

随机森林进行特征重要性度量的详细说明

来自 宋兵乙的博客 特征选择方法中,有一种方法是利用随机森林,进行特征的重要性度量,选择重要性较高的特征。下面对如何计算重要性进行说明。 1 特征重要性​度量 计算某个特征X的重要性时,具体步骤如下: 1)对每一颗决策树,选择相应的袋外数据...

数据挖掘

Adaboost 算法

from http://blog.csdn.net/aliceyangxi1987/article/details/72969566 本文结构: 什么是集成学习? 为什么集成的效果就会好于单个学习器? 如何生成个体学习器? 什么是 Boos...

数据挖掘

Kaggle 神器 xgboost

from http://blog.csdn.net/aliceyangxi1987/article/details/72969146 在 Kaggle 的很多比赛中,我们可以看到很多 winner 喜欢用 xgboost,而且获得非常好的表...

数据可视化

可视化图表初阶

  简述 数据可视化-通过图表形式展现数据,帮助用户快速、准确理解信息。准确、快速是可视化的关键,好的可视化会“讲故事”,能向我们揭示数据背后的规律。对于可视化,有一个常见误区:分析师追求过于复杂的图表,反而使得业务人员难以理解。...

大数据

SQL for ElasticSearch—Crate.io简介

from http://lxw1234.com/archives/2017/01/828.htm 再次调研这个东西,是为了满足下面的需求: 一张拥有50+字段的表,记录数大概5亿-10亿;需要对每个字段进行模糊搜索,并要求即时响应结果;需要...

R

在R语言中进行局部多项式回归拟合(LOESS)

原文  http://xccds1977.blogspot.com/2011/12/rloess.html 局部多项式回归拟合是对两维散点图进行平滑的常用方法,它结合了传统线性回归的简洁性和非线性回归的灵活性。当要估计某个响应变量值时,先从...

动态

数据分析招聘(06.21)

小编建议: 求职者请把简历发布到http://www.datathinking.com,需要协助宣传的,请准备好个人介绍和求职意向,附带简历链接一起发给小编,小编会帮忙咨询下圈内朋友. 招聘者可以直接把整理好的职位,包括公司介绍,薪资范围和...

动态

嘉道信息招聘大数据人才(长期招募实习生)

上海嘉道信息技术有限公司(TIMER INFO),“应用大数据系统”专家 关键词:大数据、垂直搜索、数字营销、机器学习、文本挖据、自然语言处理、知识图谱 核心能力:信息技术、市场服务、研究咨询、数据服务 主要产品:数字营销系列、舆情监测系列...

Python

Sklearn 快速入门

from http://blog.csdn.net/aliceyangxi1987/article/details/71079505 学习资料:大家可以去莫烦的学习网站学到更多的知识。 本文结构: Sklearn 简介 选择模型流程 应用模...

Python

用scikit-learn和pandas学习线性回归

from http://www.cnblogs.com/pinard/p/6016029.html by 刘建平Pinard 十年码农,对数学统计学,数据挖掘,机器学习,大数据平台,大数据平台应用开发,大数据可视化感兴趣。 对于想深入了解线...

动态

数据分析招聘(06.15)

小编建议: 求职者请把简历发布到http://www.datathinking.com,需要协助宣传的,请准备好个人介绍和求职意向,附带简历链接一起发给小编,小编会帮忙咨询下圈内朋友. 招聘者可以直接把整理好的职位,包括公司介绍,薪资范围和...

数据挖掘

交叉验证(Cross Validation)原理小结

作者 刘建平Pinard 原文 http://www.cnblogs.com/pinard/p/5992719.html 交叉验证是在机器学习建立模型和验证模型参数时常用的办法。交叉验证,顾名思义,就是重复的使用数据,把得到的样本数据进行切...

数据挖掘

k-近邻算法

作者:王哲 from http://www.cnblogs.com/qwertWZ/p/4582096.html 转载请在显著位置注明作者及出处 目录 1. k-近邻算法概述 2. 示例:使用k-近邻算法改进约会网站的配对效果 3. 示例:...

数据挖掘

决策树

作者:王哲 from http://www.cnblogs.com/qwertWZ/p/4960755.html 转载请在显著位置注明作者及出处 目录 1. 决策树的构造 2. 测试和存储分类器 3. 示例:使用决策树预测隐形眼镜类型 系列...