标签:数据挖掘

R

Rattle :基于R的数据挖掘工具:简介和安装

from http://blog.csdn.net/u010022051/article/details/47660663 1.Rattle是什么 数据挖掘是当今时代的一门核心技术,提供了对大数据的描述,探索,模式的识别和预测。数据挖掘者们...

R

官方说明文档|手把手教你在R中Prophet

本使用说明教程主要翻译整理自 Prophet 的官方说明文档 教程中使用的数据集可在 Prophet 的 github 主页 中的 examples 文件夹 内下载得到。 Prophet 是 Facebook 推出的开源大规模预测工具,可以...

数据分析

如何入门数据分析&数据挖掘?

from http://www.cnblogs.com/charlotte77/p/5340336.html 作者 Charlotte77 授权一起大数据网转发。 1.数据分析和数据挖掘联系和区别 联系:都是搞数据的 区别:数据分析偏统计,...

Python

生成对抗网络(GAN)之MNIST数据生成

本文原作者天雨粟,原文载于作者的知乎专栏——机器不学习,一起大数据网经授权发布。 前言 GAN从2014年诞生以来发展的是相当火热,比较著名的GAN的应用有Pix2Pix、CycleGAN等。本篇文章主要是让初学者通过代码了解GAN的结构和...

数据挖掘

SMOTE

from http://blog.sina.com.cn/s/blog_7103b28a0102wpqm.html 这是应对非均衡训练数据集的一种方法。 针对非均衡训练数据,可以采用的方法包括:1)对多数类进行欠采样,去除一些样本使样本数目...

数据挖掘

随机森林进行特征重要性度量的详细说明

来自 宋兵乙的博客 特征选择方法中,有一种方法是利用随机森林,进行特征的重要性度量,选择重要性较高的特征。下面对如何计算重要性进行说明。 1 特征重要性​度量 计算某个特征X的重要性时,具体步骤如下: 1)对每一颗决策树,选择相应的袋外数据...

数据挖掘

Adaboost 算法

from http://blog.csdn.net/aliceyangxi1987/article/details/72969566 本文结构: 什么是集成学习? 为什么集成的效果就会好于单个学习器? 如何生成个体学习器? 什么是 Boos...

数据挖掘

Kaggle 神器 xgboost

from http://blog.csdn.net/aliceyangxi1987/article/details/72969146 在 Kaggle 的很多比赛中,我们可以看到很多 winner 喜欢用 xgboost,而且获得非常好的表...

Python

Sklearn 快速入门

from http://blog.csdn.net/aliceyangxi1987/article/details/71079505 学习资料:大家可以去莫烦的学习网站学到更多的知识。 本文结构: Sklearn 简介 选择模型流程 应用模...

Python

用scikit-learn和pandas学习线性回归

from http://www.cnblogs.com/pinard/p/6016029.html by 刘建平Pinard 十年码农,对数学统计学,数据挖掘,机器学习,大数据平台,大数据平台应用开发,大数据可视化感兴趣。 对于想深入了解线...

数据挖掘

交叉验证(Cross Validation)原理小结

作者 刘建平Pinard 原文 http://www.cnblogs.com/pinard/p/5992719.html 交叉验证是在机器学习建立模型和验证模型参数时常用的办法。交叉验证,顾名思义,就是重复的使用数据,把得到的样本数据进行切...

数据挖掘

k-近邻算法

作者:王哲 from http://www.cnblogs.com/qwertWZ/p/4582096.html 转载请在显著位置注明作者及出处 目录 1. k-近邻算法概述 2. 示例:使用k-近邻算法改进约会网站的配对效果 3. 示例:...

数据挖掘

决策树

作者:王哲 from http://www.cnblogs.com/qwertWZ/p/4960755.html 转载请在显著位置注明作者及出处 目录 1. 决策树的构造 2. 测试和存储分类器 3. 示例:使用决策树预测隐形眼镜类型 系列...