数据挖掘

机器学习常见算法分类汇总

作者: 王萌  来自:http://www.ctocio.com/hotnews/15919.html 机器学习无疑是当前数据分析领域的一个热点内容。很多人在平时的工作中都或多或少会用到机器学习的算法。这里IT经理网为您总结一下常见的机器学...

【机器学习】确定最佳聚类数目的10种方法

from: https://www.cnblogs.com/think90/p/7133753.html 在聚类分析的时候确定最佳聚类数目是一个很重要的问题,比如kmeans函数就要你提供聚类数目这个参数,总不能两眼一抹黑乱填一个吧。之前也...

逻辑回归算法学习与思考

from http://blog.csdn.net/dongtingzhizi 本文是作者对于逻辑回归算法的学习和思考,主要介绍:逻辑回归的算法介绍、逻辑回归的数学原理、逻辑回归的实际应用、逻辑回归的总结以及网络安全场景预测,欢迎大家参考讨...

Random Forest入门

from https://www.zybuluo.com/hshustc/note/179319 随机森林(Random Forest)是一个包含多个决策树的分类器, 其输出的类别由个别树输出类别的众数而定。(相当于许多不同领域的专家对数据...

分类算法之朴素贝叶斯分类(Naive Bayesian classification)

作者 张洋 0、写在前面的话 我个人一直很喜欢算法一类的东西,在我看来算法是人类智慧的精华,其中蕴含着无与伦比的美感。而每次将学过的算法应用到实际中,并解决了实际问题后,那种快感更是我在其它地方体会不到的。 一直想写关于算法的博文,也曾写过...

数据挖掘之KNN分类

分类算法有很多,贝叶斯、决策树、支持向量积、KNN等,神经网络也可以用于分类。这篇文章主要介绍一下KNN分类算法。 1、介绍 KNN是k nearest neighbor 的简称,即k最邻近,就是找k个最近的实例投票决定新实例的类标。KNN...

ROC曲线

来自百度百科 受试者工作特征曲线 (receiver operating characteristic curve,简称ROC曲线),又称为感受性曲线(sensitivity curve)。得此名的原因在于曲线上各点反映着相同的感受性,它们...

一文了解机器学习知识点及其算法(附python代码)

来自 数据城堡 机器学习发展到现在,已经形成较为完善的知识体系,同时大量的数据科学家的研究成果也让现实问题的处理有了相对成熟的应对算法。 所以对于一般的机器学习来说,解决问题的方式变的非常简单:熟悉这些基本的算法,并且遇到实际的问题能够系统...

scikit-learn 逻辑回归类库使用小结

from http://www.cnblogs.com/pinard/p/6035872.html    之前在逻辑回归原理小结这篇文章中,对逻辑回归的原理做了小结。这里接着对scikit-learn中逻辑回归类库的我的使用经验做一个总结。...

Rattle :基于R的数据挖掘工具:简介和安装

from http://blog.csdn.net/u010022051/article/details/47660663 1.Rattle是什么 数据挖掘是当今时代的一门核心技术,提供了对大数据的描述,探索,模式的识别和预测。数据挖掘者们...

官方说明文档|手把手教你在R中Prophet

本使用说明教程主要翻译整理自 Prophet 的官方说明文档 教程中使用的数据集可在 Prophet 的 github 主页 中的 examples 文件夹 内下载得到。 Prophet 是 Facebook 推出的开源大规模预测工具,可以...

如何入门数据分析&数据挖掘?

from http://www.cnblogs.com/charlotte77/p/5340336.html 作者 Charlotte77 授权一起大数据网转发。 1.数据分析和数据挖掘联系和区别 联系:都是搞数据的 区别:数据分析偏统计,...

流形学习-高维数据的降维与可视化

转载请注明出处:http://blog.csdn.net/u012162613/article/details/45920827 1.流形学习的概念 流形学习方法(Manifold Learning),简称流形学习,自2000年在著名的科学...