数据挖掘

Windows7 下安装 tersorflow

from http://www.cnblogs.com/lovephysics/p/7220938.html 最近看起深度学习的一些知识,想要学习一个框架。在网上看了别人对这些框架的评比后,决定学习 tersorflow。之前一直以为 te...

机器学习中防止过拟合方法

from https://www.cnblogs.com/lovephysics/p/7220703.html 过拟合 在进行数据挖掘或者机器学习模型建立的时候,因为在统计学习中,假设数据满足独立同分布,即当前已产生的数据可以对未来的数据进...

深度学习防止过拟合的方法

from http://blog.csdn.net/taoyanqi8932/article/details/71101699 过拟合即在训练误差很小,而泛化误差很大,因为模型可能过于的复杂,使其”记住”了训练样本,然而其泛化误差却很高,在...

机器学习常用算法总结(笔记)

from https://www.cnblogs.com/zlslch/p/6970619.html 机器学习无疑是当前数据分析领域的一个热点内容。很多人在平时的工作中都或多或少会用到机器学习的算法。本文总结一下常见的机器学习算法,以供参考...

机器学习常见算法分类汇总

作者: 王萌  来自:http://www.ctocio.com/hotnews/15919.html 机器学习无疑是当前数据分析领域的一个热点内容。很多人在平时的工作中都或多或少会用到机器学习的算法。这里IT经理网为您总结一下常见的机器学...

【机器学习】确定最佳聚类数目的10种方法

from: https://www.cnblogs.com/think90/p/7133753.html 在聚类分析的时候确定最佳聚类数目是一个很重要的问题,比如kmeans函数就要你提供聚类数目这个参数,总不能两眼一抹黑乱填一个吧。之前也...

逻辑回归算法学习与思考

from http://blog.csdn.net/dongtingzhizi 本文是作者对于逻辑回归算法的学习和思考,主要介绍:逻辑回归的算法介绍、逻辑回归的数学原理、逻辑回归的实际应用、逻辑回归的总结以及网络安全场景预测,欢迎大家参考讨...

Random Forest入门

from https://www.zybuluo.com/hshustc/note/179319 随机森林(Random Forest)是一个包含多个决策树的分类器, 其输出的类别由个别树输出类别的众数而定。(相当于许多不同领域的专家对数据...

分类算法之朴素贝叶斯分类(Naive Bayesian classification)

作者 张洋 0、写在前面的话 我个人一直很喜欢算法一类的东西,在我看来算法是人类智慧的精华,其中蕴含着无与伦比的美感。而每次将学过的算法应用到实际中,并解决了实际问题后,那种快感更是我在其它地方体会不到的。 一直想写关于算法的博文,也曾写过...

数据挖掘之KNN分类

分类算法有很多,贝叶斯、决策树、支持向量积、KNN等,神经网络也可以用于分类。这篇文章主要介绍一下KNN分类算法。 1、介绍 KNN是k nearest neighbor 的简称,即k最邻近,就是找k个最近的实例投票决定新实例的类标。KNN...

ROC曲线

来自百度百科 受试者工作特征曲线 (receiver operating characteristic curve,简称ROC曲线),又称为感受性曲线(sensitivity curve)。得此名的原因在于曲线上各点反映着相同的感受性,它们...

一文了解机器学习知识点及其算法(附python代码)

来自 数据城堡 机器学习发展到现在,已经形成较为完善的知识体系,同时大量的数据科学家的研究成果也让现实问题的处理有了相对成熟的应对算法。 所以对于一般的机器学习来说,解决问题的方式变的非常简单:熟悉这些基本的算法,并且遇到实际的问题能够系统...

scikit-learn 逻辑回归类库使用小结

from http://www.cnblogs.com/pinard/p/6035872.html    之前在逻辑回归原理小结这篇文章中,对逻辑回归的原理做了小结。这里接着对scikit-learn中逻辑回归类库的我的使用经验做一个总结。...

Rattle :基于R的数据挖掘工具:简介和安装

from http://blog.csdn.net/u010022051/article/details/47660663 1.Rattle是什么 数据挖掘是当今时代的一门核心技术,提供了对大数据的描述,探索,模式的识别和预测。数据挖掘者们...