数据挖掘-一起大数据

数据挖掘

R语言 | 关联规则

from https://blog.csdn.net/gjwang1983/article/details/45015203 1.概念 1.1 引论 关联规则(AssociationRules)是无监督的机器学习方法,用于知识发现,而非预测...

【一网打尽】机器学习梯度下降优化算法

来自 https://blog.csdn.net/u010352603/article/details/80590186 1. 梯度下降 梯度的方向是上升的方向,所以我们是沿着梯度的反方向,每一次根据学习率来决定走的步长,争取到达谷底。 2...

随机森林和GBDT的区别

  一,随机森林 随机森林是一个用随机方式建立的,包含多个决策树的集成分类器。其输出的类别由各个树投票而定(如果是回归树则取平均)。假设样本总数为n,每个样本的特征数为a,则随机森林的生成过程如下: 从原始样本中采用有放回抽样的方...

教你如何最快入门用户画像

转自 http://www.cnblogs.com/ModifyRong/p/7800318.html 大家可能经常会听到用户画像这个词,但是具体在做的时候又会觉得无从下手,或者认为只是常规的标签统计,这往往是一个误区。本人在某互联网企业从...

scikit-learn 梯度提升树(GBDT)调参小结

转自 http://www.cnblogs.com/pinard/p/6143927.html 作者邮箱liujianping-ok@163.com 在梯度提升树(GBDT)原理小结中,我们对GBDT的原理做了总结,本文我们就从scikit...

SCIKIT-LEARN与GBDT使用案例

安装 SCIKIT-LEARN是一个基于python/numpy/scipy的机器学习库 windows下最简单的安装方式是使用winpython进行安装 WinPython地址 GBDT使用 这段代码展示了一个简单的GBDT调用过程 数据...

kaggle 欺诈信用卡预测——Smote+LR

from:https://zhuanlan.zhihu.com/p/30461746 本项目需解决的问题 本项目通过利用信用卡的历史交易数据,进行机器学习,构建信用卡反欺诈预测模型,提前发现客户信用卡被盗刷的事件。 建模思路 项目背景 数据...

协同过滤推荐算法的原理及实现

原文地址:http://blog.csdn.net/huagong_adu/article/details/7362908 一、协同过滤算法的原理及实现 二、基于物品的协同过滤算法详解 一、协同过滤算法的原理及实现 协同过滤推荐算法是诞生最...

余弦计算相似度度量

from https://blog.csdn.net/u012160689/article/details/15341303 余弦计算相似度度量 相似度度量(Similarity),即计算个体间的相似程度,相似度度量的值越小,说明个体间相似...

大白话讲解word2vec到底在做些什么

from https://blog.csdn.net/mylove0414/article/details/61616617 词向量 word2vec也叫word embeddings,中文名“词向量”,作用就是将自然语言中的字词转为计算机...

机器学习之降维

from https://blog.csdn.net/tdj8866/article/details/78539024 本周关于降维的学习主要分为五类:PCA、LDA、LLE、tSNE、ISOMAP 来进行学习 首先自己的任务是:tSNE的...

【机器学习笔记】自组织映射网络(SOM)

作者:@渉风 本文为作者原创,转载请注明出处:http://www.cnblogs.com/surfzjy/p/7944454.html 什么是自组织映射? 一个特别有趣的无监督系统是基于竞争性学习,其中输出神经元之间竞争激活,结果是在任意...

Windows7 下安装 tersorflow

from http://www.cnblogs.com/lovephysics/p/7220938.html 最近看起深度学习的一些知识,想要学习一个框架。在网上看了别人对这些框架的评比后,决定学习 tersorflow。之前一直以为 te...

机器学习中防止过拟合方法

from https://www.cnblogs.com/lovephysics/p/7220703.html 过拟合 在进行数据挖掘或者机器学习模型建立的时候,因为在统计学习中,假设数据满足独立同分布,即当前已产生的数据可以对未来的数据进...

深度学习防止过拟合的方法

from http://blog.csdn.net/taoyanqi8932/article/details/71101699 过拟合即在训练误差很小,而泛化误差很大,因为模型可能过于的复杂,使其”记住”了训练样本,然而其泛化误差却很高,在...

机器学习常用算法总结(笔记)

from https://www.cnblogs.com/zlslch/p/6970619.html 机器学习无疑是当前数据分析领域的一个热点内容。很多人在平时的工作中都或多或少会用到机器学习的算法。本文总结一下常见的机器学习算法,以供参考...

机器学习常见算法分类汇总

作者: 王萌  来自:http://www.ctocio.com/hotnews/15919.html 机器学习无疑是当前数据分析领域的一个热点内容。很多人在平时的工作中都或多或少会用到机器学习的算法。这里IT经理网为您总结一下常见的机器学...