机器学习
-
[Algorithm] 局部敏感哈希算法(Locality Sensitive Hashing)
阅读目录 1. 基本思想 2. 局部敏感哈希LSH 3. 文档相似度计算 局部敏感哈希(Locality Sensitive Hashing,LSH)算法是我在前一段时间找工作时…
-
CBC数据分析—Logit模型
作者 刘强、曾步凡 在这个系列文章里,我们曾介绍过使用简单的回归来分析联合分析的数据。但是随着产品的复杂程度的增加,这种方式就不太适用了。一方面是当产品的属性和水平较多时,每个消…
-
集成学习之AdaBoost
from https://blog.csdn.net/sunbobosun56801/article/details/77891470 当做出重要决定时,大家可能会考虑吸取多个专家…
-
数据挖掘领域十大经典算法之—SVM算法(超详细附代码)
from https://blog.csdn.net/fuqiuai/article/details/79483057 简介 SVM(Support Vector Machine)…
-
数据挖掘领域十大经典算法之—AdaBoost算法(超详细附代码)
from https://blog.csdn.net/fuqiuai/article/details/79482487 简介 Adaboost算法是一种提升方法,将多个弱分类器,组…
-
数据挖掘领域十大经典算法之—K-Means算法(超详细附代码)
from https://blog.csdn.net/fuqiuai/article/details/79458331 简介 又叫K-均值算法,是非监督学习中的聚类算法。 基本思想…
-
数据挖掘领域十大经典算法之—K-邻近算法/kNN(超详细附代码)
from https://blog.csdn.net/fuqiuai/article/details/79458648 简介 又叫K-邻近算法,是监督学习中的一种分类算法。目的是根…
-
数据挖掘领域十大经典算法之—C4.5算法(超详细附代码)
from https://blog.csdn.net/fuqiuai/article/details/79456971 简介 C4.5是决策树算法的一种。决策树算法作为一种分类算法…
-
使用开源软件快速搭建数据分析平台
来自 https://my.oschina.net/taogang/blog/3039572 架构图: 为了构建一个最简单的开箱即用的数据分析平台,我使用了如下的技术栈: 服务器端…
-
聚类分析 – K-means – Python代码实现
算法简介 K-means算法是很典型的基于距离的聚类算法,采用距离作为相似性的评价指标,即认为两个对象的距离越近,其相似度就越大。该算法认为簇是由距离靠近的对象组成的,因此把得到紧…
-
降维方法 -简直太全!- 附Python代码Random Forest、Factor Analysis、corr、PCA、ICA、IOSMAP
版权声明:本文为博主原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接和本声明。 本文链接:https://blog.csdn.net/weixin_406…
-
交互式数据分析工具 Scriptis
Scriptis是一款支持在线写SQL、Pyspark、HiveQL等脚本,提交给Linkis执行的数据分析Web工具,且支持UDF、函数、资源管控和智能诊断等企业级特性。 核心特…
-
Tableau集成Python机器学习实践(下)
from https://zhuanlan.zhihu.com/p/30221630 Tableau报表创建 数据准备 我们还是引用iris数据集的csv数据格式作为tableau…
-
Tableau集成Python机器学习实践(中)
from https://zhuanlan.zhihu.com/p/30221526 基于Iris数据集的机器学习实践 Iris数据集简介 iris数据集由Fisher, 1936…
-
Tableau集成Python机器学习实践(上)
from https://zhuanlan.zhihu.com/p/30221355 导言 机器学习是目前炙手可热的一门交叉学科,致力于研究通过计算的手段,利用经验来改善系统自身的…
-
机器学习实战——SVD(奇异值分解)
版权声明:本文为博主原创文章,遵循 CC 4.0 by-sa 版权协议,转载请附上原文出处链接和本声明。 原文链接:https://blog.csdn.net/qq_3652383…
-
facebook开源的prophet时间序列预测工具—识别多种周期性、趋势性(线性,logistic)、节假日效应,以及部分异常值
from https://www.cnblogs.com/bonelee/p/9577432.html 简单使用 代码如下 这是官网的quickstart的内容,csv文件也可以下…
-
GBDT+LR算法进行特征扩增
转自 http://blog.csdn.net/TwT520Ly https://blog.csdn.net/TwT520Ly/article/details/79769705 参…
-
LightGBM——提升机器算法(图解+理论+安装方法+python代码)
from https://blog.csdn.net/huacha__/article/details/81057150#%E7%94%A8python%E5%AE%9E%E7%8…
-
sklearn入门教程:分类、聚类、回归和降维
作者 zhouchen sklearn中的sk代表着scikit,就可以知道这是一个用于科研的工具包了,那么这个科研工具包种都包含了哪些内容呢? 下面这个图描述了sk-learn所…