常见的数据框缺失数据插补有3种方式: pandas 中简单粗暴的…
分类: 理论
你所应该知道的 A/B 测试 (A/B Test You Should Know)
范叶亮 / 2021-10-17 什么是 A/B 测试 A/B …
数据分析学习笔记——归因分析
1 什么是归因分析? 在复杂的数据时代,我们每天都会面临产生产生…
通过R语言实现基金Brinson归因分析
最近学习了Brinson模型,发现网上关于这方面的资料挺少,所以…
五个常见客户满意度测评模型
好长时间没写东西了,前段时间一直忙着做客户满意度提升相关的工作,…
学大数据应该怎么入门 — 大数据学习之路
前置知识 编程语言 至少应该掌握一门编程语言,计算机专业的同学大…
普华永道全息图解机器学习
普华永道三年前推出了一系列机器学习图解,无奈网上流传的图都不清晰…
一文带你了解DAX Studio
DAX在使用上可以分为两大类,一类以DAX计算为核心,另一类以D…
连续随机变量的熵
信息论中的熵对于离散的随机变量是比较直观的,也就是信息量的数学期…
手把手教你使用 Python 做 LDA 主题提取和可视化
前言 信息时代的高速发展让我们得以使用手机、电脑等设备轻松从网络…
使用gensim 框架 实现 LDA主题模型
0、原理 LDA文档主题生成模型,也称三层贝叶斯概率模型,包含词…
生存分析: 在 Python 中的实现
生存分析的统计方法可以回答以下商业问题: 一个特定的客户会在公司…
Python实战|利用生存分析预测用户流失周期
第一部分 1.数据基本情况探索 2.数据来源及预处理 3.数据相…
概率图模型(PGMs) – 贝叶斯网络(Bayes Nets)
概率图模型(Probabilistic Graphical Mo…
概率图模型之贝叶斯网络
在图的基础上表示概率分布的模型我们称之为概率图模型;而且在图中,…
用 PySpark ML 构建机器学习模型
Spark 是一种专门用于交互式查询、机器学习和实时工作负载的…
聚类算法概述(k-Means++/FCM/凝聚层次聚类/DBSCAN)
参考自初识聚类算法:K均值、凝聚层次聚类和DBSCAN。 聚类的…
深度学习必须掌握的13种概率分布
一. 概率分布概述 共轭意味着它有共轭分布的关系。 在贝叶斯概率…
数据分析思维:一文读懂漏斗分析
作为数据分析中最重要的一个分析思维,漏斗分析在业务流程拆解和问题…
最常见的统计学谬误
导读 在统计学中,有哪些常见的谬误? 在分组比较中都占优势的一方…