理论

  • 你所应该知道的 A/B 测试 (A/B Test You Should Know)

    范叶亮 / 2021-10-17 什么是 A/B 测试 A/B 测试是一种随机测试,将两个不同的东西(即 A 和 B)进行假设比较。A/B 测试可以用来测试某一个变量两个不同版本的…

    2022年11月7日 0
  • 数据分析学习笔记——归因分析

    1 什么是归因分析? 在复杂的数据时代,我们每天都会面临产生产生的大量的数据以及用户复杂的消费行为路径,特别是在互联网广告行业,在广告投放的效果评估上,往往会产生一系列的问题: 哪…

    2022年11月7日 0
  • 通过R语言实现基金Brinson归因分析

    最近学习了Brinson模型,发现网上关于这方面的资料挺少,所以结合个人学习过程,总结一下如何通过R实现Brinson归因分析。 关于Brinson分析的原理不再说明,网上有一些资…

    2022年11月4日 0
  • 五个常见客户满意度测评模型

    好长时间没写东西了,前段时间一直忙着做客户满意度提升相关的工作,作为一个理论先行派,在开干之前,先了解了一下“别人家的”客户满意度评测模型,今天就把这份资料分享一下。 一、四分图模…

    2022年10月31日 0
  • 学大数据应该怎么入门 — 大数据学习之路

    前置知识 编程语言 至少应该掌握一门编程语言,计算机专业的同学大多学的第一门编程语言是 C 语言,然后再学 Java 语言,对于零基础的同学,可直接学习 Java 语言,至少应该把…

    2022年10月24日 0
  • 普华永道全息图解机器学习

    普华永道三年前推出了一系列机器学习图解,无奈网上流传的图都不清晰,自己从网上找到了清晰版,配合文字再整理下。 一、机器学习概览 什么是机器学习? 机器通过分析大量数据来进行学习。比…

    2022年10月24日 0
  • 一文带你了解DAX Studio

    DAX在使用上可以分为两大类,一类以DAX计算为核心,另一类以DAX查询为核心,本文主要介绍的就是DAX 查询。而DAX Studio,其主要就是用于DAX代码的编辑和查询。 下面…

    2022年9月28日 0
  • 连续随机变量的熵

    信息论中的熵对于离散的随机变量是比较直观的,也就是信息量的数学期望,具体来说,就是: (1)  但是对于连续的随机变量,熵的概念就要复杂得多,这篇文章来探讨一下。 现实世界中有很多…

    2022年9月22日 0
  • 手把手教你使用 Python 做 LDA 主题提取和可视化

    前言 信息时代的高速发展让我们得以使用手机、电脑等设备轻松从网络上获取信息。但是,这似乎也是一把双刃剑,我们在获取到众多信息的同时,又可能没有太多时间去一一阅读它们,以至于“收藏从…

    2022年9月22日 0
  • 使用gensim 框架 实现 LDA主题模型

    0、原理 LDA文档主题生成模型,也称三层贝叶斯概率模型,包含词、主题和文档三层结构。gensim流程如图所示: 整体过程就是:首先拿到文档集合,使用分词工具进行分词,得到词组序列…

    2022年9月20日 0
  • 生存分析: 在 Python 中的实现

    生存分析的统计方法可以回答以下商业问题: 一个特定的客户会在公司留存多长时间?换句话说,在多长时间之后,这个客户将会流失? 运行一年后,某台机器还能使用多久? 不同营销渠道的相对留…

    2022年9月17日 0
  • Python实战|利用生存分析预测用户流失周期

    第一部分 1.数据基本情况探索 2.数据来源及预处理 3.数据相关性探索 第二部分 1.Cox风险比例模型建模 2. Cox风险比例模型效果评估 3.Cox风险比例模型预测流失用户…

    2022年9月16日 0
  • 概率图模型(PGMs) – 贝叶斯网络(Bayes Nets)

    概率图模型(Probabilistic Graphical Models) – 贝叶斯网络(Bayes Nets) 你可以大概形象的理解概率图模型的2种分类: 1.贝叶…

    2022年9月16日 0
  • 概率图模型之贝叶斯网络

    在图的基础上表示概率分布的模型我们称之为概率图模型;而且在图中,我们用结点来表示随机变量,结点之间的边表示结点的概率依赖关系。本文我们介绍概率图模型中一个最基础的模型 &#8212…

    2022年9月15日 0
  • ​用 PySpark ML 构建机器学习模型

    ​Spark 是一种专门用于交互式查询、机器学习和实时工作负载的开源框架,而 PySpark 是 Python 使用 Spark 的库。 PySpark 是一种用于大规模执行探索性…

    2022年9月7日 0
  • 聚类算法概述(k-Means++/FCM/凝聚层次聚类/DBSCAN)

    参考自初识聚类算法:K均值、凝聚层次聚类和DBSCAN。 聚类的目的 将数据划分为若干个簇,簇内相似性大,簇间相似性小,聚类效果好。用于从数据中提取信息和规律。 聚类的概念 层次与…

    2022年9月5日 0
  • 深度学习必须掌握的13种概率分布

    一. 概率分布概述 共轭意味着它有共轭分布的关系。 在贝叶斯概率论中,如果后验分布 p(θx)与先验概率分布 p(θ)在同一概率分布族中,则先验和后验称为共轭分布,先验称为似然函数…

    2022年8月27日 0
  • 数据分析思维:一文读懂漏斗分析

    作为数据分析中最重要的一个分析思维,漏斗分析在业务流程拆解和问题环节定位上具有非常重要的作用。当我们无法确定问题发生在哪个环节时,一般会通过将业务流程进行拆解,比较各个环节之间的转…

    2022年8月19日 0
  • 最常见的统计学谬误

    导读 在统计学中,有哪些常见的谬误? 在分组比较中都占优势的一方,为什么在总评中反而成为失势的一方? 小红热爱音乐,她更可能是琴师还是会计? 乳房影像检查显示自己患上乳癌,确诊和误…

    2022年8月17日 0
  • 淘宝用户行为数据分析详解

    随着移动互联网多年的快速发展,移动互联网已进入下半场 ,不再依靠用户红利来经营,发展业务,告别粗糙的/高成本企业发展的方式,开始转而精细化管理,结合市场、渠道、用户行为等数据分析,…

    2022年8月16日 0

联系我们

在线咨询:点击这里给我发消息

邮件:23683716@qq.com

跳至工具栏