理论

  • Python推荐系统库:Surprise

    Surprise简介 Surprise(Simple Python Recommendation System Engine)是一款推荐系统库,是scikit系列中的一个。surp…

    4天前 0
  • 动手实现基于协同过滤的电影推荐系统

    作者: 负雪明烛  http://fuxuemingzhu.cn 项亮的《推荐系统实践》是一本面向推荐系统初学者的好书。这本书中间花了不少的篇幅去介绍了推荐系统中很重要的一个算法:…

    6天前 0
  • 从零开始,构建数据化运营体系

    数据化运营是一个近年来兴起的概念,它在运营的基础上,提出了以数据驱动决策的口号。 在了解数据化运营前,运营们有没有过如下的问题: 不同渠道,效果究竟是好是坏? 活跃数下降了,到底是…

    6天前 0
  • 如何正确拆分数据集?常见的三种方法总结

    将数据集分解为训练集,可以帮助我们了解模型,这对于模型如何推广到新的看不见数据非常重要。 如果模型过度拟合可能无法很好地概括新的看不见的数据。因此也无法做出良好的预测。 拥有适当的…

    2022年6月20日 0
  • 【面试套路】如何回答商业分析师Case Interview

    大家好,我是Minnie。在商业分析师(Business Analyst,简称BA)这个行业我干了不少年,认识了不少相似背景的同行,也认识了许多不同背景的同学。 米妮 Linked…

    2022年6月18日 0
  • 【商业分析】为产品找一个完美指标

    本文约1200字,阅读时间3分钟。本文转载自“米妮老师”公众号文章。欢迎转载,请注明出处。 引用某管理学大师的名言:如果你不能衡量它,那么你就不能有效增长它。 商业分析师在面试中经…

    2022年6月18日 0
  • 数据分析之AB TESTING实战(附PYTHON代码)

    目录 1、增长黑客 1)前言 2)运用分析指标框架,驱动互联网产品和运营 3)增长黑客大致分为如下几个步骤 2、AB testing介绍 1)AB testing对比方案图示展示 …

    2022年6月18日 0
  • 机器学习建模工具PyCaret详讲

    机器学习建模工具 PYCARET 1 PyCaret 1.0.0简介 2 PyCaret入门 3 获取数据 4 搭建环境 4.1 预处理介绍 4.2 采样与拆分 4.2.1 训练/…

    2022年6月18日 0
  • ​数据分析必备的统计学知识大梳理!

    我经常在文章中讲,做数据分析离不开统计学知识,它为我们的数据分析提供理论基础,然而很多数据分析师在学习统计学知识时感到头疼,看了很多统计学的书籍,里面讲了很多复杂的数学公式和推导,…

    2022年6月17日 0
  • 聊聊样本采样技术

    作者 大可 华东理工大学 计算机应用技术博士 本人在腾讯/微信从事推荐系统相关工作,会将平时遇到的业务问题和相应的解决方案总结成公众号文章,感兴趣的可以关注本人公众号:泛函的范 在…

    2022年6月16日 0
  • 功能强大的python包(五):sklearn

    1. sklearn简介 sklearn是基于python语言的机器学习工具包,是目前做机器学习项目当之无愧的第一工具。 sklearn自带了大量的数据集,可供我们练习各种机器学习…

    2022年6月16日 0
  • 功能强大的python包(四):OpenCV

    1. OpenCV简介 OpenCV是一个基于BSD许可(开源)发行的跨平台计算机视觉和机器学习软件库,可以运行在Linux、Windows、Android和Mac OS操作系统上…

    2022年6月16日 0
  • 推荐系统之SVD:奇异值分解

    概述 奇异值分解 (Singular Value Decomposition),是一种矩阵分解技术,经常用于机器学习降维处理。它通过将空间维度从 N 维减少到 K 维(其中 K&l…

    2022年6月16日 0
  • 一文读懂推荐系统负采样

    作者简介:潘星宇,中国人民大学信息学院硕士一年级在读,研究方向为推荐系统。 引言:推荐系统负采样作为推荐模型训练的重要一环,对模型的训练效果有着重要影响,也是推荐系统领域的一个重要…

    2022年6月15日 0
  • 热度排行榜:时间衰减模型之牛顿冷却定律

    对于新业务,通常由于样本有限或资源有限,无法构建复杂的模型。这个阶段最好的解决办法就是基于先前的经验或对有限样本进行数据分析提出一些简单的冷启动策略。 热门排行榜是最常见的冷启动策…

    2022年6月15日 0
  • 深入理解KS

    一、概述 KS(Kolmogorov-Smirnov)评价指标,通过衡量好坏样本累计分布之间的差值,来评估模型的风险区分能力。 KS、AUC、PR曲线对比: 1)ks和AUC一样,…

    2022年6月14日 0
  • 推荐算法之Thompson(汤普森)采样

    如果想理解汤普森采样算法,就必须先熟悉了解贝塔分布。 一、Beta(贝塔)分布 Beta分布是一个定义在[0,1]区间上的连续概率分布族,它有两个正值参数,称为形状参数,一般用α和…

    2022年6月14日 0
  • 看完后,别再说自己不懂用户画像了

    用户画像是一个挺新颖的词,最初它是大数据行业言必及之的时髦概念。现在我们谈及用户画像,它也是和精准营销、精细化运营直接钩挂的。这篇文章主要讲产品运营角度的用户画像。 希望看完后,解…

    2022年6月13日 0
  • 在R中用Lavaan包做验证性因子分析

    今天教大家如何在R中做验证性因子分析,R中能做CFA的包不止一个,但lavaan是最常用的SEM包。lavaan是latent variable analysis的组合,从名称中我…

    2022年6月12日 0
  • 用R计算AVE和CR

    AVE(Average Variance Extracted)是平均萃取变异量,又叫平均提取方差值,是检验结构变量内部一致性的统计量。 CR(Composite Reliabili…

    2022年6月12日 0

联系我们

在线咨询:点击这里给我发消息

邮件:23683716@qq.com

跳至工具栏