软件
-
Python推荐系统库:Surprise
Surprise简介 Surprise(Simple Python Recommendation System Engine)是一款推荐系统库,是scikit系列中的一个。surp…
-
数据分析之AB TESTING实战(附PYTHON代码)
目录 1、增长黑客 1)前言 2)运用分析指标框架,驱动互联网产品和运营 3)增长黑客大致分为如下几个步骤 2、AB testing介绍 1)AB testing对比方案图示展示 …
-
机器学习建模工具PyCaret详讲
机器学习建模工具 PYCARET 1 PyCaret 1.0.0简介 2 PyCaret入门 3 获取数据 4 搭建环境 4.1 预处理介绍 4.2 采样与拆分 4.2.1 训练/…
-
全网最新最全Pyecharts可视化教程(三):制作多个子图
在介绍了Pyecharts的普通绘图和对地图的绘制之后,今天小编将对Pyecharts绘制多个子图的能力进行简单的展示,并且将其应用在具体的案例之上来进行演示,看看其出来的效果如何…
-
全网最新最全Pyecharts可视化教程(二):绘制好看的交互式地图教程
说到使用Python来进行地图的可视化那就一定少不了Pyecharts的身影,本文小编就对Pyecharts可实现的地图可视化进行一番探究,看看其出来的效果如何 Pyecharts…
-
Python数据可视化-seaborn
详细介绍可以看seaborn官方API和example galler。 常用颜色: 常用样式: 1 set_style( ) set( ) set_style( )是用来设置主…
-
在R中用Lavaan包做验证性因子分析
今天教大家如何在R中做验证性因子分析,R中能做CFA的包不止一个,但lavaan是最常用的SEM包。lavaan是latent variable analysis的组合,从名称中我…
-
用R计算AVE和CR
AVE(Average Variance Extracted)是平均萃取变异量,又叫平均提取方差值,是检验结构变量内部一致性的统计量。 CR(Composite Reliabili…
-
功能强大的python包(三):Seaborn
1. Seaborn简介 Seaborn是一个基于matplotlib且数据结构与Pandas统一的统计图制作库。 Seaborn库旨在以数据可视化为中心来挖掘并理解数据。 Sea…
-
功能强大的python包(二):Pandas
1. Pandas简介 Pandas是一个强大的分析结构化数据的工具集;它的使用基础是Numpy(提供高性能的矩阵运算)。 Pandas是一种结构化数据工具集,可以用于数据挖掘、数…
-
风控模型—群体稳定性指标(PSI)深入理解应用
风控业务背景 在风控中,稳定性压倒一切。原因在于,一套风控模型正式上线运行后往往需要很久(通常一年以上)才会被替换下线。如果模型不稳定,意味着模型不可控,对于业务本身而言就是一种不…
-
功能强大的python包(一):Numpy
1. Numpy简介 Numpy是python的一种开源的数值计算扩展; Numpy可用来存储和处理大型矩阵; Numpy支持大量的维度数组与矩阵运算。 2. 数据类型 Numpy…
-
jupyter notebook 实现matplotlib图动态刷新
我就废话不多说了,大家还是直接看代码吧! import matplotlib %matplotlib inline from IPython import display 需要刷新…
-
Python实现K-means聚类算法并可视化生成动图
K-means算法介绍 简单来说,K-means算法是一种无监督算法,不需要事先对数据集打上标签,即ground-truth,也可以对数据集进行分类,并且可以指定类别数目 牧师-村…
-
Clustering聚类算法总结+python实践
本文以iris鸢尾花数据为例,实现各种聚类算法。 文章里理论部分很简略,主要是python实践。 没想到疫情期间度过了研一下学期,全在上网课,仍然是获益匪浅。 正好在上机器学习的课…
-
一文学会Seaborn!
Matplotlib绘制一张美图需要很多参数调整,于是就出现了high-level版的Seaborn,几行代码即可输出美美的图形,那么Seaborn是如何做到的? Seaborn主…
-
理论加实践,终于把时间序列预测ARIMA模型讲明白了
本文将通过一段时间内电力负荷波动的数据集来实战演示完整的ARIMA模型的建模及参数选择过程,其中包括数据准备、随机性、稳定性检验。本文旨在实践中学习,在实战过程中穿插理论知识梳理和…
-
时间序列预测模型-ARIMA原理及Python实现!
1、数据介绍 再介绍本篇的内容之前,我们先来看一下本文用到的数据。本文用到的中国银行股票数据下载:http://pan.baidu.com/s/1gfxRFbH。 我们先来导入一下…
-
ARIMA模型原理以及代码实现案例
一、时间序列分析 北京每年每个月旅客的人数,上海飞往北京每年的游客人数等类似这种顾客数、访问量、股价等都是时间序列数据。这些数据会随着时间变化而变化。时间序列数据的特点是数据会随时…
-
Pandas教程 | 数据处理三板斧——map、apply、applymap详解
在日常的数据处理中,经常会对一个DataFrame进行逐行、逐列和逐元素的操作,对应这些操作,Pandas中的map、apply和applymap可以解决绝大部分这样的数据处理需求…