软件
-
Python缺失值预处理——复杂缺失值填补方法
复杂的缺失值填补方法,会考虑到数据的整体情况,然后在对有缺失值的数据进行填充,本小节将会介绍3种复杂的缺失值填补方法。 数据准备 ## 输出高清图像 %config InlineB…
-
【Python-机器学习】数据缺失值的插补:Sciki-Learn VS pandas
常见的数据框缺失数据插补有3种方式: pandas 中简单粗暴的替换取值; pandas 中的 fillna 函数; sklearn 机器学习包中的 Imputer。 经过一番对比…
-
SPSS-Modeler安装
1. 安装SPSS 64位软件包,解压安装安装步骤即可: 链接:https://pan.baidu.com/s/1t48M16ZUdpnfWemceOQc8g 提取码…
-
MySQL:互联网公司常用分库分表方案汇总!
、数据库瓶颈 不管是IO瓶颈,还是CPU瓶颈,最终都会导致数据库的活跃连接数增加,进而逼近甚至达到数据库可承载活跃连接数的阈值。在业务Service来看就是,可用数据库连接少甚至无…
-
SQL Server 2019 安装教程(详细免费,自定义安装)
一、下载安装SQL: 1、下载SQL Server 2019 Developer 官方网址: https://www.microsoft.com/zh-cn/sql-server/…
-
DAX基础入门 – 30分钟从SQL到DAX — PowerBI 利器
有没有面对着稀奇古怪的DAX而感到有点丈八金刚摸不着头脑或者干瞪眼?! 有没有想得到某个值想不出来DAX怎么写而直跳脚!? 看完这篇文章,你会恍然大悟,捂脸偷笑。呼呼呼~ &nbs…
-
networkx:一款构建图网络可视化的 Python 工具包!
作者:俊欣,链接:Python社交网络可视化 我们平常都会使用很多的社交媒体,有微信、微博、抖音等等,例如在微博上面,我们会关注某些KOL,同时自己身边的亲朋好友等等也会来关注我们…
-
超详细!Python 制作一个优雅的词云其实特简单!
文:酷头 来源:印象python 什么是词云 “词云”就是对网络文本中出现频率较高的“关键词”予以视觉上的突出,形成“关键词云层”或“关键词渲染”。从而过滤掉大量的文本信息,使浏览…
-
手把手教你使用 Python 做 LDA 主题提取和可视化
前言 信息时代的高速发展让我们得以使用手机、电脑等设备轻松从网络上获取信息。但是,这似乎也是一把双刃剑,我们在获取到众多信息的同时,又可能没有太多时间去一一阅读它们,以至于“收藏从…
-
生存分析: 在 Python 中的实现
生存分析的统计方法可以回答以下商业问题: 一个特定的客户会在公司留存多长时间?换句话说,在多长时间之后,这个客户将会流失? 运行一年后,某台机器还能使用多久? 不同营销渠道的相对留…
-
Python实战|利用生存分析预测用户流失周期
第一部分 1.数据基本情况探索 2.数据来源及预处理 3.数据相关性探索 第二部分 1.Cox风险比例模型建模 2. Cox风险比例模型效果评估 3.Cox风险比例模型预测流失用户…
-
[R][bnlearn]高级的贝叶斯网络画图
用第三方包画图 一.工具:graphviz 下载页面提示说:这个包依赖于grid,graph,Rgraphviz,得先下载它们再下graphviz,grid好像是系统自带的,下后面…
-
零基础学习xlwings,看这篇文章就够了
1、xlwings是什么 2、xlwings安装更新与卸载 3、xlwings详细使用 4、案例分享 xlwings是什么 在日常生活中我们或多或少的都会跟Excel打交道,比如做…
-
xlwings 教程:使用Python更快速地处理Excel
Excel在当今商业中的使用非常普遍。在Dataquest,出于很多原因,我们通常推荐使用代码处理数据,并且我们的许多数据科学课程的目标是教授数据分析和数据科学的高效编码。但是,无…
-
用 PySpark ML 构建机器学习模型
Spark 是一种专门用于交互式查询、机器学习和实时工作负载的开源框架,而 PySpark 是 Python 使用 Spark 的库。 PySpark 是一种用于大规模执行探索性…
-
教你在Excel中调用Python脚本实现数据自动化处理的方法
目录 一、为什么将Python与Excel VBA集成? 二、为什么使用xlwings? 三、玩转xlwings 这次我们会介绍如何使用xlwings将Python和Excel两大…
-
聚类算法概述(k-Means++/FCM/凝聚层次聚类/DBSCAN)
参考自初识聚类算法:K均值、凝聚层次聚类和DBSCAN。 聚类的目的 将数据划分为若干个簇,簇内相似性大,簇间相似性小,聚类效果好。用于从数据中提取信息和规律。 聚类的概念 层次与…
-
一文让你彻底理解SQL关联子查询
员工表的主要信息: 需求:检索工资大于同职位的平均工资的员工信息。 直觉的做法 员工多,而相应的职位(如销售员、经理、部门经理等)少,因此首先想到的思路是对职位分组,这样就能分别得…
-
机器学习(一):5分钟理解机器学习并上手实践
引言 现在市面上的机器学习教程大多先学习数学基础,然后学机器学习的数学算法,再建立机器学习的数学模型,再学习深度学习,再学习工程化,再考虑落地。这其中每个环节都在快速发展,唯独落地…
-
SQL优化最干货总结 – MySQL
前言 BATJTMD等大厂的面试难度越来越高,但无论从大厂还是到小公司,一直未变的一个重点就是对SQL优化经验的考察。一提到数据库,先“说一说你对SQL优化的见解吧?”。SQL优化…