软件

Excel:使用powerquery进行多表合并

工作中常遇到需汇总多张表进行分析的情况,本文以某公司销售数据(数据为虚构数据)为例介绍使用powerquery合并excel表的方法。 本文中所使用数据格式相同,且工作表中第一行为标题行,数据不规范可能使合并汇总数据存在问题或合并不成功,注...

最热门的50个matplotlib图

关联 Correlation 散点图 Scatter plot 带边界的气泡图 Bubble plot with Encircling 带线性回归最佳拟合线的散点图 Scatter plot with line of best fit 抖动...

用python分析消费者行为

python主要使用pandas进行分析, 数据是CDNow网站的用户购买明细。一共有用户ID,购买日期,购买数量,购买金额四个字段。我们通过案例数据完成一份基础的数据分析报告 数据获取可以可以通过百度网盘, https://pan.bai...

Facebook为人工智能研究开放轻量级交互式可视化库/工具HiPlot

来源:读芯术 不久前,Facebook为人工智能研究开放了自家的轻量级交互式可视化库/工具HiPlot。它使机器学习研究人员和数据科学家可以大量使用平行绘图来分析相关性并观察高维数据中的模式。 什么是平行图? 平行图是将高维或多元数据可视化...

R语言新神器visdat包(一行代码看穿整个数据集)

这是一个非常简单,功能却非常强大的包 介绍 (1)visdat的目的是 vis_dat通过将数据框中的变量类显示为绘图,并使用vis_miss简要查看缺失的数据,帮助数据框的可视化。 (2)visdat有6个功能函数: vis_dat()可...

一文解决基本科研绘图需求(可视化神器ggstatsplot)

ggstatsplot介绍 ggstatsplot是ggplot2包的扩展,主要用于创建美观的图片同时自动输出统计学分析结果,其统计学分析结果包含统计分析的详细信息,该包对于经常需要做统计分析的科研工作者来说非常有用。 一般情况下,数据可视...

mysql sql语句大全

from https://www.cnblogs.com/bchjazh/p/5997728.html 1、说明:创建数据库 CREATE DATABASE database-name 2、说明:删除数据库 drop database db...

Mysql数据库知识点总结

from https://www.cnblogs.com/immkoy/p/9822303.html 一、基本概念 1、数据库服务器 我们可以理解为数据库服务器即是一台内存较高的计算机,可以在上面运行数据库管理软件 2、数据库管理系统 如M...

python 打包exe文件

from https://blog.csdn.net/jx950915/article/details/90691870 安装模块 1、pyinstaller 这里建议最好使用命令安装,手动下载安装有很多其他的模块不存在,我就一开始是手动安...

集成学习之AdaBoost

from https://blog.csdn.net/sunbobosun56801/article/details/77891470 当做出重要决定时,大家可能会考虑吸取多个专家而不只是一个人的意见,机器学习也是如此,这就是集成学习的基本...

Pandas透视表(pivot_table)详解

from https://www.cnblogs.com/onemorepoint/p/8425300.html 介绍 也许大多数人都有在Excel中使用数据透视表的经历,其实Pandas也提供了一个类似的功能,名为pivot_table。...

excel优秀图表模板汇总(超级经典值得学习)

来自 https://wenku.baidu.com/view/dbad8775daef5ef7bb0d3c41.html 模板包含以下图表: 多折线图:该图表适用于当有多个系列随着时间,需要比较大小及走势,需要绘制折线图时,但若堆积在一起...

SPSS—非线性回归(模型表达式)案例解析

from https://www.cnblogs.com/qiernonstop/p/3720486.html 非线性回归过程是用来建立因变量与一组自变量之间的非线性关系,它不像线性模型那样有众多的假设条件,可以在自变量和因变量之间建立任何...

词云图 – WorldCloud – Python代码实现

第一步:安装必要的包WorldCloud(安装好并且没有出错的可跳过这一步) pip install wordcloud 如果出现错误,那么看看是什么错误: 提示pip“不是内部命令”,那就先安装pip吧; 提示其他“某某某 is requ...

聚类分析 – K-means – Python代码实现

算法简介 K-means算法是很典型的基于距离的聚类算法,采用距离作为相似性的评价指标,即认为两个对象的距离越近,其相似度就越大。该算法认为簇是由距离靠近的对象组成的,因此把得到紧凑且独立的簇作为最终目标。 算法过程如下: 1)从N个文档随...