软件

Pandas透视表(pivot_table)详解

from https://www.cnblogs.com/onemorepoint/p/8425300.html 介绍 也许大多数人都有在Excel中使用数据透视表的经历,其实Pandas也提供了一个类似的功能,名为pivot_table。...

excel优秀图表模板汇总(超级经典值得学习)

来自 https://wenku.baidu.com/view/dbad8775daef5ef7bb0d3c41.html 模板包含以下图表: 多折线图:该图表适用于当有多个系列随着时间,需要比较大小及走势,需要绘制折线图时,但若堆积在一起...

SPSS—非线性回归(模型表达式)案例解析

from https://www.cnblogs.com/qiernonstop/p/3720486.html 非线性回归过程是用来建立因变量与一组自变量之间的非线性关系,它不像线性模型那样有众多的假设条件,可以在自变量和因变量之间建立任何...

词云图 – WorldCloud – Python代码实现

第一步:安装必要的包WorldCloud(安装好并且没有出错的可跳过这一步) pip install wordcloud 如果出现错误,那么看看是什么错误: 提示pip“不是内部命令”,那就先安装pip吧; 提示其他“某某某 is requ...

聚类分析 – K-means – Python代码实现

算法简介 K-means算法是很典型的基于距离的聚类算法,采用距离作为相似性的评价指标,即认为两个对象的距离越近,其相似度就越大。该算法认为簇是由距离靠近的对象组成的,因此把得到紧凑且独立的簇作为最终目标。 算法过程如下: 1)从N个文档随...

向Excel说再见,神级编辑器统一表格与Python

很多开发者说自从有了 Python/Pandas,Excel 都不怎么用了,用它来处理与可视化表格非常快速。但是这样还是有一大缺陷,操作不是可视化的表格,因此对技能要求更高一点。近日,开发者构建了名为 Grid studio 的开源项目,它...

Tableau集成Python机器学习实践(下)

from https://zhuanlan.zhihu.com/p/30221630 Tableau报表创建 数据准备 我们还是引用iris数据集的csv数据格式作为tableau的数据源,里面包含了class这个维度字段和sepal_le...

Tableau集成Python机器学习实践(中)

from https://zhuanlan.zhihu.com/p/30221526 基于Iris数据集的机器学习实践 Iris数据集简介 iris数据集由Fisher, 1936收集整理,Iris也称安德森鸢尾花卉数据集,英文全称是And...

SPSS Modeler常用函数简介

SPSS Modeler软件包含多种功能丰富的函数,几乎涵盖了我们日常工作的各种需要,主要有信息函数、转换函数、比较函数、逻辑函数、数值函数、三角函数、概率函数、位元整数运算、随机函数、字符串函数、日期和时间函数、序列函数、全局函数、空值和...

MySQL 存储过程

from https://www.runoob.com/w3cnote/mysql-stored-procedure.html MySQL 5.0 版本开始支持存储过程。 存储过程(Stored Procedure)是一种在数据库中存储复杂...

使用Python进行描述性统计

from https://www.cnblogs.com/jasonfreak/p/5441512.html 目录 1 描述性统计是什么? 2 使用NumPy和SciPy进行数值分析 2.1 基本概念 2.2 中心位置(均值、中位数、众数)...

Python 数据分析基础小结

from https://www.cnblogs.com/WoLykos/p/9582920.html 一、数据读取 1、读写数据库数据 读取函数: pandas.read_sql_table(table_name, con, schema...

绘制桑基图(sankey diagram):快速追踪目标变化的可视工具

什么是桑基图 在给出定义之前,先看下几个著名的Sankey图实例 这个是来表示拿破仑进攻俄国过程时,队伍人员的变动情况。棕色表示进攻、黑色表示撤退。从这个图片上可以清晰的看出在各个阶段的人员战斗减员情况。 Sankey图的种类 按照节点之间...

Matplotlib 教程

本文为译文,原文载于此,译文原载于此。本文欢迎转载,但请保留本段文字,尊重作者和译者的权益。谢谢。: ) 本文作者:Liam Huang 本文链接:https://liam.page/2014/09/11/matplotlib-tutori...

ML神器:sklearn的快速使用

from https://www.cnblogs.com/lianyingteng/p/7811126.html 传统的机器学习任务从开始到建模的一般流程是:获取数据 -> 数据预处理 -> 训练建模 -> 模型评估 -&...

ARIMA模型原理及实现

from https://www.jianshu.com/p/305c4961ee06 1、数据介绍 再介绍本篇的内容之前,我们先来看一下本文用到的数据。本文用到的中国银行股票数据下载:http://pan.baidu.com/s/1gfx...

sklearn 的优雅数据挖掘流程

from https://blog.csdn.net/ma416539432/article/details/53510277 1)下载数据集,通过统计方法理解数据集,并可视化。 2)构建6个机器学习模型。从中选择最好的。 在下载并且安装好...

使用Python自动提取内容摘要

  https://www.biaodianfu.com/automatic-text-summarizer.html利用计算机将大量的文本进行处理,产生简洁、精炼内容的过程就是文本摘要,人们可通过阅读摘要来把握文本主要内容,这不...