Python

Python 数据分析基础小结

from https://www.cnblogs.com/WoLykos/p/9582920.html 一、数据读取 1、读写数据库数据 读取函数: pandas.read_sql_table(table_name, con, schema...

绘制桑基图(sankey diagram):快速追踪目标变化的可视工具

什么是桑基图 在给出定义之前,先看下几个著名的Sankey图实例 这个是来表示拿破仑进攻俄国过程时,队伍人员的变动情况。棕色表示进攻、黑色表示撤退。从这个图片上可以清晰的看出在各个阶段的人员战斗减员情况。 Sankey图的种类 按照节点之间...

Matplotlib 教程

本文为译文,原文载于此,译文原载于此。本文欢迎转载,但请保留本段文字,尊重作者和译者的权益。谢谢。: ) 本文作者:Liam Huang 本文链接:https://liam.page/2014/09/11/matplotlib-tutori...

ML神器:sklearn的快速使用

from https://www.cnblogs.com/lianyingteng/p/7811126.html 传统的机器学习任务从开始到建模的一般流程是:获取数据 -> 数据预处理 -> 训练建模 -> 模型评估 -&...

ARIMA模型原理及实现

from https://www.jianshu.com/p/305c4961ee06 1、数据介绍 再介绍本篇的内容之前,我们先来看一下本文用到的数据。本文用到的中国银行股票数据下载:http://pan.baidu.com/s/1gfx...

sklearn 的优雅数据挖掘流程

from https://blog.csdn.net/ma416539432/article/details/53510277 1)下载数据集,通过统计方法理解数据集,并可视化。 2)构建6个机器学习模型。从中选择最好的。 在下载并且安装好...

使用Python自动提取内容摘要

  https://www.biaodianfu.com/automatic-text-summarizer.html利用计算机将大量的文本进行处理,产生简洁、精炼内容的过程就是文本摘要,人们可通过阅读摘要来把握文本主要内容,这不...

pyspark的使用和操作(基础整理)

from https://blog.csdn.net/cymy001/article/details/78483723 Spark提供了一个Python_Shell,即pyspark,从而可以以交互的方式使用Python编写Spark程序。...

python调参神器hyperopt

from https://blog.csdn.net/qq_34139222/article/details/60322995   Hyperopt库为python中的模型选择和参数优化提供了算法和并行方案。机器学习常见的模型有K...

揭秘Kaggle神器xgboost

from https://blog.csdn.net/qunnie_yi/article/details/80129857 在 Kaggle 的很多比赛中,我们可以看到很多 winner 喜欢用 xgboost,而且获得非常好的表现,今天就...

一文了解机器学习知识点及其算法(附python代码)

来自 数据城堡 机器学习发展到现在,已经形成较为完善的知识体系,同时大量的数据科学家的研究成果也让现实问题的处理有了相对成熟的应对算法。 所以对于一般的机器学习来说,解决问题的方式变的非常简单:熟悉这些基本的算法,并且遇到实际的问题能够系统...

scikit-learn 逻辑回归类库使用小结

from http://www.cnblogs.com/pinard/p/6035872.html    之前在逻辑回归原理小结这篇文章中,对逻辑回归的原理做了小结。这里接着对scikit-learn中逻辑回归类库的我的使用经验做一个总结。...

开源的数据图表工具 Redash

from 开源中国 re:dash 是一款开源的BI工具,提供了基于web的数据库查询和数据可视化功能。 在数据运维人员的日常工作中,常会遇到需要将数据库中的数据查询并展示出来的问题,可能总是需要让前端开发人员来做web页面帮助完成这些需求...

流形学习-高维数据的降维与可视化

转载请注明出处:http://blog.csdn.net/u012162613/article/details/45920827 1.流形学习的概念 流形学习方法(Manifold Learning),简称流形学习,自2000年在著名的科学...