一起大数据

最新发布

Python

Python 数据分析基础小结

from https://www.cnblogs.com/WoLykos/p/9582920.html 一、数据读取 1、读写数据库数据 读取函数: pandas.read_sql_table(table_name, con, schema...

机器学习

sklearn入门教程:分类、聚类、回归和降维

作者 zhouchen sklearn中的sk代表着scikit,就可以知道这是一个用于科研的工具包了,那么这个科研工具包种都包含了哪些内容呢? 下面这个图描述了sk-learn所覆盖的领域。 分类、聚类、回归和降维,基本的数据算法需求均有...

Python

绘制桑基图(sankey diagram):快速追踪目标变化的可视工具

什么是桑基图 在给出定义之前,先看下几个著名的Sankey图实例 这个是来表示拿破仑进攻俄国过程时,队伍人员的变动情况。棕色表示进攻、黑色表示撤退。从这个图片上可以清晰的看出在各个阶段的人员战斗减员情况。 Sankey图的种类 按照节点之间...

机器学习

odds、OR和RR的计算公式和实际意义

from http://www.sohu.com/a/210568171_799723 1. Odds Odds 的意思为机率、可能性,是指某事件发生的可能性(概率)与不发生的可能性(概率)之比。假如某药物有疗效的比例为p1,则无效的比为1...

机器学习

逻辑回归的通俗解释

1 逻辑回归的定位 首先,逻辑回归是一种分类(Classification)算法。比如说: 给定一封邮件,判断是不是垃圾邮件 给出一个交易明细数据,判断这个交易是否是欺诈交易 给出一个肿瘤检查的结果数据,判断这个肿瘤是否为恶性肿瘤 逻辑回归...

机器学习

谈谈 Bias-Variance Tradeoff

准确是两个概念。准是 bias 小,确是 variance 小。准确是相对概念,因为 bias-variance tradeoff。 ——Liam Huang 在机器学习领域,人们总是希望使自己的模型尽可能准确地描述数据背后的真实规律。通俗...

Python

Matplotlib 教程

本文为译文,原文载于此,译文原载于此。本文欢迎转载,但请保留本段文字,尊重作者和译者的权益。谢谢。: ) 本文作者:Liam Huang 本文链接:https://liam.page/2014/09/11/matplotlib-tutori...

Python

ML神器:sklearn的快速使用

from https://www.cnblogs.com/lianyingteng/p/7811126.html 传统的机器学习任务从开始到建模的一般流程是:获取数据 -> 数据预处理 -> 训练建模 -> 模型评估 -&...

Python

ARIMA模型原理及实现

from https://www.jianshu.com/p/305c4961ee06 1、数据介绍 再介绍本篇的内容之前,我们先来看一下本文用到的数据。本文用到的中国银行股票数据下载:http://pan.baidu.com/s/1gfx...

统计学

PLS偏最小二乘回归原理与应用

作者 Andrew.Du 出处:http://www.cnblogs.com/duye/p/9031511.html 一、前言 1.目的: 我写这篇文章的目的,是想用最简洁的语言阐述清楚何为偏最小二乘分析,以及到底应该如何应用这个在数学建模...

Python

sklearn 的优雅数据挖掘流程

from https://blog.csdn.net/ma416539432/article/details/53510277 1)下载数据集,通过统计方法理解数据集,并可视化。 2)构建6个机器学习模型。从中选择最好的。 在下载并且安装好...

机器学习

像小说一样有趣的算法入门书?

算法图解 内容简介 本书示例丰富,图文并茂,以简明易懂的方式阐释了算法,旨在帮助程序员在日常项目中更好地利用算法为软件开发助力。 前三章介绍算法基础,包括二分查找、大O 表示法、两种基本的数据结构以及递归等。 余下的篇幅将主要介绍应用广泛的...

Python

使用Python自动提取内容摘要

  https://www.biaodianfu.com/automatic-text-summarizer.html利用计算机将大量的文本进行处理,产生简洁、精炼内容的过程就是文本摘要,人们可通过阅读摘要来把握文本主要内容,这不...

机器学习

入门机器学习的方法和途径(楼主和你一起踩坑!)

来自 云栖社区 作者表示当时在电信实习的时候,一个做了三年的项目年底上线了。当然我去的时候,其实就做好了!我认识了一位贵人,就是老大!!所以项目做完来年,他就撤了!走之前他叫我定了一个十年的职业规划,因为想做数据分析,所以选择了数据挖掘或者...

Excel

使用Excel数据分析工具进行多元回归分析

原文来自 http://blog.sina.com.cn/s/blog_a20c88b601014j9x.html 使用Excel数据分析工具进行多元回归分析与简单的回归估算分析方法基本相同。但是由于有些电脑在安装办公软件时并未加载数据分析...

机器学习

AI技术在智能海报设计中的应用

from https://tech.meituan.com/AI_in_Banner_Design.html 背景 在视觉设计领域中,设计师们往往会因为一些简单需求付出相当多的时间,比如修改文案内容,设计简单的海报版式,针对不同机型、展位的...