一起大数据

最新发布 第2页

SQL

MySQL 存储过程

from https://www.runoob.com/w3cnote/mysql-stored-procedure.html MySQL 5.0 版本开始支持存储过程。 存储过程(Stored Procedure)是一种在数据库中存储复杂...

统计学

玩转会员数据分析系列之统计学

from http://www.woshipm.com/data-analysis/917862.html 玩转会员数据分析系列文章主要针对数据分析给大家普及一些基础知识以及在工作中经常会用到的数据分析方法和概念,帮助大家一起成长。 因为我...

Python

使用Python进行描述性统计

from https://www.cnblogs.com/jasonfreak/p/5441512.html 目录 1 描述性统计是什么? 2 使用NumPy和SciPy进行数值分析 2.1 基本概念 2.2 中心位置(均值、中位数、众数)...

统计学

蒙特卡洛方法到底有什么用

作者:saltriver 原文:https://blog.csdn.net/saltriver/article/details/52194918 蒙特卡洛方法(Monte Carlo method,也有翻译成“蒙特卡罗方法”)是以概率和统计...

统计学

中心极限定理通俗介绍

作者:朱曦炽 链接:https://www.jianshu.com/p/cb7145e4c4bd 中心极限定理是统计学中比较重要的一个定理。 本文将通过实际模拟数据的形式,形象地展示中心极限定理是什么,是如何发挥作用的。 什么是中心极限定理...

数据可视化

Power BI架构 你选对了吗?

原文:https://www.jianshu.com/p/94768017a456 最近我有幸听到了国内BI大神老金的Power BI架构的现场讲解,一个字:牛B!废话不多说,直接上干货。 大神亲自画了一幅PowerBI架构图,打印成册,人...

Python

Python 数据分析基础小结

from https://www.cnblogs.com/WoLykos/p/9582920.html 一、数据读取 1、读写数据库数据 读取函数: pandas.read_sql_table(table_name, con, schema...

机器学习

sklearn入门教程:分类、聚类、回归和降维

作者 zhouchen sklearn中的sk代表着scikit,就可以知道这是一个用于科研的工具包了,那么这个科研工具包种都包含了哪些内容呢? 下面这个图描述了sk-learn所覆盖的领域。 分类、聚类、回归和降维,基本的数据算法需求均有...

Python

绘制桑基图(sankey diagram):快速追踪目标变化的可视工具

什么是桑基图 在给出定义之前,先看下几个著名的Sankey图实例 这个是来表示拿破仑进攻俄国过程时,队伍人员的变动情况。棕色表示进攻、黑色表示撤退。从这个图片上可以清晰的看出在各个阶段的人员战斗减员情况。 Sankey图的种类 按照节点之间...

机器学习

odds、OR和RR的计算公式和实际意义

from http://www.sohu.com/a/210568171_799723 1. Odds Odds 的意思为机率、可能性,是指某事件发生的可能性(概率)与不发生的可能性(概率)之比。假如某药物有疗效的比例为p1,则无效的比为1...

机器学习

逻辑回归的通俗解释

1 逻辑回归的定位 首先,逻辑回归是一种分类(Classification)算法。比如说: 给定一封邮件,判断是不是垃圾邮件 给出一个交易明细数据,判断这个交易是否是欺诈交易 给出一个肿瘤检查的结果数据,判断这个肿瘤是否为恶性肿瘤 逻辑回归...

机器学习

谈谈 Bias-Variance Tradeoff

准确是两个概念。准是 bias 小,确是 variance 小。准确是相对概念,因为 bias-variance tradeoff。 ——Liam Huang 在机器学习领域,人们总是希望使自己的模型尽可能准确地描述数据背后的真实规律。通俗...

Python

Matplotlib 教程

本文为译文,原文载于此,译文原载于此。本文欢迎转载,但请保留本段文字,尊重作者和译者的权益。谢谢。: ) 本文作者:Liam Huang 本文链接:https://liam.page/2014/09/11/matplotlib-tutori...

Python

ML神器:sklearn的快速使用

from https://www.cnblogs.com/lianyingteng/p/7811126.html 传统的机器学习任务从开始到建模的一般流程是:获取数据 -> 数据预处理 -> 训练建模 -> 模型评估 -&...

Python

ARIMA模型原理及实现

from https://www.jianshu.com/p/305c4961ee06 1、数据介绍 再介绍本篇的内容之前,我们先来看一下本文用到的数据。本文用到的中国银行股票数据下载:http://pan.baidu.com/s/1gfx...

统计学

PLS偏最小二乘回归原理与应用

作者 Andrew.Du 出处:http://www.cnblogs.com/duye/p/9031511.html 一、前言 1.目的: 我写这篇文章的目的,是想用最简洁的语言阐述清楚何为偏最小二乘分析,以及到底应该如何应用这个在数学建模...