资讯

最热门的50个matplotlib图

关联 Correlation 散点图 Scatter plot 带边界的气泡图 Bubble plot with Encircling 带线性回归最佳拟合线的散点图 Scatter plot with line of best fit 抖动...

数据仓库实践杂谈-(四)-元数据

[目录] 第一章:概述 第二章:整体数据分层 第三章:整体实现框架 第四章:元数据 第五章:ETL 第六章:数据校验 第七章:数据标准化 第八章:去重 第九章:增量/全量 第十章:拉链处理 第十一章:分布式处理增量 第十二章:列式存储 第十...

使用Python进行描述性统计

from https://www.cnblogs.com/jasonfreak/p/5441512.html 目录 1 描述性统计是什么? 2 使用NumPy和SciPy进行数值分析 2.1 基本概念 2.2 中心位置(均值、中位数、众数)...

ARIMA模型原理及实现

from https://www.jianshu.com/p/305c4961ee06 1、数据介绍 再介绍本篇的内容之前,我们先来看一下本文用到的数据。本文用到的中国银行股票数据下载:http://pan.baidu.com/s/1gfx...

Python从Mysql获取数据为数据分析做准备

原文地址: http://mp.weixin.qq.com/s/6H4n_ZpsuBSUPZmlD9FhzA 作者:数据取经团-王大伟 前言 最近学了一下 sql ,因为做数据分析不会sql真不行。 平时学的都是 Python,所以如果要用...

自我代码提升之朴素贝叶斯

作者:数据取经团-JQstyle 原文地址:http://mp.weixin.qq.com/s/OkteiebuHbSuN9HIDSDsQA 朴素贝叶斯的简介   在机器学习的分类算法的各个门类中,贝叶斯分类方法是一个比较重要的组成部分。而...

品读“成人用品”捆绑销售秘籍

原文地址:http://mp.weixin.qq.com/s/5ytHdraekfIHRDVCUmX4Ew 作者:数据取经团-吕洞宾 前言 情人节到了,数据分析师小明准备给和他相恋7年的女朋友买一束玫瑰花,以表示自己对女票的爱意。 他从淘宝...

基于五种机器算法的信用风险评估

原文地址: https://mp.weixin.qq.com/s/sE7i4grdtY4WQMX—0Lk6g 作者:数据取经团-白云飞 基于五种机器算法的信用风险评估是一个系列文章,从互金数据出发,经过数据预处理,特征工程,建立机器学习模型...

数据可视化入门篇

原文地址: https://mp.weixin.qq.com/s/e2tv85r3JLmy_8g_doaSuA 作者:数据取经团-张俊红 本篇要点: 01、数据可视化是什么 02、数据可视化的一般流程 03、常见的数据种类 04、通过可视化...

自我代码提升之逻辑回归

作者:数据取经团-王嘉琪 对于数据挖掘或是机器学习等算法的学习,用代码将之实现是次、动理论到实践的有效途径,而目前在数据科学应用领域,很多成熟的工具(诸如python的sklearn模块或是各种各样的R包),为我们的学习和工作提供了便利。但...

自组织神经网络:Kohonen网络训练算法

from http://blog.sina.com.cn/s/blog_92d2c5e10102vava.html  Kohonen网络的拓扑结构 网络上层为输出结点(假设为m个),按二维形式排成一个结点矩阵。 输入结点处于下方,若输入向量...

决策树之ID3和C4.5

一、决策树 一种树状分类结构模型,是一种通过对变量值拆分建立起来的分类规则,又利用树形图分割形成的概念路径的数据分析技术。 二、决策树的两个关键步骤 三、决策树的构建步骤 注: ⑴第一步中:先找出各个可以作为分类变量的自变量的所有可能的划分...

朴素贝叶斯算法的案例实现

一、朴素贝叶斯分类的R函数介绍 1、朴素贝叶斯分类算法的实现函数 R中的e1071包中的naiveBayes()函数可以实现朴素贝叶斯算法,具体的函数格式如下: naiveBayes(x, y, laplace=0) 常用变量具体的参数解释...

朴素贝叶斯的理解

一、统计学基础知识(虽然枯燥,但是硬着头皮也要看) 二、基于朴素贝叶斯定理的条件概率 三、朴素贝叶斯分类的工作流程 四、朴素贝叶斯分类中需要注意的问题 ⑴假设条件:每一个属性值在给定类上面的影响是独立于其他属性的,也就是说属性与属性之间是相...

Logistic回归及其在Python中的一个实现

一、回归分析的不足 我们大家对回归分析很清楚,但是有这样一类变量,它们的因变量不是连续型变量,而是分类变量。比如这件商品是买还是不买;某个病人是否已经痊愈。这种现象是经常出现的。 我们以这件商品买和不买来进行讨论。用“1”来表示“买”,用“...