资讯

Python从Mysql获取数据为数据分析做准备

原文地址: http://mp.weixin.qq.com/s/6H4n_ZpsuBSUPZmlD9FhzA 作者:数据取经团-王大伟 前言 最近学了一下 sql ,因为做数据分析不会sql真不行。 平时学的都是 Python,所以如果要用...

自我代码提升之朴素贝叶斯

作者:数据取经团-JQstyle 原文地址:http://mp.weixin.qq.com/s/OkteiebuHbSuN9HIDSDsQA 朴素贝叶斯的简介   在机器学习的分类算法的各个门类中,贝叶斯分类方法是一个比较重要的组成部分。而...

品读“成人用品”捆绑销售秘籍

原文地址:http://mp.weixin.qq.com/s/5ytHdraekfIHRDVCUmX4Ew 作者:数据取经团-吕洞宾 前言 情人节到了,数据分析师小明准备给和他相恋7年的女朋友买一束玫瑰花,以表示自己对女票的爱意。 他从淘宝...

基于五种机器算法的信用风险评估

原文地址: https://mp.weixin.qq.com/s/sE7i4grdtY4WQMX—0Lk6g 作者:数据取经团-白云飞 基于五种机器算法的信用风险评估是一个系列文章,从互金数据出发,经过数据预处理,特征工程,建立机器学习模型...

数据可视化入门篇

原文地址: https://mp.weixin.qq.com/s/e2tv85r3JLmy_8g_doaSuA 作者:数据取经团-张俊红 本篇要点: 01、数据可视化是什么 02、数据可视化的一般流程 03、常见的数据种类 04、通过可视化...

自我代码提升之逻辑回归

作者:数据取经团-王嘉琪 对于数据挖掘或是机器学习等算法的学习,用代码将之实现是次、动理论到实践的有效途径,而目前在数据科学应用领域,很多成熟的工具(诸如python的sklearn模块或是各种各样的R包),为我们的学习和工作提供了便利。但...

自组织神经网络:Kohonen网络训练算法

from http://blog.sina.com.cn/s/blog_92d2c5e10102vava.html  Kohonen网络的拓扑结构 网络上层为输出结点(假设为m个),按二维形式排成一个结点矩阵。 输入结点处于下方,若输入向量...

决策树之ID3和C4.5

一、决策树 一种树状分类结构模型,是一种通过对变量值拆分建立起来的分类规则,又利用树形图分割形成的概念路径的数据分析技术。 二、决策树的两个关键步骤 三、决策树的构建步骤 注: ⑴第一步中:先找出各个可以作为分类变量的自变量的所有可能的划分...

朴素贝叶斯算法的案例实现

一、朴素贝叶斯分类的R函数介绍 1、朴素贝叶斯分类算法的实现函数 R中的e1071包中的naiveBayes()函数可以实现朴素贝叶斯算法,具体的函数格式如下: naiveBayes(x, y, laplace=0) 常用变量具体的参数解释...

朴素贝叶斯的理解

一、统计学基础知识(虽然枯燥,但是硬着头皮也要看) 二、基于朴素贝叶斯定理的条件概率 三、朴素贝叶斯分类的工作流程 四、朴素贝叶斯分类中需要注意的问题 ⑴假设条件:每一个属性值在给定类上面的影响是独立于其他属性的,也就是说属性与属性之间是相...

Logistic回归及其在Python中的一个实现

一、回归分析的不足 我们大家对回归分析很清楚,但是有这样一类变量,它们的因变量不是连续型变量,而是分类变量。比如这件商品是买还是不买;某个病人是否已经痊愈。这种现象是经常出现的。 我们以这件商品买和不买来进行讨论。用“1”来表示“买”,用“...

支持向量机中的战斗机 — One class SVM

  SVM 支持向量机(support vector machine),简称SVM,是一种基于监督的二类分类模型。 通俗的说,SVM是通过选取高维空间上的一个超平面(hyperplane)来进行数据分类,这个超平面即为分类平面,构成这个超平...

PCA:必须知道的降维手段

            (principal components analysis) 1.前期需要掌握的知识点及其相关课程: ⑴高等代数/线性代数:线性方程组、特征值和特征向量 ⑵统计学:方差分析等 2.主成分分析思想: 主成分分析是利用...

2014年最佳的大数据,数据科学文章

KDNuggets分别总结了2014年14个阅读最多以及分享最多的文章。我们从中可以看到多个主题——深度学习,数据科学家职业,教育和薪酬,学习数据科学的工具比如R和Python以及大众投票的最受欢迎的数据科学和数据挖掘语言。 其中,阅读最多...