数据分析

决策树的剪枝理论

4

xsmile 发布于 2017-01-11

剪枝理论,决策树的剪枝在上一节中没有仔细讲,趁这个机会学习了剪枝的基础理论,这里会详细学习。 决策树为什么(WHY)要剪枝?原因是避免决策树过拟合(Overfitting)样本。前面的算法生成的决策树非常详细并且庞大,每个属性都被详细地加以考虑,决策树的树叶节点所覆盖的训练样本都...

阅读(332)评论(0)赞 (2)

决策树剪枝

26

xsmile 发布于 2017-01-11

from http://www.cnblogs.com/yonghao/p/5064996.html 什么是剪枝? 剪枝是指将一颗子树的子节点全部删掉,根节点作为叶子节点,以下图为例:   为甚么要剪枝? 决策树是充分考虑了所有的数据点而生成的复杂树,有可能出现过拟合的...

阅读(108)评论(0)赞 (0)

需求预测我喜欢用ARIMA模型

25

xsmile 发布于 2017-01-09

本文结构: 时间序列分析? 什么是ARIMA? ARIMA数学模型? input,output 是什么? 怎么用?-代码实例 常见问题? 时间序列分析? 时间序列,就是按时间顺序排列的,随时间变化的数据序列。 生活中各领域各行业太多时间序列的数据了,销售额,顾客数,访问量,股价,...

阅读(258)评论(0)赞 (0)

联合分析之CBC模型

12

xsmile 发布于 2016-12-07

by sandy http://isux.tencent.com/choice-based-conjoint.html 作为付费的企业级产品,随着开放平台应用的增多,我们需要考虑不同市场对不同应用或组合的偏好,以及组合价格对企业用户的吸引力。借着“企业QQ平台应用价格研究”,梳理...

阅读(114)评论(0)赞 (2)

联合分析及案例应用

xsmile 发布于 2016-12-07

结合分析 联合分析又称结合分析(conjoint analysis)是一种有效的市场研究技术,近年来广泛应用于消费品、工业产品和商业服务等相关领域的市场研究中,尤其是在新产品开发、市场占有率分析、竞争分析、市场细分和价格策略等方面,结合分析在我国也越来越受到市场研究公司和企业的重...

阅读(143)评论(0)赞 (2)

分析师教你 | 如何科学地在上海拍车牌

8

xsmile 发布于 2016-12-06

在拍沪牌这场战争中,谁都不想当炮灰,如何科学地在上海拍车牌?作为城市数据研究院的分析师老司机,院草告诉你答案。 为了给懒癌晚期的同学多一点临终关怀,院草贴心为大家准备了两个版本的拍车牌教程: 1.比鱿鱼还干的干货【拍沪牌一张图攻略】 (请直接下拉到文末查看) 2.老司机带带你之详...

阅读(192)评论(0)赞 (0)

用R来做时间序列

xsmile 发布于 2016-12-04

from http://blog.sina.com.cn/s/blog_6bb07f830100xh0y.html 第一部分:怎么将数组转化为时间序列? ts(x, start=1,frequency=4) # 将x转化为时间序列model 通常状况下,当frequency=4,...

阅读(178)评论(0)赞 (0)

结构方程模型(SEM)

3

xsmile 发布于 2016-11-29

结构方程这几年热度不减,有必要研究一下它的R语言实现过程,今天先复习一下结构方程的相关理论,参考吉林大学余翠林的ppt 一、  为什么使用SEM?  1、回归分析有几方面的限制: (1)不允许有多个因变量或输出变量 (2)中间变量不能包含在与预测因子一样的单一模型中 (3)预测因...

阅读(243)评论(0)赞 (2)

时间序列

xsmile 发布于 2016-11-02

来自 http://m.blog.csdn.net/article/details?id=50654337 1、时间序列的分类 时间序列分为:非季节性数据和季节性数据 一个非季节性时间序列包含一个趋势部分和一个不规则部分。 一个季节性时间序列包含一个趋势部分,一个季节性部分和一个...

阅读(366)评论(0)赞 (1)

数据分析师的思维是如何练出来的?

3

xsmile 发布于 2016-10-14

作者:ONES_AI 一名数据分析师的日常工作流是怎样的? 「数据分析师」这个职位,不同的公司,不同的行业,对于它的理解,以及它覆盖的工作范围不太一样。在有些传统行业,数据分析师工作重点是「做行业报告」等;在阿里巴巴等大型互联网公司,职位区分比较明确,数据分析师大部分时间只做产品...

阅读(343)评论(1)赞 (11)

2017校招数据分析岗笔试/面试知识点

3

xsmile 发布于 2016-10-14

作者:蓝先生 2017校招正在火热的进行,后面会不断更新涉及到的相关知识点。 尽管听说今年几个大互联网公司招的人超少,但好像哪一年都说是就业困难,能够进去当然最好,不能进去是不是应该也抱着好的期望去找自己满意的呢? 最近笔试了很多家公司校招的数据分析和数据挖掘岗位,今天(9.18...

阅读(487)评论(0)赞 (11)

利用SPSS检验数据是否符合正态分布

10

xsmile 发布于 2016-10-10

来自 http://blog.sina.com.cn/s/blog_7dc56e6e0100qxjz.html 正态分布也叫常态分布,在我们后面说的很多东西都需要数据呈正态分布。下面的图就是正态分布曲线,中间隆起,对称向两边下降。   下面我们来看一组数据,并检验“期初...

阅读(443)评论(0)赞 (3)

一位电商数据分析师的经验总结

xsmile 发布于 2016-08-23

来自 http://zhoulili1987619126.lofter.com/post/1cc8f7a3_5611361 08年毕业,不知不觉的混进了电子商务行业,又不知不觉的做了三年数据分析,恰好又赶上了互联网电子商务行业发展最快的几年,也算是不错吧,毕竟感觉前途还是很光明的...

阅读(958)评论(0)赞 (14)

时间序列分析—(ARIMA模型)

16

xsmile 发布于 2016-08-23

来自 http://blog.163.com/zhoulili1987619@126/blog/static/353082012015516103746884/ 指数平滑法对于预测涞水是非常有帮助的,而且它对时间序列上面连续的值之间相关性咩有要求。但是,如果你想使用指数平滑法计算...

阅读(1141)评论(0)赞 (3)

如何快速成为数据分析师?

2

xsmile 发布于 2016-07-27

作者:此人已死 链接:https://www.zhihu.com/question/29265587/answer/44010658 来源:知乎 著作权归作者所有,转载请联系作者获得授权。 最近一直忙啊,都没机会上知乎。好多同学私信我说出版社的事情,说买不到书籍,我好想给你们一个...

阅读(1184)评论(0)赞 (4)

一个新手如何系统的学习数据分析

1

xsmile 发布于 2016-07-27

作者:此人已死 链接:https://www.zhihu.com/question/22119753/answer/54320521 来源:知乎 著作权归作者所有,转载请联系作者获得授权。 对于大部分人来说,数据分析基本上都是靠着自学完成,比如我就是一个典型的案列。题主是计算机出...

阅读(818)评论(0)赞 (3)