统计学

对应分析

xsmile 发布于 2017-01-18

日常分析中,经常会做的是研究变量间的关系,对于分类变量,常用的方法是卡方检验、Logistic模型等,但是对于分类变量很多,或者分类变量的类别很多时,用上述方法除了就会非常复杂,并且结果解释起来也不够直观,此时,可以使用对应分析加以分析。 对应分析也称为关联分析,是一种多元统计分...

阅读(101)评论(0)赞 (1)

决策树的剪枝理论

4

xsmile 发布于 2017-01-11

剪枝理论,决策树的剪枝在上一节中没有仔细讲,趁这个机会学习了剪枝的基础理论,这里会详细学习。 决策树为什么(WHY)要剪枝?原因是避免决策树过拟合(Overfitting)样本。前面的算法生成的决策树非常详细并且庞大,每个属性都被详细地加以考虑,决策树的树叶节点所覆盖的训练样本都...

阅读(337)评论(0)赞 (2)

决策树剪枝

26

xsmile 发布于 2017-01-11

from http://www.cnblogs.com/yonghao/p/5064996.html 什么是剪枝? 剪枝是指将一颗子树的子节点全部删掉,根节点作为叶子节点,以下图为例:   为甚么要剪枝? 决策树是充分考虑了所有的数据点而生成的复杂树,有可能出现过拟合的...

阅读(110)评论(0)赞 (0)

联合分析之CBC模型

12

xsmile 发布于 2016-12-07

by sandy http://isux.tencent.com/choice-based-conjoint.html 作为付费的企业级产品,随着开放平台应用的增多,我们需要考虑不同市场对不同应用或组合的偏好,以及组合价格对企业用户的吸引力。借着“企业QQ平台应用价格研究”,梳理...

阅读(115)评论(0)赞 (2)

联合分析及案例应用

xsmile 发布于 2016-12-07

结合分析 联合分析又称结合分析(conjoint analysis)是一种有效的市场研究技术,近年来广泛应用于消费品、工业产品和商业服务等相关领域的市场研究中,尤其是在新产品开发、市场占有率分析、竞争分析、市场细分和价格策略等方面,结合分析在我国也越来越受到市场研究公司和企业的重...

阅读(199)评论(0)赞 (2)

用R来做时间序列

xsmile 发布于 2016-12-04

from http://blog.sina.com.cn/s/blog_6bb07f830100xh0y.html 第一部分:怎么将数组转化为时间序列? ts(x, start=1,frequency=4) # 将x转化为时间序列model 通常状况下,当frequency=4,...

阅读(181)评论(0)赞 (0)

四分位数(定义、位置、数值)

xsmile 发布于 2016-12-03

一、定义 四分位数(Quartile)是统计学中分位数的一种,即把所有数据由小到大排列并分成四等份,处于三个分割点位置的数据就是四分位数。 第一四分位数 (Q1),又称“下四分位数”,等于该样本中所有数据由小到大排列后第25%的数据。 第二四分位数 (Q2),又称“中位数”,等于...

阅读(153)评论(0)赞 (0)

结构方程模型(SEM)

3

xsmile 发布于 2016-11-29

结构方程这几年热度不减,有必要研究一下它的R语言实现过程,今天先复习一下结构方程的相关理论,参考吉林大学余翠林的ppt 一、  为什么使用SEM?  1、回归分析有几方面的限制: (1)不允许有多个因变量或输出变量 (2)中间变量不能包含在与预测因子一样的单一模型中 (3)预测因...

阅读(249)评论(0)赞 (2)

机器学习-多元线性回归

18

xsmile 发布于 2016-11-23

A. 用途: 可以用来预测,由多种因素影响的结果。 B. 建立公式: C. 求解方法: 方法1. Gradient Descent: 技巧: 技巧1. Feature Scaling: 何时用: 当各个变量的值域或者数量级相差比较大时, 需要将各个变量的值域变换到相似的水平, 变...

阅读(237)评论(0)赞 (0)

SAS的基本统计功能

121

xsmile 发布于 2016-11-10

来自 http://stat.smmu.edu.cn/course/sas04.htm §4.1 一些单变量检验问题 4.1.1 正态性检验 4.1.2 两独立样本的均值检验 4.1.3 成对总体均值检验 §4.2 回归分析 4.2.1 用SAS/INSIGHT进行曲线拟合 4....

阅读(351)评论(0)赞 (0)

时间序列

xsmile 发布于 2016-11-02

来自 http://m.blog.csdn.net/article/details?id=50654337 1、时间序列的分类 时间序列分为:非季节性数据和季节性数据 一个非季节性时间序列包含一个趋势部分和一个不规则部分。 一个季节性时间序列包含一个趋势部分,一个季节性部分和一个...

阅读(372)评论(0)赞 (1)

R学习日记——时间序列分析之ARIMA模型预测

9

xsmile 发布于 2016-10-12

来自 http://blog.sina.com.cn/s/blog_70f632090101bnd8.html 今天学习ARIMA预测时间序列。  指数平滑法对于预测来说是非常有帮助的,而且它对时间序列上面连续的值之间相关性没有要求。但是,如果你想使用指数平滑法计算出预测区间, ...

阅读(618)评论(2)赞 (3)

使用R语言进行异常检测

13

xsmile 发布于 2016-10-12

来自 http://youhaolin.blog.163.com/blog/static/224494120201422110628586/ 本文结合R语言,展示了异常检测的案例,主要内容如下: (1)单变量的异常检测 (2)使用LOF(local outlier factor,...

阅读(491)评论(0)赞 (3)

利用SPSS检验数据是否符合正态分布

10

xsmile 发布于 2016-10-10

来自 http://blog.sina.com.cn/s/blog_7dc56e6e0100qxjz.html 正态分布也叫常态分布,在我们后面说的很多东西都需要数据呈正态分布。下面的图就是正态分布曲线,中间隆起,对称向两边下降。   下面我们来看一组数据,并检验“期初...

阅读(448)评论(0)赞 (3)

主成分分析的背景、理论及其三大应用

张龙祥 发布于 2016-06-29

1.前期需要掌握的知识点及其相关课程: ⑴高等代数/线性代数:线性方程组、特征值和特征向量 ⑵统计学:方差分析等 2.主成分分析思想: 主成分分析是利用降维的思想,在损失较少信息的前提下,用几个综合指标来代替之前多个指标的一种多元统计方法。我们把这些综合指标称为主成分,其中每一个...

阅读(1256)评论(0)赞 (11)

进行sobel检验

4

xsmile 发布于 2016-02-15

通常我们在做中介效应的时候,遇到有一个系数没有达到显著性水平,我们需要进行sobel检验,但是sobel检验的公式非常麻烦,如果你按计算器就很麻烦了,更何况你还有很多中介效应去验证,所以今天我给大家分享一个Excel可以很快的计算。 先下载一个Excel文件 http://pan...

阅读(936)评论(0)赞 (0)

典型相关分析

1

xsmile 发布于 2016-01-26

来自 http://blog.sina.com.cn/s/blog_50a9598801010xq3.html 1 什么时候用典型相关分析?    典型相关分析技术实际上是多元回归和相关分析的一种延伸。在多元回归分析中,为预测一个变量Y,要寻找P个变量,X1,X2,X3,┉,XP...

阅读(658)评论(0)赞 (0)