统计学

第3页

决策树剪枝

from http://www.cnblogs.com/yonghao/p/5064996.html 什么是剪枝? 剪枝是指将一颗子树的子节点全部删掉,根节点作为叶子节点,以下图为例:   为甚么要剪枝? 决策树是充分考虑了所有的...

联合分析之CBC模型

by sandy http://isux.tencent.com/choice-based-conjoint.html 作为付费的企业级产品,随着开放平台应用的增多,我们需要考虑不同市场对不同应用或组合的偏好,以及组合价格对企业用户的吸引力...

联合分析及案例应用

结合分析 联合分析又称结合分析(conjoint analysis)是一种有效的市场研究技术,近年来广泛应用于消费品、工业产品和商业服务等相关领域的市场研究中,尤其是在新产品开发、市场占有率分析、竞争分析、市场细分和价格策略等方面,结合分析...

用R来做时间序列

from http://blog.sina.com.cn/s/blog_6bb07f830100xh0y.html 第一部分:怎么将数组转化为时间序列? ts(x, start=1,frequency=4) # 将x转化为时间序列model...

四分位数(定义、位置、数值)

一、定义 四分位数(Quartile)是统计学中分位数的一种,即把所有数据由小到大排列并分成四等份,处于三个分割点位置的数据就是四分位数。 第一四分位数 (Q1),又称“下四分位数”,等于该样本中所有数据由小到大排列后第25%的数据。 第二...

结构方程模型(SEM)

结构方程这几年热度不减,有必要研究一下它的R语言实现过程,今天先复习一下结构方程的相关理论,参考吉林大学余翠林的ppt 一、  为什么使用SEM?  1、回归分析有几方面的限制: (1)不允许有多个因变量或输出变量 (2)中间变量不能包含在...

机器学习-多元线性回归

A. 用途: 可以用来预测,由多种因素影响的结果。 B. 建立公式: C. 求解方法: 方法1. Gradient Descent: 技巧: 技巧1. Feature Scaling: 何时用: 当各个变量的值域或者数量级相差比较大时, 需...

SAS的基本统计功能

来自 http://stat.smmu.edu.cn/course/sas04.htm §4.1 一些单变量检验问题 4.1.1 正态性检验 4.1.2 两独立样本的均值检验 4.1.3 成对总体均值检验 §4.2 回归分析 4.2.1 用...

时间序列

来自 http://m.blog.csdn.net/article/details?id=50654337 1、时间序列的分类 时间序列分为:非季节性数据和季节性数据 一个非季节性时间序列包含一个趋势部分和一个不规则部分。 一个季节性时间序...

R学习日记——时间序列分析之ARIMA模型预测

来自 http://blog.sina.com.cn/s/blog_70f632090101bnd8.html 今天学习ARIMA预测时间序列。  指数平滑法对于预测来说是非常有帮助的,而且它对时间序列上面连续的值之间相关性没有要求。但是,...

使用R语言进行异常检测

来自 http://youhaolin.blog.163.com/blog/static/224494120201422110628586/ 本文结合R语言,展示了异常检测的案例,主要内容如下: (1)单变量的异常检测 (2)使用LOF(l...

利用SPSS检验数据是否符合正态分布

来自 http://blog.sina.com.cn/s/blog_7dc56e6e0100qxjz.html 正态分布也叫常态分布,在我们后面说的很多东西都需要数据呈正态分布。下面的图就是正态分布曲线,中间隆起,对称向两边下降。 &nbs...

主成分分析的背景、理论及其三大应用

1.前期需要掌握的知识点及其相关课程: ⑴高等代数/线性代数:线性方程组、特征值和特征向量 ⑵统计学:方差分析等 2.主成分分析思想: 主成分分析是利用降维的思想,在损失较少信息的前提下,用几个综合指标来代替之前多个指标的一种多元统计方法。...

进行sobel检验

通常我们在做中介效应的时候,遇到有一个系数没有达到显著性水平,我们需要进行sobel检验,但是sobel检验的公式非常麻烦,如果你按计算器就很麻烦了,更何况你还有很多中介效应去验证,所以今天我给大家分享一个Excel可以很快的计算。 先下载...

典型相关分析

来自 http://blog.sina.com.cn/s/blog_50a9598801010xq3.html 1 什么时候用典型相关分析?    典型相关分析技术实际上是多元回归和相关分析的一种延伸。在多元回归分析中,为预测一个变量Y,要...

数据分析方法汇总

一、描述统计 描述性统计是指运用制表和分类,图形以及计筠概括性数据来描述数据的集中趋势、离散趋势、偏度、峰度。 1、缺失值填充:常用方法:剔除法、均值法、最小邻居法、比率\回归法、决策树法。 2、正态性检验:很多统计方法都要求数值服从或近似...

一个简单的马尔可夫链

在一个随机过程中,如果事件发生概率在t时刻所处的状态为已知时,它在t + 1时刻只与t时刻的状态有关,而与之前所处的状态无关,则称该过程具有马尔可夫性。 时间和状态都是离散的马尔可夫过程称为马尔可夫链。马尔可夫链在经济学,社会学,生命科学领...