统计学

通俗理解T检验与F检验的区别

xsmile 发布于 2017-02-08

from http://blog.sina.com.cn/s/blog_4ee13c2c01016div.html 1,T检验和F检验的由来 一般而言,为了确定从样本(sample)统计结果推论至总体时所犯错的概率,我们会利用统计学家所开发的一些统计方法,进行统计检定。 通过把所...

阅读(223)评论(0)赞 (1)

SPSS数据分析—单因素及多因素方差分析

29

xsmile 发布于 2017-01-24

t检验可以解决单样本、两个样本时的均值比较问题,但是对于两个以上样本,就不能用t检验了,而要使用方差分析。t检验是借助t分布,方差分析是借助F分布,基于变异分解的思想进行。 在算法上,由于线性模型的引入,在SPSS中,方差分析在比较均值、一般线性模型菜单中都可以做。 在适用条件上...

阅读(283)评论(0)赞 (0)

SPSS数据分析——t检验

6

xsmile 发布于 2017-01-24

SPSS中t检验全都集中在分析—比较均值菜单中。关于t检验再简单说一下,我们知道一个统计结果需要表达三部分内容,即集中性、变异性、显著性。 集中性的表现指标是均值 变异的的表现指标是方差、标准差或标准误 显著性的则是根据统计量判断是否达到显著性水平 由于t分布样本均值的抽样分布,...

阅读(235)评论(0)赞 (0)

R语言与正态性检验

xsmile 发布于 2017-01-19

from http://www.cnblogs.com/xmdata-analysis/p/4670841.html 1.Kolmogorov-Smirnov正态性检验 Kolmogorov-Smirnov是比较一个频率分布f(x)与理论分布g(x)或者两个观测值分布的检验方法,...

阅读(206)评论(0)赞 (0)

SPSS数据分析—对应分析

22

xsmile 发布于 2017-01-19

from http://www.cnblogs.com/xmdata-analysis/p/5648393.html 卡方检验只能对两个分类变量之间是否存在联系进行检验,如果分类变量有多个水平的话,则无法衡量每个水平间的联系。对此,虽然可以使用逻辑回归进行建模,但是如果分类变量的...

阅读(264)评论(0)赞 (0)

对应分析

xsmile 发布于 2017-01-18

日常分析中,经常会做的是研究变量间的关系,对于分类变量,常用的方法是卡方检验、Logistic模型等,但是对于分类变量很多,或者分类变量的类别很多时,用上述方法除了就会非常复杂,并且结果解释起来也不够直观,此时,可以使用对应分析加以分析。 对应分析也称为关联分析,是一种多元统计分...

阅读(261)评论(0)赞 (2)

决策树的剪枝理论

4

xsmile 发布于 2017-01-11

剪枝理论,决策树的剪枝在上一节中没有仔细讲,趁这个机会学习了剪枝的基础理论,这里会详细学习。 决策树为什么(WHY)要剪枝?原因是避免决策树过拟合(Overfitting)样本。前面的算法生成的决策树非常详细并且庞大,每个属性都被详细地加以考虑,决策树的树叶节点所覆盖的训练样本都...

阅读(470)评论(0)赞 (2)

决策树剪枝

26

xsmile 发布于 2017-01-11

from http://www.cnblogs.com/yonghao/p/5064996.html 什么是剪枝? 剪枝是指将一颗子树的子节点全部删掉,根节点作为叶子节点,以下图为例:   为甚么要剪枝? 决策树是充分考虑了所有的数据点而生成的复杂树,有可能出现过拟合的...

阅读(236)评论(0)赞 (1)

联合分析之CBC模型

12

xsmile 发布于 2016-12-07

by sandy http://isux.tencent.com/choice-based-conjoint.html 作为付费的企业级产品,随着开放平台应用的增多,我们需要考虑不同市场对不同应用或组合的偏好,以及组合价格对企业用户的吸引力。借着“企业QQ平台应用价格研究”,梳理...

阅读(167)评论(0)赞 (2)

联合分析及案例应用

xsmile 发布于 2016-12-07

结合分析 联合分析又称结合分析(conjoint analysis)是一种有效的市场研究技术,近年来广泛应用于消费品、工业产品和商业服务等相关领域的市场研究中,尤其是在新产品开发、市场占有率分析、竞争分析、市场细分和价格策略等方面,结合分析在我国也越来越受到市场研究公司和企业的重...

阅读(437)评论(0)赞 (4)

用R来做时间序列

xsmile 发布于 2016-12-04

from http://blog.sina.com.cn/s/blog_6bb07f830100xh0y.html 第一部分:怎么将数组转化为时间序列? ts(x, start=1,frequency=4) # 将x转化为时间序列model 通常状况下,当frequency=4,...

阅读(308)评论(0)赞 (0)

四分位数(定义、位置、数值)

xsmile 发布于 2016-12-03

一、定义 四分位数(Quartile)是统计学中分位数的一种,即把所有数据由小到大排列并分成四等份,处于三个分割点位置的数据就是四分位数。 第一四分位数 (Q1),又称“下四分位数”,等于该样本中所有数据由小到大排列后第25%的数据。 第二四分位数 (Q2),又称“中位数”,等于...

阅读(232)评论(0)赞 (0)

结构方程模型(SEM)

3

xsmile 发布于 2016-11-29

结构方程这几年热度不减,有必要研究一下它的R语言实现过程,今天先复习一下结构方程的相关理论,参考吉林大学余翠林的ppt 一、  为什么使用SEM?  1、回归分析有几方面的限制: (1)不允许有多个因变量或输出变量 (2)中间变量不能包含在与预测因子一样的单一模型中 (3)预测因...

阅读(431)评论(0)赞 (2)

机器学习-多元线性回归

18

xsmile 发布于 2016-11-23

A. 用途: 可以用来预测,由多种因素影响的结果。 B. 建立公式: C. 求解方法: 方法1. Gradient Descent: 技巧: 技巧1. Feature Scaling: 何时用: 当各个变量的值域或者数量级相差比较大时, 需要将各个变量的值域变换到相似的水平, 变...

阅读(404)评论(0)赞 (0)

SAS的基本统计功能

121

xsmile 发布于 2016-11-10

来自 http://stat.smmu.edu.cn/course/sas04.htm §4.1 一些单变量检验问题 4.1.1 正态性检验 4.1.2 两独立样本的均值检验 4.1.3 成对总体均值检验 §4.2 回归分析 4.2.1 用SAS/INSIGHT进行曲线拟合 4....

阅读(496)评论(0)赞 (1)

时间序列

xsmile 发布于 2016-11-02

来自 http://m.blog.csdn.net/article/details?id=50654337 1、时间序列的分类 时间序列分为:非季节性数据和季节性数据 一个非季节性时间序列包含一个趋势部分和一个不规则部分。 一个季节性时间序列包含一个趋势部分,一个季节性部分和一个...

阅读(479)评论(0)赞 (1)

R学习日记——时间序列分析之ARIMA模型预测

9

xsmile 发布于 2016-10-12

来自 http://blog.sina.com.cn/s/blog_70f632090101bnd8.html 今天学习ARIMA预测时间序列。  指数平滑法对于预测来说是非常有帮助的,而且它对时间序列上面连续的值之间相关性没有要求。但是,如果你想使用指数平滑法计算出预测区间, ...

阅读(784)评论(2)赞 (3)

使用R语言进行异常检测

13

xsmile 发布于 2016-10-12

来自 http://youhaolin.blog.163.com/blog/static/224494120201422110628586/ 本文结合R语言,展示了异常检测的案例,主要内容如下: (1)单变量的异常检测 (2)使用LOF(local outlier factor,...

阅读(701)评论(0)赞 (3)