统计学

偏最小二乘法介绍及应用

1

xsmile 发布于 2017-04-30

本文由一起大数据网整理,转载请保留原文链接。 为了更好的理解PLS,推荐大家先学习回归分析、典型相关分析和主成分分析相关知识内容(这些内容在SPSS视频教程里都有)。 第一部分:概念与诊断(来自百度百科) 偏最小二乘法,它通过最小化误差的平方和找到一组数据的最佳函数匹配。 用最简...

阅读(648)评论(0)赞 (3)

SAS聚类分析

3

xsmile 发布于 2017-04-12

from http://blog.163.com/zzz216@yeah/blog/static/16255468420121105146675/ 1 用CLUSTER过程和TREE过程进行谱系聚类 一、CLUSTER过程用法 CLUSTER过程的一般格式为: PROC CLUS...

阅读(571)评论(0)赞 (0)

SAS回归分析

2

xsmile 发布于 2017-04-12

from http://blog.163.com/zzz216@yeah/blog/static/16255468420121665447465/ 1.用SAS/INSIGHT进行曲线拟合    拟合回归直线,“analyse-fit”,选择相应的自变量和因变量,既可以自动拟合出...

阅读(768)评论(0)赞 (1)

SAS多变量分析-因子分析

4

xsmile 发布于 2017-04-11

from http://blog.163.com/zzz216@yeah/blog/static/16255468420121105745404/ FACTOR过程使用 SAS/STAT的FACTOR过程可以进行因子分析、分量分析和因子旋转。对因子模型可以使用正交旋转和斜交旋转,...

阅读(686)评论(0)赞 (3)

通俗理解T检验与F检验的区别

xsmile 发布于 2017-02-08

from http://blog.sina.com.cn/s/blog_4ee13c2c01016div.html 1,T检验和F检验的由来 一般而言,为了确定从样本(sample)统计结果推论至总体时所犯错的概率,我们会利用统计学家所开发的一些统计方法,进行统计检定。 通过把所...

阅读(784)评论(0)赞 (1)

SPSS数据分析—单因素及多因素方差分析

29

xsmile 发布于 2017-01-24

t检验可以解决单样本、两个样本时的均值比较问题,但是对于两个以上样本,就不能用t检验了,而要使用方差分析。t检验是借助t分布,方差分析是借助F分布,基于变异分解的思想进行。 在算法上,由于线性模型的引入,在SPSS中,方差分析在比较均值、一般线性模型菜单中都可以做。 在适用条件上...

阅读(1165)评论(0)赞 (0)

SPSS数据分析——t检验

6

xsmile 发布于 2017-01-24

SPSS中t检验全都集中在分析—比较均值菜单中。关于t检验再简单说一下,我们知道一个统计结果需要表达三部分内容,即集中性、变异性、显著性。 集中性的表现指标是均值 变异的的表现指标是方差、标准差或标准误 显著性的则是根据统计量判断是否达到显著性水平 由于t分布样本均值的抽样分布,...

阅读(1024)评论(0)赞 (0)

R语言与正态性检验

xsmile 发布于 2017-01-19

from http://www.cnblogs.com/xmdata-analysis/p/4670841.html 1.Kolmogorov-Smirnov正态性检验 Kolmogorov-Smirnov是比较一个频率分布f(x)与理论分布g(x)或者两个观测值分布的检验方法,...

阅读(1102)评论(0)赞 (0)

SPSS数据分析—对应分析

22

xsmile 发布于 2017-01-19

from http://www.cnblogs.com/xmdata-analysis/p/5648393.html 卡方检验只能对两个分类变量之间是否存在联系进行检验,如果分类变量有多个水平的话,则无法衡量每个水平间的联系。对此,虽然可以使用逻辑回归进行建模,但是如果分类变量的...

阅读(1016)评论(0)赞 (1)

对应分析

xsmile 发布于 2017-01-18

日常分析中,经常会做的是研究变量间的关系,对于分类变量,常用的方法是卡方检验、Logistic模型等,但是对于分类变量很多,或者分类变量的类别很多时,用上述方法除了就会非常复杂,并且结果解释起来也不够直观,此时,可以使用对应分析加以分析。 对应分析也称为关联分析,是一种多元统计分...

阅读(637)评论(0)赞 (3)

决策树的剪枝理论

4

xsmile 发布于 2017-01-11

剪枝理论,决策树的剪枝在上一节中没有仔细讲,趁这个机会学习了剪枝的基础理论,这里会详细学习。 决策树为什么(WHY)要剪枝?原因是避免决策树过拟合(Overfitting)样本。前面的算法生成的决策树非常详细并且庞大,每个属性都被详细地加以考虑,决策树的树叶节点所覆盖的训练样本都...

阅读(1022)评论(0)赞 (2)

决策树剪枝

26

xsmile 发布于 2017-01-11

from http://www.cnblogs.com/yonghao/p/5064996.html 什么是剪枝? 剪枝是指将一颗子树的子节点全部删掉,根节点作为叶子节点,以下图为例:   为甚么要剪枝? 决策树是充分考虑了所有的数据点而生成的复杂树,有可能出现过拟合的...

阅读(726)评论(0)赞 (1)

联合分析之CBC模型

12

xsmile 发布于 2016-12-07

by sandy http://isux.tencent.com/choice-based-conjoint.html 作为付费的企业级产品,随着开放平台应用的增多,我们需要考虑不同市场对不同应用或组合的偏好,以及组合价格对企业用户的吸引力。借着“企业QQ平台应用价格研究”,梳理...

阅读(503)评论(0)赞 (3)

联合分析及案例应用

xsmile 发布于 2016-12-07

结合分析 联合分析又称结合分析(conjoint analysis)是一种有效的市场研究技术,近年来广泛应用于消费品、工业产品和商业服务等相关领域的市场研究中,尤其是在新产品开发、市场占有率分析、竞争分析、市场细分和价格策略等方面,结合分析在我国也越来越受到市场研究公司和企业的重...

阅读(1392)评论(0)赞 (4)

用R来做时间序列

xsmile 发布于 2016-12-04

from http://blog.sina.com.cn/s/blog_6bb07f830100xh0y.html 第一部分:怎么将数组转化为时间序列? ts(x, start=1,frequency=4) # 将x转化为时间序列model 通常状况下,当frequency=4,...

阅读(896)评论(0)赞 (2)

四分位数(定义、位置、数值)

xsmile 发布于 2016-12-03

一、定义 四分位数(Quartile)是统计学中分位数的一种,即把所有数据由小到大排列并分成四等份,处于三个分割点位置的数据就是四分位数。 第一四分位数 (Q1),又称“下四分位数”,等于该样本中所有数据由小到大排列后第25%的数据。 第二四分位数 (Q2),又称“中位数”,等于...

阅读(603)评论(0)赞 (0)

结构方程模型(SEM)

3

xsmile 发布于 2016-11-29

结构方程这几年热度不减,有必要研究一下它的R语言实现过程,今天先复习一下结构方程的相关理论,参考吉林大学余翠林的ppt 一、  为什么使用SEM?  1、回归分析有几方面的限制: (1)不允许有多个因变量或输出变量 (2)中间变量不能包含在与预测因子一样的单一模型中 (3)预测因...

阅读(1273)评论(0)赞 (4)

机器学习-多元线性回归

18

xsmile 发布于 2016-11-23

A. 用途: 可以用来预测,由多种因素影响的结果。 B. 建立公式: C. 求解方法: 方法1. Gradient Descent: 技巧: 技巧1. Feature Scaling: 何时用: 当各个变量的值域或者数量级相差比较大时, 需要将各个变量的值域变换到相似的水平, 变...

阅读(970)评论(0)赞 (0)