标签:数据分析

SPSS

SPSS数据分析—单因素及多因素方差分析

29

xsmile 发布于 2017-01-24

t检验可以解决单样本、两个样本时的均值比较问题,但是对于两个以上样本,就不能用t检验了,而要使用方差分析。t检验是借助t分布,方差分析是借助F分布,基于变异分解的思想进行。 在算法上,由于线性模型的引入,在SPSS中,方差分析在比较均值、一般线性模型菜单中都可以做。 在适用条件上...

阅读(284)评论(0)赞 (0)

SPSS

SPSS数据分析——t检验

6

xsmile 发布于 2017-01-24

SPSS中t检验全都集中在分析—比较均值菜单中。关于t检验再简单说一下,我们知道一个统计结果需要表达三部分内容,即集中性、变异性、显著性。 集中性的表现指标是均值 变异的的表现指标是方差、标准差或标准误 显著性的则是根据统计量判断是否达到显著性水平 由于t分布样本均值的抽样分布,...

阅读(237)评论(0)赞 (0)

数据分析

互信息

2

xsmile 发布于 2017-01-23

互信息(Mutual Information)是度量两个事件集合之间的相关性(mutual dependence)。 平均互信息量定义:     互信息量I(xi;yj)在联合概率空间P(XY)中的统计平均值。 平均互信息I(X;Y)克服了互信息量I(xi;yj)的随机...

阅读(188)评论(0)赞 (0)

SPSS

SPSS数据分析—描述性统计分析

14

xsmile 发布于 2017-01-20

描述性统计分析是针对数据本身而言,用统计学指标描述其特征的分析方法,这种描述看似简单,实际上却是很多高级分析的基础工作,很多高级分析方法对于数据都有一定的假设和适用条件,这些都可以通过描述性统计分析加以判断,我们也会发现,很多分析方法的结果中,或多或少都会穿插一些描述性分析的结果...

阅读(279)评论(0)赞 (1)

SPSS

SPSS常用基础操作—连续变量离散化

2

xsmile 发布于 2017-01-20

首先说一下什么是离散化以及连续变量离散化的必要性。 离散化是把无限空间中无限的个体映射到有限的空间中去,通俗点讲就是把连续型数据切分为若干“段”,也称bin,离散化在数据分析中特别是数据挖掘中被普遍采用,主要原因有: 1.算法需要。有些数据挖掘算法不能直接使用连续变量,必须要离散...

阅读(162)评论(0)赞 (0)

SPSS

SPSS常用基础操作—变量分组

5

xsmile 发布于 2017-01-20

有时我们需要对数据资料按照某个规则进行归组,如 在上述资料中,想按照年龄进行分组,30岁以下为组1,30-40岁为组2,40岁以上为组3 有两种方法可以实现: 1.使用计算变量功能 <1>打开转换-计算变量菜单,定义组变量名group,并在数字表达式中赋值为1,点击确...

阅读(159)评论(0)赞 (0)

R

R语言与正态性检验

xsmile 发布于 2017-01-19

from http://www.cnblogs.com/xmdata-analysis/p/4670841.html 1.Kolmogorov-Smirnov正态性检验 Kolmogorov-Smirnov是比较一个频率分布f(x)与理论分布g(x)或者两个观测值分布的检验方法,...

阅读(207)评论(0)赞 (0)

SPSS

SPSS数据分析—对应分析

22

xsmile 发布于 2017-01-19

from http://www.cnblogs.com/xmdata-analysis/p/5648393.html 卡方检验只能对两个分类变量之间是否存在联系进行检验,如果分类变量有多个水平的话,则无法衡量每个水平间的联系。对此,虽然可以使用逻辑回归进行建模,但是如果分类变量的...

阅读(265)评论(0)赞 (0)

数据分析

决策树剪枝

26

xsmile 发布于 2017-01-11

from http://www.cnblogs.com/yonghao/p/5064996.html 什么是剪枝? 剪枝是指将一颗子树的子节点全部删掉,根节点作为叶子节点,以下图为例:   为甚么要剪枝? 决策树是充分考虑了所有的数据点而生成的复杂树,有可能出现过拟合的...

阅读(236)评论(0)赞 (1)

R

需求预测我喜欢用ARIMA模型

25

xsmile 发布于 2017-01-09

本文结构: 时间序列分析? 什么是ARIMA? ARIMA数学模型? input,output 是什么? 怎么用?-代码实例 常见问题? 时间序列分析? 时间序列,就是按时间顺序排列的,随时间变化的数据序列。 生活中各领域各行业太多时间序列的数据了,销售额,顾客数,访问量,股价,...

阅读(475)评论(0)赞 (0)

数据分析

分析师教你 | 如何科学地在上海拍车牌

8

xsmile 发布于 2016-12-06

在拍沪牌这场战争中,谁都不想当炮灰,如何科学地在上海拍车牌?作为城市数据研究院的分析师老司机,院草告诉你答案。 为了给懒癌晚期的同学多一点临终关怀,院草贴心为大家准备了两个版本的拍车牌教程: 1.比鱿鱼还干的干货【拍沪牌一张图攻略】 (请直接下拉到文末查看) 2.老司机带带你之详...

阅读(323)评论(0)赞 (0)

R

用R来做时间序列

xsmile 发布于 2016-12-04

from http://blog.sina.com.cn/s/blog_6bb07f830100xh0y.html 第一部分:怎么将数组转化为时间序列? ts(x, start=1,frequency=4) # 将x转化为时间序列model 通常状况下,当frequency=4,...

阅读(309)评论(0)赞 (0)

数据分析

结构方程模型(SEM)

3

xsmile 发布于 2016-11-29

结构方程这几年热度不减,有必要研究一下它的R语言实现过程,今天先复习一下结构方程的相关理论,参考吉林大学余翠林的ppt 一、  为什么使用SEM?  1、回归分析有几方面的限制: (1)不允许有多个因变量或输出变量 (2)中间变量不能包含在与预测因子一样的单一模型中 (3)预测因...

阅读(431)评论(0)赞 (2)

SAS

SAS的基本统计功能

121

xsmile 发布于 2016-11-10

来自 http://stat.smmu.edu.cn/course/sas04.htm §4.1 一些单变量检验问题 4.1.1 正态性检验 4.1.2 两独立样本的均值检验 4.1.3 成对总体均值检验 §4.2 回归分析 4.2.1 用SAS/INSIGHT进行曲线拟合 4....

阅读(496)评论(0)赞 (1)

数据分析

时间序列

xsmile 发布于 2016-11-02

来自 http://m.blog.csdn.net/article/details?id=50654337 1、时间序列的分类 时间序列分为:非季节性数据和季节性数据 一个非季节性时间序列包含一个趋势部分和一个不规则部分。 一个季节性时间序列包含一个趋势部分,一个季节性部分和一个...

阅读(481)评论(0)赞 (1)

数据分析

数据分析师的思维是如何练出来的?

3

xsmile 发布于 2016-10-14

作者:ONES_AI 一名数据分析师的日常工作流是怎样的? 「数据分析师」这个职位,不同的公司,不同的行业,对于它的理解,以及它覆盖的工作范围不太一样。在有些传统行业,数据分析师工作重点是「做行业报告」等;在阿里巴巴等大型互联网公司,职位区分比较明确,数据分析师大部分时间只做产品...

阅读(450)评论(1)赞 (11)

数据分析

2017校招数据分析岗笔试/面试知识点

3

xsmile 发布于 2016-10-14

作者:蓝先生 2017校招正在火热的进行,后面会不断更新涉及到的相关知识点。 尽管听说今年几个大互联网公司招的人超少,但好像哪一年都说是就业困难,能够进去当然最好,不能进去是不是应该也抱着好的期望去找自己满意的呢? 最近笔试了很多家公司校招的数据分析和数据挖掘岗位,今天(9.18...

阅读(689)评论(0)赞 (11)