标签:数据分析

SPSS

SPSS数据分析—多重线性回归

12

xsmile 发布于 2017-07-24

来自 博客园 只有一个自变量和因变量的线性回归称为简单线性回归,但是实际上,这样单纯的关系在现实世界中几乎不存在,万事万物都是互相联系的,一个问题的产生必定多种因素共同作用的结果。 对于有多个自变量和一个因变量的线性回归称为多重线性回归,有的资料上称为多元线性回归,但我认为多元的...

阅读(59)评论(0)赞 (0)

R

信用卡评分模型(R语言)

18

xsmile 发布于 2017-05-09

from http://blog.csdn.net/csqazwsxedc/article/details/51225156 信用卡评分 2016年1月10日 一、数据准备 1、 问题的准备 •            目标:要完成一个评分卡,通过预测某人在未来两年内将会经历财务危...

阅读(1947)评论(0)赞 (9)

数据分析

数据可视化

24

xsmile 发布于 2017-03-08

from http://blog.sina.com.cn/s/blog_7ed6001f0102x1vh.html 1、数据可视化概述 1.1、数据可视化的作用     数据可视化是指将数据通过图表的方式传递出来,让用户能够快速、准确地理解信息所要表达的内容,从而提高沟通效率。数...

阅读(1765)评论(0)赞 (7)

SPSS

SPSS数据分析—单因素及多因素方差分析

29

xsmile 发布于 2017-01-24

t检验可以解决单样本、两个样本时的均值比较问题,但是对于两个以上样本,就不能用t检验了,而要使用方差分析。t检验是借助t分布,方差分析是借助F分布,基于变异分解的思想进行。 在算法上,由于线性模型的引入,在SPSS中,方差分析在比较均值、一般线性模型菜单中都可以做。 在适用条件上...

阅读(1467)评论(0)赞 (0)

SPSS

SPSS数据分析——t检验

6

xsmile 发布于 2017-01-24

SPSS中t检验全都集中在分析—比较均值菜单中。关于t检验再简单说一下,我们知道一个统计结果需要表达三部分内容,即集中性、变异性、显著性。 集中性的表现指标是均值 变异的的表现指标是方差、标准差或标准误 显著性的则是根据统计量判断是否达到显著性水平 由于t分布样本均值的抽样分布,...

阅读(1273)评论(0)赞 (0)

数据分析

互信息

2

xsmile 发布于 2017-01-23

互信息(Mutual Information)是度量两个事件集合之间的相关性(mutual dependence)。 平均互信息量定义:     互信息量I(xi;yj)在联合概率空间P(XY)中的统计平均值。 平均互信息I(X;Y)克服了互信息量I(xi;yj)的随机...

阅读(582)评论(0)赞 (0)

SPSS

SPSS数据分析—描述性统计分析

14

xsmile 发布于 2017-01-20

描述性统计分析是针对数据本身而言,用统计学指标描述其特征的分析方法,这种描述看似简单,实际上却是很多高级分析的基础工作,很多高级分析方法对于数据都有一定的假设和适用条件,这些都可以通过描述性统计分析加以判断,我们也会发现,很多分析方法的结果中,或多或少都会穿插一些描述性分析的结果...

阅读(1740)评论(0)赞 (5)

SPSS

SPSS常用基础操作—连续变量离散化

2

xsmile 发布于 2017-01-20

首先说一下什么是离散化以及连续变量离散化的必要性。 离散化是把无限空间中无限的个体映射到有限的空间中去,通俗点讲就是把连续型数据切分为若干“段”,也称bin,离散化在数据分析中特别是数据挖掘中被普遍采用,主要原因有: 1.算法需要。有些数据挖掘算法不能直接使用连续变量,必须要离散...

阅读(733)评论(0)赞 (0)

SPSS

SPSS常用基础操作—变量分组

5

xsmile 发布于 2017-01-20

有时我们需要对数据资料按照某个规则进行归组,如 在上述资料中,想按照年龄进行分组,30岁以下为组1,30-40岁为组2,40岁以上为组3 有两种方法可以实现: 1.使用计算变量功能 <1>打开转换-计算变量菜单,定义组变量名group,并在数字表达式中赋值为1,点击确...

阅读(843)评论(0)赞 (1)

R

R语言与正态性检验

xsmile 发布于 2017-01-19

from http://www.cnblogs.com/xmdata-analysis/p/4670841.html 1.Kolmogorov-Smirnov正态性检验 Kolmogorov-Smirnov是比较一个频率分布f(x)与理论分布g(x)或者两个观测值分布的检验方法,...

阅读(1407)评论(0)赞 (0)

SPSS

SPSS数据分析—对应分析

22

xsmile 发布于 2017-01-19

from http://www.cnblogs.com/xmdata-analysis/p/5648393.html 卡方检验只能对两个分类变量之间是否存在联系进行检验,如果分类变量有多个水平的话,则无法衡量每个水平间的联系。对此,虽然可以使用逻辑回归进行建模,但是如果分类变量的...

阅读(1233)评论(0)赞 (1)

数据分析

决策树剪枝

26

xsmile 发布于 2017-01-11

from http://www.cnblogs.com/yonghao/p/5064996.html 什么是剪枝? 剪枝是指将一颗子树的子节点全部删掉,根节点作为叶子节点,以下图为例:   为甚么要剪枝? 决策树是充分考虑了所有的数据点而生成的复杂树,有可能出现过拟合的...

阅读(907)评论(0)赞 (1)

R

需求预测我喜欢用ARIMA模型

25

xsmile 发布于 2017-01-09

本文结构: 时间序列分析? 什么是ARIMA? ARIMA数学模型? input,output 是什么? 怎么用?-代码实例 常见问题? 时间序列分析? 时间序列,就是按时间顺序排列的,随时间变化的数据序列。 生活中各领域各行业太多时间序列的数据了,销售额,顾客数,访问量,股价,...

阅读(1425)评论(0)赞 (1)