• 登录
Skip to content

一起大数据-技术文章心得

一起大数据网由数据爱好者发起并维护,专注数据分析、挖掘、大数据相关领域的技术分享、交流。不定期组织爱好者聚会,期待通过跨行业的交流和碰撞,更好的推进各领域数据的价值落地。

Menu
  • 首页
  • 大数据案例
  • 数据&电子书
  • 视频
    • Excel视频
    • VBA视频
    • Mysql视频
    • 统计学视频
    • SPSS视频
    • R视频
    • SAS视频
    • Python视频
    • 数据挖掘视频
    • 龙星计划-数据挖掘
    • 大数据视频
    • Machine Learning with Python
  • 理论
    • 统计学
    • 数据分析
    • 机器学习
    • 大数据
  • 软件
    • Excel
    • Modeler
    • Python
    • R
    • SAS
    • SPSS
    • SQL
    • PostgreSQL
    • KNIME
  • 技术教程
    • SQL教程
    • SPSS简明教程
    • SAS教程
    • The Little SAS Book
    • SAS EG教程
    • R语言教程
    • Python3教程
    • IT 技术速查手册
    • Data Mining With Python and R
    • SAS Enterprise Miner
  • 问答社区
  • 我要提问
Menu

SPSS下如何进行对应分析

Posted on 2023年3月19日

 

何为对应分析

  1. 定义:对应分析又称关联分析、R-Q型因子分析,主要是揭示变量样品之间的相互关系的多元统计方法
  2. 应用场景:主要用于市场细分、产品定位等方面研究
  3. 条件:变量是名义变量或定序变量,行变量的类别取值与列变量相互独立,行、列变量构成的交叉频数表中不能有0值或负数
  4. 优点:
  • 名义变量划分的类别越多,这种分析的优势越明显
  • 可以将名义变量或定序变量转变为间距变量
  • 直观的在图形中展示变量各类别间的联系
  1. 缺点:
  • 不能用于相关关系的假设检验
  • 分析结果受易受到极端值的影响
  • 实质是降维,将原始数据按照一定规则以二维平面图形式展现,在此过程中部分信息会丢失

一、多元对应分析【SP:降维–最优尺度】

情景1:单选与单选

案例背景介绍:

某次调研中,有这样的一些问题:

  1. QA4_3.综合来讲,您认为一汽马自达品牌怎么样? 10分表示您认为这个品牌非常好,1分表示您认为这个品牌非常不好。打分题
  2. Q2. 您的性别是?【单选】


4. Q3. 您的学历是?【单选】

  1. Q4. 您的职业是?【单选】
  2. Q5. 您的年龄是?【单选】

需求介绍:

对于一汽马自达品牌的评价【QA4_3】分成两种情况,“”1-7“【对一马评价低】”与“8-10”【对一马评价高】,对Q2 Q3 Q4 Q5进行多元对应分析

实际操作:

具体的操作流程如下:

  1. 针对QA4_3的结果划分成两组,生成新变量NQA4_3
IF  (QA4_3 >= 1 & QA4_3  <= 7) NQA4_3=1.
IF  (QA4_3 >= 8 & QA4_3  <= 10) NQA4_3=2.
VARIABLE LABELS  NQA4_3 '对一马评价'.
VALUE LABELS   NQA4_3
1 '对一马评价低'
2 '对一马评价高'.
EXECUTE.
  1. Q4题的选项15【其他请注明】与实际的需求没有啥用处,需要Missing掉
  2. 进行多元对应分析
    手动操作:


    补充变量:将那些频数结果小的变量但是又不能丢弃的变量可以放到此处




    语法批量:
MULTIPLE CORRES VARIABLES=NQA4_3 Q2 Q3 Q4 Q5
/ANALYSIS=NQA4_3(WEIGHT=1) Q2(WEIGHT=1) Q3(WEIGHT=1) Q4(WEIGHT=1) Q5(WEIGHT=1) 
/MISSING=NQA4_3(PASSIVE,MODEIMPU) Q2(PASSIVE,MODEIMPU) Q3(PASSIVE,MODEIMPU) Q4(PASSIVE,MODEIMPU) 
Q5(PASSIVE,MODEIMPU) 
/DIMENSION=2
/NORMALIZATION=VPRINCIPAL
/MAXITER=100
/CRITITER=.00001
/PRINT=CORR DISCRIM QUANT(Q2 Q3 Q4 Q5 NQA4_3) 
/PLOT=OBJECT(20) JOINTCAT(Q2 Q3 Q4 Q5 NQA4_3) (20) 
DISCRIM (20).

通过修改上述语法中的变量名【NQA4_3 Q2 Q3 Q4 Q5】,可以实现批量快速获得所需的分析。

情景2:单选与多选

多选题的处理—数据重组【转置】

VARSTOCASES
  /ID=id
  /MAKE trans1 FROM QB2_1 QB2_2 QB2_3 QB2_4 QB2_5 QB2_6 QB2_7 QB2_8 QB2_9 QB2_10 QB2_11 QB2_12 
    QB2_13 QB2_14 QB2_15 QB2_16 QB2_17 QB2_18 QB2_19 QB2_20 QB2_21 QB2_22 QB2_23 QB2_24 QB2_25 QB2_26 
    QB2_27 QB2_28 QB2_29 QB2_30 QB2_31 QB2_32 QB2_33 QB2_34 QB2_35 QB2_36
  /MAKE trans2 FROM QB201_1 QB201_2 QB201_3 QB201_4 QB201_5 QB201_6 QB201_7 QB201_8 QB201_9 QB201_10 QB201_11 QB201_12 
    QB201_13 QB201_14 QB201_15 QB201_16 QB201_17 QB201_18 QB201_19 QB201_20 QB201_21 QB201_22 QB201_23 QB201_24 QB201_25 QB201_26 
    QB201_27 QB201_28 QB201_29 QB201_30 QB201_31 QB201_32 QB201_33 QB201_34 QB201_35 QB201_36
  /INDEX=索引1(36)
  /KEEP= Q2 Q4 Q5 Q7
  /NULL=drop.
注释:
  1. QB2、QB2-1是多选题,转置成单选的形式,转置的结果是trans1、trans2
  2. keep的意思是要保留那些变量
  3. null=drop 意思是将空的结果删除

多选题转置结果

由于转置【数据重组】操作是在原始数据库上操作的,因此需要将结果另存为一份新的数据库。后续的操作将在此数据库上操作。

二、简单对应分析【SP:降维–对应分析】

情景1:单选与单选

案例背景介绍:沿用前面的案例,此处不赘述

需求介绍:

以为NQ4_3【低、高】区分,对Q4题职业进行简单对应分析

实际操作:

手动操作:


针对上述的选择变量时有个小技巧,键盘上同时按着Q和4,可快速找到Q4变量。

此处是定义一下变量的取值范围,点击‘更新’。

语法批量:

CORRESPONDENCE TABLE=NQA4_3(1 2) BY Q4(1 14)
  /DIMENSIONS=2
  /MEASURE=CHISQ
  /STANDARDIZE=RCMEAN
  /NORMALIZATION=SYMMETRICAL
  /PRINT=TABLE RPOINTS CPOINTS
  /PLOT=NDIM(1,MAX) BIPLOT(20) RPOINTS(20) CPOINTS(20).

上述操作后没有跑出对应分析。具体的原因应该是只有一个维度,画不出对应分析图来。

情景2:单选与多选

将多选题重组成单选的形式,此时变成单选与单选操作,具体参照单选与单选的简单对应分析的操作步骤,此处不再重复介绍。

需求介绍:

以Q4题职业为区分,对QB2进行简单对应分析

实际操作:

手动操作:

语法批量:

CORRESPONDENCE TABLE=Q4(1 14) BY trans1(1 36)
  /DIMENSIONS=2
  /MEASURE=CHISQ
  /STANDARDIZE=RCMEAN
  /NORMALIZATION=SYMMETRICAL
  /PRINT=TABLE RPOINTS CPOINTS
  /PLOT=NDIM(1,MAX) BIPLOT(20).

三、结果展示【部分展示】



恭喜你,又看完一篇文章,扫码领个红包吧!图片

发表评论 取消回复

要发表评论,您必须先登录。

推荐访问

欢迎加入我们的付费交流社群,增长见识,互帮互助! 自2023-05-01起正式运营。
图片

数据分析交流:数据分析交流
Excel学习: Excel学习交流
Python交流:一起学习Python(数据分
SQL交流:一起学习SQL(数据分析
微博:一起大数据

最新提问

  • 统计方面的3个Python包
  • 更新R及Rstudio
  • TFP CausalImpact:一个Python包,用于估计设计干预对时间序列的因果效应
  • 根据公式的结构,写出计算的表达式,并结算结果
  • excel中提取超级链接公式中的链接地址
  • 用python解析公式并进行可视化
  • Python设置镜像源默认为清华的方法
  • VAR、VMA、VARMA 和 ARIMA
  • Python 的表达式解析库来解析公式
  • PandasAI:一个Python库,将生成式AI能力集成到Pandas中,允许进行高级数据分析任务,例如数据合成和增强

文章标签

AMOS CBC Excel GBDT KNN Modeler Mysql pandas PostgreSQL python python数据可视化 R SAS sklearn SPSS SQL SVM Tableau TensorFlow VBA 主成分分析 关联规则 决策树 协同过滤 可视化 因子分析 大数据 大数据分析 推荐系统 数据分析 数据可视化 数据挖掘 数据透视表 文本挖掘 时间序列 机器学习 深度学习 神经网络 结构方程 统计学 联合分析 聚类 聚类分析 逻辑回归 随机森林
©2023 一起大数据-技术文章心得 | Design: Newspaperly WordPress Theme