• 登录
Skip to content

一起大数据-技术文章心得

一起大数据网由数据爱好者发起并维护,专注数据分析、挖掘、大数据相关领域的技术分享、交流。不定期组织爱好者聚会,期待通过跨行业的交流和碰撞,更好的推进各领域数据的价值落地。

Menu
  • 首页
  • 大数据案例
  • 数据&电子书
  • 视频
    • Excel视频
    • VBA视频
    • Mysql视频
    • 统计学视频
    • SPSS视频
    • R视频
    • SAS视频
    • Python视频
    • 数据挖掘视频
    • 龙星计划-数据挖掘
    • 大数据视频
    • Machine Learning with Python
  • 理论
    • 统计学
    • 数据分析
    • 机器学习
    • 大数据
  • 软件
    • Excel
    • Modeler
    • Python
    • R
    • SAS
    • SPSS
    • SQL
    • PostgreSQL
    • KNIME
  • 技术教程
    • SQL教程
    • SPSS简明教程
    • SAS教程
    • The Little SAS Book
    • SAS EG教程
    • R语言教程
    • Python3教程
    • IT 技术速查手册
    • Data Mining With Python and R
    • SAS Enterprise Miner
  • 问答社区
  • 我要提问
Menu

验证性因子分析和AMOS实现

Posted on 2023年4月25日

1 准备:验证性因子分析和AMOS软件介绍

1.1 验证性因子分析

得到初步模型后,现在通过样本数据来验证假设的模型结构是否合理,像题项与潜变量的关系,潜在变量之间的关系等。显潜变量又分为外生变量(在模型中不受其他变量的影响,值由外部输入决定)和内生变量(受模型中其他变量的影响),必须由可靠的理论依据构建。

1.2 模型检查和准备

  • 小样本容易导致收敛失败,低估参数值,根据过往经验,样本量通常应大于100(不是绝对,要参考变量数量);
  • 检查有无缺失值,依据实际情况选择合适的替换方法或删除;
  • 如有潜在因素,模型潜变量应至少有2个,每个潜变量应至少对应3个条目;
  • 模型中需要固定某项参数作为度量标准。习惯上可以固定载荷,即固定某个测量指标路径系数为1;或固定方差,即固定潜变量方差为1。

1.3 AMOS绘制模型

2 参数估计方法选择

  • Maximum likelihood是最广泛使用的估计方法,适用于大样本,并且数据符合多变量正态性(multivariate normal distribution) 的情况。
  • 当观察变量有序,呈非正态性分布或严重偏态分布时,加权最小二乘估计(Weighted least squares estimation) 被广泛使用。WLS寻找一个合适的权重,对原模型加权使之变成一个新的不存在异方差性的模型,来消除异方差性。
  • 广义最小二乘法(Generalized least squares estimation)也用于异方差模型,两类错误率均随相关系数或样本量的增加而减小。有资料显示,对于大样本(显变量个数的20倍以上),GLS的结果相对可靠(焦辛妮,2015)。

3 实例

我们来看一个较为简单的例子,从Holzinger和Swineford在芝加哥七、八年级学生中进行的心理测试中抽取其中一间女校(固定人群和性别)的视觉感知(visperc)、空间想象(cubes)、方向感(lozengens)、阅读理解(paragrap)、句子填空(sentence)和词义理解(wordmean)的分数这6项,组成数据集。潜变量为语言能力(verbal)和空间能力(spatial)。

4 输出结果分析

在View菜单的Text output可以看到全部输出结果,包括变量的描述性统计信息,回归系数,模型拟合指标等。

上图是中学生测试例子的基本输出结果,带箭头的是路径系数,可以看到两个潜变量空间能力和语言能力之间的路径系数,协方差,显变量与潜变量之间的路径系数,以及路径是否显著。在本例中,除空间能力→视觉感知和语言能力→阅读理解两条路径外,其他路径的P值都很小,提示路径显著。标准化的结果只是改变了单位,使参数估计值更容易看。有时,路径系数也可为负,提示负相关。

点击小按钮

已绘制的模型中即显示结果,下图分别为非标准化的结果,和标准化结果。

非标准化的结果
标准化结果

5 模型评价指标

在AMOS的输出结果中,分别有默认模型,饱和模型和独立模型三种,其中默认模型是我们自己建立的模型,饱和模型是包含所有变量关系的模型,自由度为0,独立模型是所有变量相互独立的模型,协方差为0。如下图,关系错综复杂的是饱和模型,各变量独立自主,自力更生的是独立模型。

在输出的Model Fit中可以看到很多模型拟合评价指标,这里选几个较为常用的介绍一下。

RMSEA(Root Mean Square Error of Approximation) 是评价模型不拟合的指数,一般RMSEA≤.05表示拟合较好,.05到.08 之间表示模型拟合合理,>.01表示拟合较差。LO 90 和 HI 90 是90%CI的上下限。PCLOSE 是零假设RMSEA不大于.05的P值。

RMR(the root mean square residual)通过对比预测相关和实际观测相关的平均残差衡量拟合程度,越小越好,一般<.05则认为拟合较好。但RMR很容易受到量尺的影响,出现甚至大于1的情况(如上图),需要在Plugins菜单下选择输出标准化后的SRMR。

GFI(the goodness of fit index), 就是R²,越接近1越好,一般认为大于0.9拟合较好。

AGFI (adjusted GFI) 是调整R² ,考虑了样本量和自变量个数的影响进行调整。

NFI (Normed-fit index) 通过对比拟合模型和零模型χ2的值评价模型,值在0到1之间,通常认为大于0.90拟合较好。对样本量敏感,在样本小于200时易低估拟合(Mulaik et al, 1989; Bentler, 1990)。NNFI(也叫Tucker-Lewis index), 修正了该不足,可以适用于简单模型,但在小样本时,NNFI可指示拟合不良,尽管在其他指数显示拟合较好的时候(Bentler, 1990; Kline, 2005; Tabachnick and Fidell, 2007)。NNFI大于0.90可接受。

CFI (Comparative fit index) 是考虑小样本情况的修正。该指数假设潜变量不相关,将协方差矩阵与零模型对比,取值在0到1之间,越接近1越好。一般认为大于0.95较好。

6 模型修正

有时,模型不尽如人意需要修正,在Analysis Properties下的OUTPUT菜单的修正指数(Modification indices)提供修正模型的参考。修正指数是指对于模型中某个受限制的参数,若容许自由估计,模型改良时将减少的最小卡方值,对于模型修正提供建议。

一般先从MI值最大的项开始看,如上图的例子,残差eps1和eps3间的MI值最大,即可以考虑去掉eps1与eps3间的约束条件(该例约束条件为相关系数是0,则考虑允许相关),卡方估计值至少将减少40.911。

注意修改模型需结合实际,去掉约束条件要符合实际情况。

7 AMOS其他因子分析功能

  • 研究某一因子分析模型是否能在不同组间适用,可在Analyze 菜单下选择Manage Groups,如上面中学生心理测试的例子,就可以分析同一模型在男生中的效果;
  • 根据Sörbom (1974),如果数据来自多组(如不同人群),可估计不同组别的因子均值之差 ,但不能估计每组的每个因子的均值。如上例,可以估计男生和女生在语言表达和空间能力上的均值差异。在AMOS中Analysis Properties中勾选Estimate means and intercepts,并进行intercepts命名等相关操作;
  • 在Analysis Properties菜单下的Bootstrap选项可进行多次重复抽样;
  • 在Analyze菜单下的Specification Search可进行探索性因子分析;
  • 等等等等……

# 想要进一步学习AMOS的同学可以下载James L. Arbuckle的AMOS官方指南,内容系统详尽,戳网址:http://www.sussex.ac.uk/its/pdfs/Amos_20_User_Guide.pdf

-END-

参考文献

  • 《结构方程模型——AMOS的操作与应用》一书,吴明隆著
  • 焦辛妮, 汪东伟, 王长义, et al. 结构方程模型GLS与WLS性能比较[J]. 中国公共卫生, 2015, 31(9):1225-1229.
  • Arpaci I, Baloğlu M. The impact of cultural collectivism on knowledge sharing among information technology majoring undergraduates[J]. Computers in Human Behavior, 2016, 56:65-71.
  • P C S Rajaram, R & K Dhanalakshmi, Mrs. (2019). A SEM Approach to Evaluation of Whirlpool Retail Executive’s Talent-an Empirical Study.
  • Hooper, Daire & Coughlan, Joseph & R. Mullen, Michael. (2007). Structural Equation Modeling: Guidelines for Determining Model Fit. The Electronic Journal of Business Research Methods. 6.
  • Ingram, K. L., Cope, J. G., Harju, B. L., & Wuensch, K. L. Applying to graduate school: A test of the theory of planned behavior[J]. Journal of Social Behavior and Personality, 2000,15, 215-226.
  • Zahoor, H.; Chan, A.P.C.; Utama, W.P.; Gao, R.; Zafar, I. Modeling the Relationship between Safety Climate and Safety Performance in a Developing Construction Industry: A Cross-Cultural Validation Study[J]. Environ. Res. Public Health 2017, 14, 351.

from 量表评价系列|验证性因子分析和AMOS实现 – 知乎 (zhihu.com)

 

恭喜你,又看完一篇文章,扫码领个红包吧!图片

发表评论 取消回复

要发表评论,您必须先登录。

推荐访问

欢迎加入我们的付费交流社群,增长见识,互帮互助! 自2023-05-01起正式运营。
图片

数据分析交流:数据分析交流
Excel学习: Excel学习交流
Python交流:一起学习Python(数据分
SQL交流:一起学习SQL(数据分析
微博:一起大数据

最新提问

  • 统计方面的3个Python包
  • 更新R及Rstudio
  • TFP CausalImpact:一个Python包,用于估计设计干预对时间序列的因果效应
  • 根据公式的结构,写出计算的表达式,并结算结果
  • excel中提取超级链接公式中的链接地址
  • 用python解析公式并进行可视化
  • Python设置镜像源默认为清华的方法
  • VAR、VMA、VARMA 和 ARIMA
  • Python 的表达式解析库来解析公式
  • PandasAI:一个Python库,将生成式AI能力集成到Pandas中,允许进行高级数据分析任务,例如数据合成和增强

文章标签

AMOS CBC Excel GBDT KNN Modeler Mysql pandas PostgreSQL python python数据可视化 R SAS sklearn SPSS SQL SVM Tableau TensorFlow VBA 主成分分析 关联规则 决策树 协同过滤 可视化 因子分析 大数据 大数据分析 推荐系统 数据分析 数据可视化 数据挖掘 数据透视表 文本挖掘 时间序列 机器学习 深度学习 神经网络 结构方程 统计学 联合分析 聚类 聚类分析 逻辑回归 随机森林
©2023 一起大数据-技术文章心得 | Design: Newspaperly WordPress Theme