• 登录
Skip to content

一起大数据-技术文章心得

一起大数据网由数据爱好者发起并维护,专注数据分析、挖掘、大数据相关领域的技术分享、交流。不定期组织爱好者聚会,期待通过跨行业的交流和碰撞,更好的推进各领域数据的价值落地。

Menu
  • 首页
  • 大数据案例
  • 数据&电子书
  • 视频
    • Excel视频
    • VBA视频
    • Mysql视频
    • 统计学视频
    • SPSS视频
    • R视频
    • SAS视频
    • Python视频
    • 数据挖掘视频
    • 龙星计划-数据挖掘
    • 大数据视频
    • Machine Learning with Python
  • 理论
    • 统计学
    • 数据分析
    • 机器学习
    • 大数据
  • 软件
    • Excel
    • Modeler
    • Python
    • R
    • SAS
    • SPSS
    • SQL
    • PostgreSQL
    • KNIME
  • 技术教程
    • SQL教程
    • SPSS简明教程
    • SAS教程
    • The Little SAS Book
    • SAS EG教程
    • R语言教程
    • Python3教程
    • IT 技术速查手册
    • Data Mining With Python and R
    • SAS Enterprise Miner
  • 问答社区
  • 我要提问
Menu
神经网络在spss中的实现

神经网络在spss中的实现

Posted on 2023年4月26日

1.标准化处理 (小编注:原文中有这一步,不过貌似不太需要)

对于神经网络算法在实操中的运用,我们通常要对数据进行标准化处理以消除数据之间的量纲关系,方便数据之间进行很好的比较。

步骤:描述—将标准化值另存为变量

打开原数据,这样我们就可以得到标准化以后的数据。限于篇幅,仅展示部分:

2.神经网络的实现

(1)步骤:分析—神经网络—多层感知器—选定因变量、因子(一般为分类变量)、协变量。

 

 

(2)分区处可以看到spss对于样本训练集和测试集的划分

 

 

spss将样本数据划分为训练样本和测试样本,比例分别为70%,30%

(3)在输出处,可以将以下选项都选上,方便后文的分析

 

 

(4)在保存处将预测值选上

 

 

以上四个步骤是主要的,其余皆为默认选项即可。

3.模型关注点

(1)处理摘要

从上图中可以看出,训练集比例为70%,测试集(检验集)比例为30%。

(2)网络信息

从这个表格中我们可以知道输入层、隐含层、输出层的基本信息。

(3)网络图

从左到右,第1列为输入层,第2列为隐含层,第3列为输出层,也即是我们想要去预测的变量。

(4)模型摘要与分类表

从模型摘要中可以看出,训练集的错误比率为16.4%,测试集的错误比率为15.8%;

从分类表中可以看出,训练集的正确率为83.6%,测试集的正确率为84.2%。

因此,神经网络模型对于样本的预测能力较强。

(5)ROC曲线图

关于ROC曲线,我们主要关注曲线下方的区域(也叫做曲线下方的面积),总面积为1,模型中0和1的区域面积都为0.7,表明模型预测能力较好。

(6)变量重要性(在实务中很重要!)

从变量重要性程度可以看出,在本次模型预测中,模型认为int_rate和loan_to_income这两个变量比较重要;employment和grade这两个变量其次,fico_score、debt_to_income、home这三个变量的重要性程度不是很明显。

以上就是神经网络算法在spss中的实现步骤以及关键信息的解读。此外,我们也可以在spss数据表格中看到我们通过神经网络算法得出的预测值,限于篇幅,仅展示部分:

 

from 神经网络在spss中的实现 – 知乎 (zhihu.com)

恭喜你,又看完一篇文章,扫码领个红包吧!图片

发表评论 取消回复

要发表评论,您必须先登录。

推荐访问

欢迎加入我们的付费交流社群,增长见识,互帮互助! 自2023-05-01起正式运营。
图片

数据分析交流:数据分析交流
Excel学习: Excel学习交流
Python交流:一起学习Python(数据分
SQL交流:一起学习SQL(数据分析
微博:一起大数据

最新提问

  • 统计方面的3个Python包
  • 更新R及Rstudio
  • TFP CausalImpact:一个Python包,用于估计设计干预对时间序列的因果效应
  • 根据公式的结构,写出计算的表达式,并结算结果
  • excel中提取超级链接公式中的链接地址
  • 用python解析公式并进行可视化
  • Python设置镜像源默认为清华的方法
  • VAR、VMA、VARMA 和 ARIMA
  • Python 的表达式解析库来解析公式
  • PandasAI:一个Python库,将生成式AI能力集成到Pandas中,允许进行高级数据分析任务,例如数据合成和增强

文章标签

AMOS CBC Excel GBDT KNN Modeler Mysql pandas PostgreSQL python python数据可视化 R SAS sklearn SPSS SQL SVM Tableau TensorFlow VBA 主成分分析 关联规则 决策树 协同过滤 可视化 因子分析 大数据 大数据分析 推荐系统 数据分析 数据可视化 数据挖掘 数据透视表 文本挖掘 时间序列 机器学习 深度学习 神经网络 结构方程 统计学 联合分析 聚类 聚类分析 逻辑回归 随机森林
©2023 一起大数据-技术文章心得 | Design: Newspaperly WordPress Theme