在上述资料中,想按照年龄进行分组,30岁以下为组1,30-40岁为组2,40岁以上为组3
有两种方法可以实现:
1.使用计算变量功能
<1>打开转换-计算变量菜单,定义组变量名group,并在数字表达式中赋值为1,点击确定,这样资料中新增了一个名为group的变量,并且值全部为1
<2>打开转换-计算变量菜单,在数字表达式中赋值为2,点击左下方“如果”按钮,设置条件年龄>=30 & 年龄<=40,点击确定,之后看到group变量值中有些被重新赋值为2,这就是根据条件判断的结果
<3>打开转换-计算变量菜单,在数字表达式中赋值为3,点击左下方“如果”按钮,设置条件年龄>40,点击确定。
通过以上操作,我们便根据年龄进行了分组,组别被保存为新变量group中,在后续分析中可以使用它。
我们通过输出窗口中的代码也可以发现,这实际上就是一个if的区间判断过程。
2.使用重新编码功能
使用计算变量功能要重复三次操作,比较繁琐,使用重新编码功能,则一步就可以了打开转换-重新编码为不同变量-将需要判断条件的变量选入右侧列表框-在输出变量框中命名新的变量名-点击下方旧值和新值-设置左侧的旧值和右侧的新值,并添加进右侧列表框中,注意新值有三种指定状态,此外,还需要考虑数据不在设置范围内的情况,例如缺失值等,因此需要最后对所有其他值做出指定,本例中指定处理方式为复制旧值
通常来讲都是对连续变量进行分组,通过赋予每个连续变量一个组别(也可以用组别值直接替换原变量),使其转换为离散变量,实际上也就是将连续变量离散化了。