品牌型号:HP Laptop 15
软件版本:SPSS Statistics27
系统:Windows 10
在对数据进行处理和分析时,为了保证分析结果的可靠性和准确性,我们需要对数据的异常值进行处理,异常值,指的数据中出现远离所属样本的大部分观测值的数据,如果不对异常数据进行处理,会导致分析结果偏离实际结果。今天本文就给大家介绍一下SPSS怎么排除异常数据,SPSS怎么排除极大值或奇异值的相关内容,希望对大家有帮助。
一、SPSS怎么排除异常数据
导致异常数据出现的原因,一般来说有以下几种:数据收集过程录入错误、数据测量误差、数据随机误差,也就是数据本身存在的误差等等。我们在使用SPSS排除异常数据时,可以通过多种方法来排除异常数据,其中最常用的是绘制箱图,它能够将数据的分布情况以一种直观的图形方式呈现出来,我们可以根据图形的分布有效的识别异常值、极大值和奇异值等等,而且当多组数据需要进行同步分析比较时,通过绘制箱图,我们能同时观察不同组数据之间的差异。下面给大家详细介绍一下绘制箱图法:
1、将需要测验的数据导入至SPSS中,点击菜单栏上的【图形】-【旧对话框】按钮,找到【箱图】。
2、打开箱图面板之后,选择【简单】按钮,并在图表数据中勾选【个案组摘要】,然后点击【定义】,打开定义简单箱图:个案组摘要对话框。
3、假设我们要排除的是数据中语文成绩,且将80分以下判定为异常值,那在【定义简单箱图:个案组摘要】对话框中,可以将【语文成绩】放入变量框中,将【学生编号】放入类别轴上,点击确定,SPSS会根据我们的设置绘制出语文成绩的箱图。
4、如下图所示,我们可以根据80分以下的数据点来判定为异常值。
5、根据箱图确定了异常值的范围之后,我们可以点击菜单栏中的【数据】-【选择个案】,在选择个案面板中,选择【如果条件满足】并点击【如果】按钮。
6、在弹出来的【选择个案:If】面板中,输入筛选条件:语文成绩>=80,点击【继续】再回到选择个案面板上,点击【确定】,SPSS就会自动筛选异常值。
7、如图7所示,我们可以看到在SPSS数据视图中,筛选出来的语文成绩小于 80 的数据,行号前面会有斜杠,并在最后一列中会有标记状态,这就预示着为异常数据。
二、SPSS怎么排除极大值或奇异值
1、在上述操作中,我们通过创建箱图、设置变量等操作,绘制出了语文成绩的箱图,要想筛选极大值或奇异值,首先要确定极大值或是奇异值的范围。
2、点击菜单栏中的【数据】-【选择个案】,在个案对话框,选择【如果条件满足】选项,点击【如果】按钮,例如,我们在这里把语文成绩大于95的分数设置为极大值,在【选择个案:If】对话框,筛选条件中输入:语文成绩 >= 95,SPSS就会自动筛选数据。如下图所示:
3、在SPSS中除了上述介绍的绘制箱图法之外,我们还可以通过线性回归、描述统计的方法来排除异常值,在描述统计中,主要是根据根数据的分布来确定异常值的范围,然后进行清除。在线性回归中,主要是根据模型残差来定位异常值。
关于SPSS怎么排除异常数据,SPSS怎么排除极大值或奇异值的操作教程就先给大家介绍到这里,无论是研究什么数据,如果数据中存在可能的异常值,我们一定要在数据分析之前进行处理,防止异常值带来的干扰,以此保证我们最终数据结果的准确性,想要了解SPSS数据分析软件的操作教程,可以登录SPSS中文网站进行查看。
作者:EON