系统分析师在收集、分析、处理数据时常会遇到零星异常数据(野点、离群点),即大大偏离其他数据值的数据。关于异常数据的叙述,不正确的是(56)。
A.异常数据属于不良数据,应尽快找出来,修正它或删除它
B.处理大批数据时,其统计量中位数不易受零星异常数据的影响
C.用最小二乘法进行线性拟合时,零星异常数据可能导致拟合结果完全失真
D.测量误差、输入错误、程序运行错误等都可能产生异常数据
第1题:
104、离群点可以是合法的数据对象或者值。
第2题:
离群点可以是合法的数据对象或值。()
第3题:
数据分析任务通常是去掉离群点,离群点是没有意义的点
第4题:
在基于邻近度的方法中,离群点的定义不包括以下哪个?
A.在距离D内,最近邻点数少于P的数据点为离群点
B.一个对象的离群点得分是该对象周围密度的逆
C.到第K个最近邻的距离最大的前n个数据点为离群点
D.到K个最近邻平均距离最大的前n个数据点为离群点
第5题:
下列关于离群点检测中遇到的困难的说法不正确的是()
A.利用简单统计量检测法、箱型图检测法、3σ原则检测法可以很容易地检测出任何数据集中的离群点。
B.在时间序列数据中,因为离群点可能会隐藏在数据的趋势性、季节性或者其他变化中,难以被发现
C.对于属性值为非数值型的数据,在离群点的检测过程中需要多加考虑,比如对维度进行预处理等。
D.针对多维数据,离群点的异常特征可能是多个维度的组合,而不是单一维度就能体现的。