在对历史数据集进行分区之前进行数据清洗(缺失值填补等)的缺点是什

题目

在对历史数据集进行分区之前进行数据清洗(缺失值填补等)的缺点是什么()

  • A、违反了建模的假设条件
  • B、加大了处理的难度
  • C、无法针对分区后各个数据集的特征分别做数据清洗
  • D、无法对不同数据清理的方法进行比较,以选择最优方法
如果没有搜索结果或未解决您的问题,请直接 联系老师 获取答案。
相似问题和答案

第1题:

数据归约的目的是()。

A 填补数据种的空缺值

B 集成多个数据源的数据

C 得到数据集的压缩表示

D 规范化数据


参考答案C

第2题:

获取数据后,为顺利分析数据,需要先进行数据清洗。数据清洗工作一般不包括( )。

A. 筛选清除多余重复的数据

B. 将缺失的数据补充完整

C. 估计合理值修改异常数据

D. 纠正或删除错误的数据


答案: C 数据清洗是指发现并纠正数据文件中可识别的错误的最后一道程序,包括检查数据一致性,处理无效值和缺失值等。与问卷审核不同,录入后的数据清理一般是由计算机而不是人工完成。一般修改异常数据通常在数据处理阶段由计算机完成。

第3题:

对于不完整的数据,例如一些应该有的信息缺失,如信息缺失、主表与明细表不能匹配等,应进行()。

A、数据清洗

B、数据抽取

C、数据转换

D、数据更新


参考答案:A

第4题:

数据的预处理是数据整理的先前步骤,是在对数据进行分组之前所做的必要处理,包括数据的( )等。

A:审核
B:筛选
C:剔除
D:保留
E:排序

答案:A,B,E
解析:

第5题:

断路器中,对于不带温度补偿的SF6密度继电器(压力表),应对照制造厂提供的温度-压力曲线,与()环境温度下的()进行比较分析

(A)不同,之前数据 (B)不同,当前数据 (C)相同,之前数据 (D)相同,历史数据

答案:D
解析:

第6题:

对于脱落/缺失数据的应对,以下说法错误的是()。

A、在方案或者SAP中提前考虑缺失数据的处理

B、医学监查,数据审核,统计师参与判断受试者,能否进入最终的分析集

C、在统计分析时候,根据缺失数据的缺失机制,考虑数据的填补规则

D、基于原方案的设计,揭盲后评价追加样本量


答案:C

第7题:

在对现场勘察结果数据甄别时,在对数据汇总处理之前先要对( )进行甄别。


正确答案:ABD

第8题:

若处理调查数据时发现有缺失数据,且样本量很大,有缺失数据的个案比例较小,有缺失数据的个案与无缺失数据的个案在分布上无显著差异时,可以( )。

A. 将有缺失的个案整个删除

B. 将有缺失的个案保留,仅在计算时删除相应变量的缺失值

C. 使用均值代替、回归估计、随机抽取、最近距离确定等方法代替缺失值

D. 通过对调查中的回答数据使用加权因子,对数据进行调整,减少缺失值的影响


参考答案:A

第9题:

断路器中,对于不带温度补偿的SF6密度继电器(压力表),应对照制造厂提供的温度-压力曲线,与( )环境温度下的( )进行比较分析。

不同,之前数据$; $不同,当前数据$; $相同,之前数据$; $相同,历史数据

答案:D
解析:

第10题:

分类变量使用以下哪个统计量进行缺失值填补较合适()

  • A、均值
  • B、最大值
  • C、众数
  • D、中位数

正确答案:C

更多相关问题