矿业公司数据应用能力提升在线考试

一、单选题

1. 以下哪项是线性变换的主要目的？（）

A、增加数据维度B、减少数据噪声C、将数据缩放到特定范围D、改变数据结构

2. Min-Max缩放公式是什么？（）

A、(x - min)/(max - min)B、(x - mean)/stdC、x / sumD、log(x)

3. Z-score标准化的公式是什么？（）

A、(x - min)/(max - min)B、(x - mean)/stdC、x / maxD、sqrt(x)

4. 数据质量评估的主要维度不包括？（）

A、准确性B、完整性C、一致性D、美观性

5. 识别数据清洗需求的第一步是？（）

A、数据收集B、业务需求分析C、模型训练D、结果可视化

6. 常用的数据清洗需求分析方法不包括？（）

A、统计分析B、数据可视化C、机器学习聚类D、人工审核

7. 数据清洗方案的基本组件不包括？（）

A、输入数据源B、清洗规则C、输出格式D、模型参数

8. 处理缺失值的常见方法不包括？（）

A、删除记录B、均值填充C、机器学习预测D、数据加密

9. 识别异常值的统计方法不包括？（）

A、Z-scoreB、四分位距法（IQR）C、聚类分析D、线性回归

10. 编写自定义数据预处理函数时，首要原则是？（）

A、代码简洁B、可复用性C、高性能D、符合业务需求

11. 在Python中，使用Pandas处理缺失值的常用函数是？（）

A、fillna()B、dropna()C、replace()D、所有以上

12. 数据预处理函数测试的关键不包括？（）

A、单元测试B、集成测试C、性能测试D、用户培训

13. 在多元统计分析中，以下哪项是多元数据的特点?（）

A、只包含一个变量B、变量之间相互独立C、变量之间可能存在相关性D、总是正态分布

14. 多元正态分布的性质包括以下哪项?（）

A、边缘分布是正态的B、条件分布是正态的C、线性变换后仍是多元正态D、以上所有

15. Hotelling's T²检验主要用于:（）

A、检验一个样本的均值向量是否等于给定向量B、检验两个独立样本的均值向量是否相等C、检验多个样本的均值D、检验方差

16. 判别分析的主要目的是什么?（）

A、预测连续变量B、分类样本到预定义组C、降维D、聚类数据

17. 线性判别分析（）的核心思想是什么?（C）

A、最小化类内散度B、最大化类间散度C、同时最小化类内散度和最大化类间散度D、使用非线性边界

18. 二次判别分析(QDA)与线性判别分析（）的主要区别是什么?（B）

A、QDA假设各类协方差矩阵相同B、QDA使用二次决策边界C、QDA只能用于线性分类D、QDA不要求正态分布

19. 判别分析在医疗诊断中的应用包括哪些?（）

A、疾病分类B、药物剂量预测C、患者分群D、生存分析

20. 聚类分析的主要目标是什么?（）

A、预测标签B、发现数据内在分组C、降维D、回归分析

21. K-means算法的核心步骤是什么?（）

A、随机初始化中心点，分配样本，更新中心点B、构建树状图C、最大化类间距离D、最小化回归误差

22. 层次聚类的主要类型是什么?（）

A、划分式B、凝聚式和分裂式C、基于密度D、基于网格

23. 主成分分析(PCA)的主要目的是什么?（）

A、分类数据B、降维和去噪C、聚类数据D、回归预测

24. 主成分分析(PCA)中，主成分的方向由什么决定?（）

A、特征向量B、特征值C、相关系数D、协方差矩阵

25. 主成分分析(PCA)的标准步骤中，第一步是什么?（）

A、计算协方差矩阵B、标准化数据C、计算特征值D、选择主成分

26. 因子分析的主要目的是什么?（）

A、降维B、探索变量间潜在结构C、分类D、预测

27. 因子模型中，因子载荷表示什么?（）

A、因子与变量的相关系数B、变量方差C、因子得分D、误差项

28. 因子旋转的主要目的是什么?（）

A、减少因子数B、提高因子解释性C、增加方差贡献D、降低误差

29. 时间序列数据的主要特征是什么?（）

A、独立性B、趋势、季节性和随机性C、高维度D、类别平衡

30. 平稳时间序列的定义是什么?（）

A、均值、方差、自协方差不随时间变化B、无趋势和季节性C、高预测精度D、正态分布

31. 自回归积分滑动平均模型(ARIMA)模型中的参数(p,d,q)分别代表什么?（）

A、自回归阶数、差分阶数、移动平均阶数B、部分阶数、差分阶数、季节阶数C、自回归阶数、季节阶数、移动平均阶数D、滞后阶数、差分阶数、误差阶数

32. 在特征工程中，评估挖掘需求时，哪个因素通常不被考虑？（）

A、业务目标B、数据质量C、模型算法D、用户界面设计

33. 以下哪种方法不是特征选择技术？（）

A、方差阈值B、相关系数C、主成分分析D、随机森林重要性

34. 对于特征缩放，以下哪种方法受异常值影响最大？（）

A、标准化B、归一化C、鲁棒缩放D、最大绝对值缩放

35. 在Python中，哪个库不常用于机器学习模型训练？（）

A、scikit-learnB、TensorFlowC、PandasD、PyTorch

36. 模型训练流程中，以下哪步不是必须的？（）

A、数据预处理B、特征工程C、模型部署D、模型评估

37. 超参数初始化通常基于：（）

A、经验值B、网格搜索C、随机搜索D、所有以上

38. 对于不平衡分类问题，哪个指标最合适？（）

A、准确率B、精确率C、召回率D、F1分数

39. 模型验证方法不包括：（）

A、留出法B、交叉验证C、自助法D、特征选择

40. 超参数调优方法中，哪个不基于搜索？（）

A、网格搜索B、随机搜索C、贝叶斯优化D、手动设置

41. 测试集用于：（）

A、训练模型B、调优模型C、最终评估D、特征工程

42. 对于多分类问题，宏平均F1计算方式：（）

A、各类F1平均B、总TP/总预测C、微平均D、加权平均

43. 模型评估报告不包括：（）

A、模型架构B、性能指标C、训练时间D、数据来源

44. 假设检验中第一类错误是指？（）

A、接受真H₀B、拒绝真H₀C、接受假H₁D、拒绝假H₁

45. 95%置信区间的含义是？（）

A、包含总体参数的概率为95%B、包含样本统计量的概率为95%C、重复抽样时95%区间包含真值D、参数落在区间内的概率95%

46. Pearson相关系数的取值范围是？（）

A、[0,1]B、[-1,1]C、(-∞,+∞)D、[0,+∞)

47. 处理高维稀疏文本数据首选？（）

A、逻辑回归B、随机森林C、SVMD、KNN

48. 轮廓系数的取值范围是？（）

A、[0,1]B、[-1,1]C、(-∞,+∞)D、[0,+∞)

49. 分类任务中类别不平衡问题的解决方案不包括？（）

A、过采样B、欠采样C、特征缩放D、类别权重调整

50. 基于模型的特征重要性分析不适用于？（）

A、决策树B、线性回归C、随机森林D、K-means

51. t-分布随机邻域嵌入(t-SNE)主要用于？（）

A、线性降维B、特征选择C、可视化高维数据D、异常检测

52. 人工少数类过采样技术(SMOTE)通过？（）

A、复制少数类样本B、插值生成新样本C、删除多数类样本D、调整分类阈值

53. Bagging算法的核心是？（）

A、提升偏差B、降低方差C、特征变换D、数据增强

54. Adaboost迭代过程中会增加？（）

A、错分样本权重B、正确样本权重C、特征维度D、学习率

55. Stacking的元模型通常采用？（）

A、决策树B、逻辑回归C、KNND、贝叶斯

56. RESTful API的核心特征是？（）

A、状态存储B、无状态C、强耦合D、二进制传输

57. API响应时间主要优化手段是？（）

A、模型量化B、缓存机制C、异步处理D、以上都是

58. API健康监测不包括？（）

A、响应时间B、错误率C、用户IPD、CPU使用率

59. 知识库最不适合存储的内容是？（）

A、结构化数据表B、PDF文档C、实时传感器流数据D、FAQ问答对

60. 提升检索召回率的关键技术是？（）

A、精确匹配B、同义词扩展C、结果排序D、缓存机制

61. 对话状态跟踪(DST)的主要作用是？（）

A、记录聊天历史B、理解用户意图C、维护上下文状态D、生成回复

62. 需求分析阶段不需要明确？（）

A、输入数据类型B、服务器品牌C、异常处理策略D、输出格式

63. 处理API限流的策略不包括？（）

A、指数退避B、请求缓存C、同步等待D、伪造Header

64. Pandas处理缺失值的方法是？（）

A、fillna()B、addna()C、delna()D、nona()

65. 某业务部门在制定“客户类型”代码标准时，仅凭本部门的业务习惯定义了代码集，并未与其他相关部门进行协商，也未遵循集团的审批流程。这种做法主要违背了数据标准制定的哪一项核心目标？（）

A、提升数据存储效率B、确保数据物理安全C、建立跨部门的“通用语言”D、简化数据备份流程

66. 根据DAMA-DMBOK，构建业务术语表（Business Glossary）的首要目标是？（）

A、形成一份完整的数据模型文档B、建立一个集中的数据备份索引C、在组织内实现对核心业务概念和术语的共同理解D、自动化数据质量校验规则的生成

67. 在数据治理体系中，对某个核心业务数据（如“合同签约额”）的业务口径和定义拥有最终审批权的角色是？（）

A、数据开发人员B、数据使用者C、数据所有者D、数据管理者

68. 某大型集团企业，各子公司IT系统独立建设，数据管理能力参差不齐，但集团层面希望快速建立一个统一的数据资产视图以支持数据查找和治理。在这种情况下，最适合作为起步的元数据管理架构是？（）

A、集中式架构，要求所有子公司立即将全部元数据迁移至中央库B、分布式架构，维持现状，各子公司自行管理元数据C、混合式（或联邦式）架构，建立中央元数据注册中心，通过适配器连接并整合各子公司的元数据，而不进行物理迁移D、无架构，先通过Excel表格手动汇总所有元数据

69. 相比于手动绘制数据流转图，利用自动化工具解析ETL脚本和数据库日志来构建数据血缘，其最核心的优势在于？（）

A、生成的血缘图谱更美观B、能够反映数据真实、客观的流转路径，且能随系统变更自动更新C、不需要业务人员的参与D、构建过程完全不需要计算资源

70. 构建数据资产目录以实现“找数、懂数、用数”的闭环中，“懂数”环节主要依赖于目录提供的哪项功能？（）

A、强大的全文搜索引擎B、友好的用户界面和交互设计C、丰富、准确的元数据信息，如业务定义、数据所有者、质量规则和数据血缘D、一键式的数据下载功能

71. 根据财政部《企业数据资源相关会计处理暂行规定》，企业在日常活动中持有、以出售为最终目的的数据资源，通常应被确认为哪一类会计资产？（）

A、无形资产B、存货C、固定资产D、交易性金融资产

72. 在处理数据质量问题时，根本原因分析（Root Cause Analysis，RCA）的主要目的是？（）

A、快速清洗所有已发现的错误数据B、识别并处罚造成数据错误的责任人C、找到导致问题发生的深层次、系统性原因，而不仅仅是处理表面症状D、编写一份详细的数据质量问题报告

73. 在制定项目管理计划时，强调其“整合性”的核心价值在于？（）

A、确保计划文档的格式统一，便于阅读B、确保所有子计划相互协调、不存在冲突，共同服务于项目总体目标C、将所有项目文档物理上合并到一个文件夹中，便于归档D、减少项目经理需要编写的文档数量

74. 项目经理通过比较项目实际完成的工作量与计划完成的工作量，发现存在差异。这个活动属于哪种项目监控技术？（）

A、趋势分析B、偏差分析C、根本原因分析D、假设情景分析

75. 在挣值管理（Earned Value Management,EVM）中，表示“在给定时间点，实际完成工作的预算成本”的指标是？（）

A、计划价值 (PV)B、挣值 (EV)C、实际成本 (AC)D、完工预算 (BAC)

76. 根据PMBOK指南，项目风险管理流程的第一步是？（）

A、识别风险B、规划风险管理C、实施定性风险分析D、监督风险

77. 在项目风险管理流程中，“实施风险应对”过程紧接在哪个过程之后？（）

A、识别风险B、实施定量风险分析C、规划风险应对D、监督风险

78. 定性风险分析最主要的目标是？（）

A、计算出每个风险可能造成的具体财务损失金额B、通过评估风险的概率和影响，对已识别的风险进行优先级排序C、为每个风险制定详细的应对计划D、绘制出项目成本和进度的概率分布图

79. 实施整体变更控制流程的核心活动是？（）

A、鼓励项目团队成员随时进行创新性修改B、尽可能地拒绝所有变更请求，以保证项目基准的稳定C、对所有提交的变更请求进行全面的影响分析，并由授权机构进行审批决策D、将所有变更请求的决策权完全下放给一线开发人员

80. 在 SQL 中，用于从表中检索数据的语句是？（）

A、INSERTB、SELECTC、DELETED、UPDATE

81. 以下哪种不是常见的表关联类型？（）

A、内连接B、外连接C、交叉连接D、循环连接

82. 以下哪种 SQL 语法不能实现表关联？（）

A、使用 JOIN 关键字B、在 WHERE 子句中指定关联条件C、使用 MERGE 关键字D、使用子查询关联

83. 数据标准化（归一化）的主要目的是？（）

A、处理缺失值B、剔除异常值C、消除量纲影响D、简化数据

84. 以下哪种场景属于多对多关联？（）

A、学生和班级（一个班级多个学生）B、商品和订单（一个订单多个商品，一个商品多个订单）C、员工和部门（一个部门多个员工）D、客户和订单（一个客户多个订单）

85. 中间表中至少应包含的字段是？（）

A、两个关联表的主键B、中间表自己的主键C、关联表的所有字段D、以上都不是

86. 以下 SQL 语句中，哪一个可以正确处理多对多关联（假设表 A、表 B 为多对多关联，中间表为 AB）？（）

A、SELECT * FROM A JOIN B ON A.id = B.aidB、SELECT * FROM A JOIN AB ON A.id = AB.aid JOIN B ON AB.bid = B.idC、SELECT * FROM A,B WHERE A.id = B.aidD、SELECT * FROM AB JOIN A,B ON AB.aid = A.id AND AB.bid = B.id

87. 以下哪种分布属于离散型概率分布？（）

A、正态分布B、均匀分布C、二项分布D、指数分布

88. Excel中，计算一组数据的中位数应使用哪个函数？（）

A、AVERAGE()B、MEDIAN()C、MODE()D、STDEV()

89. 以下哪种方法不属于数据清洗的常用手段？（）

A、缺失值填充B、数据归一化C、异常值剔除D、重复值删除

90. SQL中，GROUP BY子句的作用是？（）

A、排序数据B、连接表C、筛选数据D、分组统计数据

91. 以下哪种图表适合展示数据的变化趋势？（）

A、饼图B、折线图C、柱状图D、散点图

92. 用于检验两个总体均值是否存在显著差异的统计方法是什么？（）

A、卡方检验B、t检验C、方差分析D、回归分析

93. 以下哪个是衡量数据离散程度的指标？（）

A、众数B、中位数C、标准差D、平均数

94. 在数据分析中，“特征工程”的核心目的是？（）

A、收集更多数据B、优化模型输入特征C、可视化数据结果D、验证模型准确性

95. 正态分布曲线的形状由哪个参数决定？（）

A、均值B、方差C、中位数D、众数

96. SQL中，用于排序数据的关键字是？（）

A、GROUP BYB、SORT BYC、ORDER BYD、ARRANGE BY

97. 以下哪个指标可以反映数据的对称性？（）

A、峰度B、偏度C、均值D、方差

98. 以下哪种图表适合展示各部分占总体的比例？（）

A、折线图B、柱状图C、饼图D、散点图

99. SQL中，用于更新表中数据的关键字是？（）

A、UPDATEB、INSERTC、DELETED、SELECT

100. Excel中，条件格式的核心作用是？（）

A、按条件筛选数据B、按条件设置单元格格式C、按条件排序数据D、按条件汇总数据

101. 以下哪种数据类型属于定性数据？（）

A、产量B、设备状态C、电流值D、销售额

102. 正态分布中，约有多少比例的数据落在均值±1个标准差范围内？（）

A、50%B、68.27%C、95.45%D、99.73%

103. SQL中，DISTINCT关键字的作用是？（）

A、排序数据B、去重C、筛选数据D、分组统计

104. 在 Python 中，以下哪个是对 "类" 的正确描述？（）

A、类是对象的实例B、类是创建对象的模板C、类是一种数据类型，只能包含属性D、类不能包含方法

105. 在面向对象编程中，对象的 "属性" 指的是：（）

A、对象可以执行的操作B、对象所具有的特征或状态C、创建对象的过程D、对象之间的继承关系

106. 数据可视化中，热力图主要用于展示什么？（）

A、数据变化趋势B、各部分占比C、变量间相关性D、数据分布

107. 数据可视化的核心目的是？（）

A、使数据更美观B、满足报告格式要求C、快速传递数据信息和洞察D、处理大量数据

108. 在面向对象编程中，继承的主要目的是：（）

A、提高代码的执行效率B、实现代码的复用和扩展C、隐藏类的实现细节D、限制类的使用范围

109. 以下哪种模型属于监督学习模型？（）

A、K-means聚类B、主成分分析C、线性回归D、层次聚类

110. 面向对象编程中的 "封装" 指的是：（）

A、将数据和操作数据的方法捆绑在一起B、隐藏类的所有信息，不允许外部访问C、将多个类合并为一个类D、限制类的继承

111. 正态分布的均值、中位数和众数之间的关系是？（）

A、均值＜中位数＜众数B、均值=中位数=众数C、均值>中位数>众数D、无固定关系

112. Excel中，数据验证功能的核心作用是？（）

A、筛选数据B、限制单元格输入内容C、格式化单元格D、汇总数据

113. Excel中，用于查找数据的函数是？（）

A、VLOOKUP()B、HLOOKUP()C、XLOOKUP()D、以上都是

114. 统计学中，置信区间的核心意义是？（）

A、确定总体参数的精确值B、估计总体参数的可能范围C、检验假设是否成立D、描述数据离散程度

115. 以下哪种分布的均值和方差相等？（）

A、正态分布B、泊松分布C、二项分布D、均匀分布

116. 在包的子模块中，导入同一包内其他模块的正确方式是？（）

A、from . import moduleB、import moduleC、from package import moduleD、include module

117. 以下哪种导入方式属于包的绝对导入？（）

A、from .subpackage import moduleB、from .. import moduleC、from package.subpackage import moduleD、import .module

118. 以下关于相对导入和绝对导入的区别，说法正确的是？（）

A、相对导入更适合跨包导入，绝对导入适合包内导入B、相对导入使用模块的全路径，绝对导入使用.和..C、相对导入依赖于当前模块的位置，绝对导入不依赖D、绝对导入只能导入标准库包

119. 以下哪种数据预处理方法属于特征转换？（）

A、独热编码（One-Hot）B、缺失值填充C、异常值剔除D、重复值删除

120. 一个规范的自定义模块通常应包含的内容是？（）

A、仅函数定义B、函数、类、常量及文档字符串C、必须包含 main 函数D、只能有一个类

121. 以下哪种统计方法用于分析多个变量间的线性关系？（）

A、简单相关分析B、因子分析C、聚类分析D、多元回归分析

122. 以下哪个模块可以用于编写自定义模块的单元测试？（）

A、pytestB、unittestC、doctestD、以上都是

123. 统计学中，方差的计算公式是？（）

A、各数据与均值差的平方和的平均值B、各数据与均值差的绝对值的平均值C、最大值与最小值的差D、各数据与中位数差的平方和的平均值

124. 以下哪种模型属于无监督学习模型？（）

A、K-means聚类B、决策树分类C、线性回归D、逻辑回归

125. 以下哪种统计量用于描述数据的集中趋势？（）

A、偏度B、众数C、峰度D、标准差

126. 峰度用于描述数据分布的什么特征？（）

A、集中趋势B、离散程度C、对称性D、陡峭程度

127. 以下哪种图表适合展示多组数据的变化趋势？（）

A、柱状图B、饼图C、折线图D、散点图

128. 在假设检验中，显著性水平α通常取值为？（）

A、0.01B、0.05C、0.1D、0.5

129. 以下哪种方法属于数据降维的常用方法？（）

A、线性回归B、主成分分析（PCA）C、逻辑回归D、决策树

130. SQL中，用于计算分组数据的平均值应使用哪个函数？（）

A、SUM()B、AVG()C、COUNT()D、MAX()

131. SQL中，LIMIT关键字的作用是？（）

A、筛选数据B、限制查询结果的行数C、限制查询的列数D、排序数据

132. 安装数据库时，选择存储位置的关键注意事项是？（）

A、存储位置的文件夹名称是否美观B、存储位置的硬盘空间是否充足C、存储位置是否在 C 盘D、存储位置是否有多个子文件夹

133. 安装数据库前，不需要检查的环境是？（）

A、硬盘剩余空间B、操作系统版本C、显示器分辨率D、管理员权限

134. 选择数据库存储位置时，最关键的原则是？（）

A、路径包含中文B、空间充足且稳定C、桌面文件夹D、系统盘根目录

135. 同一份数据上午查询快、下午查询慢，最可能的原因是？（）

A、上午电脑性能更好B、下午同时查询的人数更多C、数据格式发生了变化D、下午网络信号更强

136. 优化查询速度的有效方法是？（）

A、关闭杀毒软件B、限定查询时间范围（如只查近 7 天）C、更换查询工具图标D、重启路由器

137. Excel中，IF函数的语法格式是？（）

A、IF(条件, 真值, 假值)B、IF(真值, 条件, 假值)C、IF(假值, 真值, 条件)D、IF(条件, 假值, 真值)

138. 数据恢复的第一步操作是？（）

A、重启数据库系统B、找到对应的备份文件C、联系 IT 人员D、格式化存储设备

139. 容灾演练中，不需要模拟的场景是？（）

A、服务器断电导致数据丢失B、误删关键生产数据C、数据库登录密码遗忘D、网络中断导致数据同步失败

140. 信息系统日常监控中最需关注的指标是？（）

A、软件图标样式B、登录响应时间（如是否超过 10 秒）C、操作工电脑壁纸D、数据库安装路径

141. 属于数据库小故障的是？（）

A、服务器爆炸B、登录后提示 “存储空间不足”C、全公司网络中断D、硬盘物理损坏

142. 数据采集过程中，以下哪种方式属于结构化数据采集？（）

A、爬取网页文本B、采集图片信息C、读取数据库表D、录制音频数据

143. 检验部门频繁录入数据、厂矿单位频繁查询数据，为避免卡顿，应采取的措施是？（）

A、让检验部门暂停录入B、为录入和查询分配独立系统资源C、让厂矿单位减少查询次数D、删除历史数据

144. 以下哪种业务不适合分开处理数据录入和查询？（）

A、紧急插单（录入后需立即查询确认）B、月度生产统计（月底集中录入，次月查询）C、历史数据归档（一次性录入，偶尔查询）D、设备维修记录（定期录入，季度查询）

145. 数据库读写分离中，录入权限应分配给？（）

A、所有员工B、生产录入员（专人负责）C、仅管理层D、外部审计人员

146. 读写分离后，录入数据多久同步到查询端合理？（）

A、1-5 分钟B、1-2 小时C、1 天D、实时（0 延迟）

147. 当录入和查询同时操作导致冲突时，优先保障？（）

A、录入（避免生产数据丢失）B、查询（确保业务部门获取数据）C、同时中断D、随机选择一项

148. 安装分布式数据库时，不需要填写的信息是？（）

A、各存储点的名称（如 “炼钢车间服务器”）B、存储路径（如服务器文件夹位置）C、各存储点的管理员家庭住址D、访问权限（如登录账号密码）

149. 日常检查分布式数据库各存储点数据是否一致的简单方法是？（）

A、对比各存储点的创建时间B、查询同一工单编号的关键信息（如数量、日期）C、统计各存储点的文件大小D、检查服务器的品牌型号

150. 矿业公司如果要搭建分布式数据库，节点应优先部署在？（）

A、单一办公室B、各厂矿单位机房C、外部合作单位D、员工宿舍

151. 当某一存储节点故障时，应立即？（）

A、关闭所有节点B、切换至其他正常节点继续业务C、停止生产等待修复D、删除故障节点数据

152. 按 “月份” 对生产数据分类的主要好处是？（）

A、减少数据总量B、便于快速查询某时间段的数据（如月度统计）C、提高数据安全性D、降低存储成本

153. 常用的数据分类维度有？（）

A、时间（如年/月/日）B、业务类型（如工单、库存、设备）C、状态（如已完成、进行中）D、文件格式（如 Excel、Word）

154. 优化分类检索效率的方法是？（）

A、增加分类层级（如 10 级以上）B、关键分类放在前 3 级（如年、月、车间）C、所有数据放在同一文件夹D、分类名称用复杂缩写

155. 从MES系统提取生产数据的第一步是？（）

A、关闭MES系统B、登录MES系统并定位目标数据模块（如 “质检综合查询”）C、格式化存储设备D、联系软件开发商

156. 按 “采矿→选矿→销售” 流程整理数据的好处是？（）

A、减少数据存储量B、便于追溯产品在各环节的流转情况C、提高数据加密等级D、降低数据录入难度

157. 某工单数据遗漏 “钢球使用量”，最可能影响的是？（）

A、设备维修计划B、物料成本核算和库存管理C、操作工排班D、产品包装设计

158. 矿业公司生产数据中，需统一的术语是？（）

A、“矿粉”“铁精粉” 统一为 “XX高品精矿粉”或“XX低品精矿粉”B、各车间自行命名C、随员工习惯称呼D、用英文术语（如 “iron power”）

159. 采矿设备实时数据中，不需要记录的信息是？（）

A、记录时间B、设备编号C、实时温度D、设备生产厂家的联系电话

160. 记录设备实时数据时，必须包含的信息是？（）

A、记录人心情B、数据采集时间（精确到秒）C、天气情况D、设备出厂日期

161. 识别重复数据的核心依据是？（）

A、数据数值完全相同B、同一设备、同一时间的重复记录C、记录人相同D、设备编号相同

162. 离开电脑时，保护数据不被他人查看的简单方法是？（）

A、关闭显示器B、锁定电脑（如按 Win+L）C、隐藏桌面图标D、拔掉网线

163. 最有效的数据防丢失措施是？（）

A、定期手动复制到 U 盘B、系统自动定时备份（本地 + 异地）C、只存在一台电脑中D、不允许任何人接触数据

164. 数据修改后，必须记录的信息是？（）

A、修改时的天气B、修改人、时间、原因、前后内容C、电脑 IP 地址D、修改时的操作姿势

165. 矿业公司GSC系统最可能需要MES系统提供的什么数据？（）

A、设备维修记录B、当月各产品的生产数量C、操作工的考勤数据D、车间的水电费

166. 矿业公司GSC系统与MES系统对接的核心需求是？（）

A、让两系统界面相同B、MES 生产数据同步至 ERP（用于成本核算）C、关闭其中一个系统D、数据无需关联，各自独立

167. 矿业公司GSC系统与MES系统对接时，必须统一的格式是？（）

A、系统界面颜色B、关键业务字段格式C、操作人员账号D、软件版本号

168. 验证矿业公司GSC系统和MES系统对接数据准确性的方法是？（）

A、只看 ERP 数据B、随机抽取 10 条数据，对比两系统是否一致C、相信系统自动对接，无需验证D、只看 MES 数据

169. 数据库处理基本类型分为ACID(Atomicity、Consistency、Isolation、Durability)和BASE(Basically Available、Soft state、Eventually consistent)，关于两者的区别描述正确的是（）

A、ACID的扩展依赖于在商业服务器间自动传播数据，BASE则依赖产品B、ACID的数据结构在运行中调整，BASE的表结构必须存在C、BASE的数据结构在运行中调整，ACID的表结构必须存在D、ACID来源于开源，BASE则来源于商业和开源

170. 下列属于技术元数据的是？（）

A、数据集、表和字段的定义和描述B、数据标准C、数据溯源和数据血缘D、物理数据库表名和字段名

171. 元数据通常分为三种类型，它们是？（）

A、业务，技术和操作B、业务，战略和元数据C、技术，基础架构和实例D、业务，技术和战略

172. 在DAMA-DMBOK中，关于数据治理和数据管理的区别，不正确的是？（）

A、数据管理是数据治理的一部分B、数据治理管理统领其他数据管理领域，确保各项数据管理活动统筹有序开展C、数据治理并非一次性工作。数据治理必须被嵌入数据管理生命周期和基础活动中D、数据治理处于数据管理的核心地位，数据治理指导其他所有数据管理职能

173. 工业总产出按产品的（）计算。

A、生产量B、库存销售量C、期末库存量D、期初库存量

174. 统计分析是建立在丰富资料基础上的，它是要用（）来"说话"的。

A、产量B、利润C、收入D、数字数据

175. 时期指标的数值与（）有关。

A、当期指标大小B、计划指标大小C、与最终时点值D、时间长短

176. 原始记录必须具备（）和直接性的特点。

A、可操作B、灵活性C、准确性D、最原始性

177. 首钢矿业公司的矿产品是（）。

A、精矿粉B、重型汽车C、球团矿D、烧结矿

178. 下列指标中，（）属于时点指标。

A、产品产量B、实现利润C、销售收入D、库存量

179. 矿业公司数据管理，坚持以专业线为主的原则，实行（）级管理。

A、二级B、公司、厂矿、车间三级C、四级D、五级

180. 期末人数是指：（）。

A、报告期最后一天的实有人数B、报告期最后一周人数C、报告期最后时点人数D、报告期最后三天人数

181. 成本是指企业为：（）

A、生产产品而发生的各种费用B、生产产品、提供劳务而发生的各种费用C、提供劳务而发生的各种费用D、生产产品而发生的各种消耗

182. 工业产品销售率理论值为：（）。

A、等于100%B、98%C、99%D、97%

183. 企业经营目标是由各项（）组成的。

A、计划指标B、技术经济指标C、技术经营指标D、生产组织指标

184. 设置数据体系，要具体明确目的要求、数据格式、负责单位、录入及传输时间、传递流程、（）等。

A、操作人员B、明确岗位C、计算方法及口径D、岗位职责

185. 矿业公司各处室、各厂矿根据专业、行业特点需要新制订在本专业系统、矿业公司内部使用的数据指标，应明确统计口径、计算方法，经同级（）部门审查并报矿业公司主管领导审定批准后纳入数据指标体系执行，同时报同级计划部门及上一级专业管理部门备案。

A、生产部B、计划C、计财部D、设备部

186. 数据指标的统计口径、计算方法等一经确定，任何单位、任何个人不得擅自修改和变动。如确需补充、完善、修改的，要报上一级专业管理部门及主管领导审定，并会知同级（）部门。

A、计划B、生产部C、技术质量部D、设备部

187. （）的提高就意味着劳动者在单位时间内的效率的提高。

A、劳动生产率B、企业效益C、个人收入D、个人支出

188. 某工业企业某种产品年产量100万件，其年末库存量为28万件，它们（）。

A、前者是时点指标，后者是时期指标B、前者是时期指标，后者是时点指标C、是时期指标D、是时点指标

189. 总量指标按所反映的时间状况不同分为（）

A、时期指标和时点指标B、总量和相对C、比例和比率D、比值和比率

190. 发现传输出的数据有误需改错时，经办人需报告上一级专业管理部门，经同意并办理更正手续后，在（）予以修正，全年一次性核实调整。

A、本报告期B、上一报告期C、次年一月份D、次年二月份

191. 矿业公司精矿粉月度结产时间（）。

A、1日至30日B、1日至31日C、1日0点至月末24点D、1日至28日

192. 在普查年份，基本单位统计的调查方法采用（）。

A、重点查B、全面调查C、典型查D、抽样查

193. 某矿山月矿石产量为1812万吨，是（）。

A、时点B、时期指标C、阶段D、价值

194. 质量指标的表现形式是（）。

A、绝对值B、绝对数C、平均数D、相对数和平均数

195. 总量指标（）。

A、能从无限总体中计算出来B、数值大小与总体范围无关C、与数学中的绝对数是一个D、反映一定时间、地点、条件下某种经济现象的总规模或总水平

196. 下列资料属于原始记录的是（）。

A、统计台账B、现场记录的生产记录C、汇总报表D、整理报表

197. 产品销售量统计的原则是（）。

A、产品质量B、已经实现销售的产品C、产品库存D、产品生产

198. 统计调查的基本任务是取得原始统计资料，所谓原始统计资料是指（）。

A、统计部门掌握的统计资料B、向调查单位搜集的尚待汇总整理的个体资料C、对历史资料分析预测数据D、统计年鉴或统计公报资料

199. 统计的认识过程是（）。

A、定量认识到定量认识B、定量认识到定性认识C、定性认识到定量认识D、定性认识到定量认识再到定量认识与定性认识相结合

200. 某单位人均收入最高4260元，最低为2700元，据此分为六组，形成闭口式等距数列，则组距应为（）。

A、70000B、260C、50000D、80000

201. （）是统计工作的基础阶段。

A、设计B、统计调查C、整理D、分析

202. 某市工业企业2006年生产经营成果年报呈报时间规定在2007年1月31日，则调查期限为（）。

A、1天B、一个月C、5天D、7天

203. 工业总产出按（）计算。

A、生产活动的最终成果B、购买总量C、库存总量D、消耗总量

204. 静态数列，也称时点数列，是反映（）。

A、同一时间条件下总体内部的数量分布B、不同总体C、数量变化D、数量分布

205. 统计分组的关键在于确定（）。

A、组值B、组距C、组数D、分组标志和分组界限

206. 一些经常性说法，如超过历史最好水平、位居世界前列等，采用的是（）。

A、对比分析法B、比例法C、弹性法D、因素法

207. 某企业计划产品产量100万吨，实际完成115万吨，则其计划完成率为（）。

A、102.3%B、104%C、140%D、115%

208. 2007年国内生产总值246619亿元；2002年全国金融、保险业增加值为5948.9亿元；2003年全社会固定资产投资总额为55566.61亿元；2003年全国城乡居民人民币储蓄存款余额103617.7亿元。以上总量指标依次为（）。

A、时点指标、时期指标、时点指标、时点指标B、时点指标、时期指标、时点指标、时期指标C、时期指标、时期指标、时期指标、时点指标D、时点指标、时期指标、时点指标、时期指标

更多问卷复制此问卷