矿业公司数据应用能力提升在线考试
一、单选题
1. 以下哪项是线性变换的主要目的?()
A、增加数据维度
B、减少数据噪声
C、将数据缩放到特定范围
D、改变数据结构
2. Min-Max缩放公式是什么?()
A、(x - min)/(max - min)
B、(x - mean)/std
C、x / sum
D、log(x)
3. Z-score标准化的公式是什么?()
A、(x - min)/(max - min)
B、(x - mean)/std
C、x / max
D、sqrt(x)
4. 数据质量评估的主要维度不包括?()
A、准确性
B、完整性
C、一致性
D、美观性
5. 识别数据清洗需求的第一步是?()
A、数据收集
B、业务需求分析
C、模型训练
D、结果可视化
6. 常用的数据清洗需求分析方法不包括?()
A、统计分析
B、数据可视化
C、机器学习聚类
D、人工审核
7. 数据清洗方案的基本组件不包括?()
A、输入数据源
B、清洗规则
C、输出格式
D、模型参数
8. 处理缺失值的常见方法不包括?()
A、删除记录
B、均值填充
C、机器学习预测
D、数据加密
9. 识别异常值的统计方法不包括?()
A、Z-score
B、四分位距法(IQR)
C、聚类分析
D、线性回归
10. 编写自定义数据预处理函数时,首要原则是?()
A、代码简洁
B、可复用性
C、高性能
D、符合业务需求
11. 在Python中,使用Pandas处理缺失值的常用函数是?()
A、fillna()
B、dropna()
C、replace()
D、所有以上
12. 数据预处理函数测试的关键不包括?()
A、单元测试
B、集成测试
C、性能测试
D、用户培训
13. 在多元统计分析中,以下哪项是多元数据的特点?()
A、只包含一个变量
B、变量之间相互独立
C、变量之间可能存在相关性
D、总是正态分布
14. 多元正态分布的性质包括以下哪项?()
A、边缘分布是正态的
B、条件分布是正态的
C、线性变换后仍是多元正态
D、以上所有
15. Hotelling's T²检验主要用于:()
A、检验一个样本的均值向量是否等于给定向量
B、检验两个独立样本的均值向量是否相等
C、检验多个样本的均值
D、检验方差
16. 判别分析的主要目的是什么?()
A、预测连续变量
B、分类样本到预定义组
C、降维
D、聚类数据
17. 线性判别分析()的核心思想是什么?(C)
A、最小化类内散度
B、最大化类间散度
C、同时最小化类内散度和最大化类间散度
D、使用非线性边界
18. 二次判别分析(QDA)与线性判别分析()的主要区别是什么?(B)
A、QDA假设各类协方差矩阵相同
B、QDA使用二次决策边界
C、QDA只能用于线性分类
D、QDA不要求正态分布
19. 判别分析在医疗诊断中的应用包括哪些?()
A、疾病分类
B、药物剂量预测
C、患者分群
D、生存分析
20. 聚类分析的主要目标是什么?()
A、预测标签
B、发现数据内在分组
C、降维
D、回归分析
21. K-means算法的核心步骤是什么?()
A、随机初始化中心点,分配样本,更新中心点
B、构建树状图
C、最大化类间距离
D、最小化回归误差
22. 层次聚类的主要类型是什么?()
A、划分式
B、凝聚式和分裂式
C、基于密度
D、基于网格
23. 主成分分析(PCA)的主要目的是什么?()
A、分类数据
B、降维和去噪
C、聚类数据
D、回归预测
24. 主成分分析(PCA)中,主成分的方向由什么决定?()
A、特征向量
B、特征值
C、相关系数
D、协方差矩阵
25. 主成分分析(PCA)的标准步骤中,第一步是什么?()
A、计算协方差矩阵
B、标准化数据
C、计算特征值
D、选择主成分
26. 因子分析的主要目的是什么?()
A、降维
B、探索变量间潜在结构
C、分类
D、预测
27. 因子模型中,因子载荷表示什么?()
A、因子与变量的相关系数
B、变量方差
C、因子得分
D、误差项
28. 因子旋转的主要目的是什么?()
A、减少因子数
B、提高因子解释性
C、增加方差贡献
D、降低误差
29. 时间序列数据的主要特征是什么?()
A、独立性
B、趋势、季节性和随机性
C、高维度
D、类别平衡
30. 平稳时间序列的定义是什么?()
A、均值、方差、自协方差不随时间变化
B、无趋势和季节性
C、高预测精度
D、正态分布
31. 自回归积分滑动平均模型(ARIMA)模型中的参数(p,d,q)分别代表什么?()
A、自回归阶数、差分阶数、移动平均阶数
B、部分阶数、差分阶数、季节阶数
C、自回归阶数、季节阶数、移动平均阶数
D、滞后阶数、差分阶数、误差阶数
32. 在特征工程中,评估挖掘需求时,哪个因素通常不被考虑?()
A、业务目标
B、数据质量
C、模型算法
D、用户界面设计
33. 以下哪种方法不是特征选择技术?()
A、方差阈值
B、相关系数
C、主成分分析
D、随机森林重要性
34. 对于特征缩放,以下哪种方法受异常值影响最大?()
A、标准化
B、归一化
C、鲁棒缩放
D、最大绝对值缩放
35. 在Python中,哪个库不常用于机器学习模型训练?()
A、scikit-learn
B、TensorFlow
C、Pandas
D、PyTorch
36. 模型训练流程中,以下哪步不是必须的?()
A、数据预处理
B、特征工程
C、模型部署
D、模型评估
37. 超参数初始化通常基于:()
A、经验值
B、网格搜索
C、随机搜索
D、所有以上
38. 对于不平衡分类问题,哪个指标最合适?()
A、准确率
B、精确率
C、召回率
D、F1分数
39. 模型验证方法不包括:()
A、留出法
B、交叉验证
C、自助法
D、特征选择
40. 超参数调优方法中,哪个不基于搜索?()
A、网格搜索
B、随机搜索
C、贝叶斯优化
D、手动设置
41. 测试集用于:()
A、训练模型
B、调优模型
C、最终评估
D、特征工程
42. 对于多分类问题,宏平均F1计算方式:()
A、各类F1平均
B、总TP/总预测
C、微平均
D、加权平均
43. 模型评估报告不包括:()
A、模型架构
B、性能指标
C、训练时间
D、数据来源
44. 假设检验中第一类错误是指?()
A、接受真H₀
B、拒绝真H₀
C、接受假H₁
D、拒绝假H₁
45. 95%置信区间的含义是?()
A、包含总体参数的概率为95%
B、包含样本统计量的概率为95%
C、重复抽样时95%区间包含真值
D、参数落在区间内的概率95%
46. Pearson相关系数的取值范围是?()
A、[0,1]
B、[-1,1]
C、(-∞,+∞)
D、[0,+∞)
47. 处理高维稀疏文本数据首选?()
A、逻辑回归
B、随机森林
C、SVM
D、KNN
48. 轮廓系数的取值范围是?()
A、[0,1]
B、[-1,1]
C、(-∞,+∞)
D、[0,+∞)
49. 分类任务中类别不平衡问题的解决方案不包括?()
A、过采样
B、欠采样
C、特征缩放
D、类别权重调整
50. 基于模型的特征重要性分析不适用于?()
A、决策树
B、线性回归
C、随机森林
D、K-means
51. t-分布随机邻域嵌入(t-SNE)主要用于?()
A、线性降维
B、特征选择
C、可视化高维数据
D、异常检测
52. 人工少数类过采样技术(SMOTE)通过?()
A、复制少数类样本
B、插值生成新样本
C、删除多数类样本
D、调整分类阈值
53. Bagging算法的核心是?()
A、提升偏差
B、降低方差
C、特征变换
D、数据增强
54. Adaboost迭代过程中会增加?()
A、错分样本权重
B、正确样本权重
C、特征维度
D、学习率
55. Stacking的元模型通常采用?()
A、决策树
B、逻辑回归
C、KNN
D、贝叶斯
56. RESTful API的核心特征是?()
A、状态存储
B、无状态
C、强耦合
D、二进制传输
57. API响应时间主要优化手段是?()
A、模型量化
B、缓存机制
C、异步处理
D、以上都是
58. API健康监测不包括?()
A、响应时间
B、错误率
C、用户IP
D、CPU使用率
59. 知识库最不适合存储的内容是?()
A、结构化数据表
B、PDF文档
C、实时传感器流数据
D、FAQ问答对
60. 提升检索召回率的关键技术是?()
A、精确匹配
B、同义词扩展
C、结果排序
D、缓存机制
61. 对话状态跟踪(DST)的主要作用是?()
A、记录聊天历史
B、理解用户意图
C、维护上下文状态
D、生成回复
62. 需求分析阶段不需要明确?()
A、输入数据类型
B、服务器品牌
C、异常处理策略
D、输出格式
63. 处理API限流的策略不包括?()
A、指数退避
B、请求缓存
C、同步等待
D、伪造Header
64. Pandas处理缺失值的方法是?()
A、fillna()
B、addna()
C、delna()
D、nona()
65. 某业务部门在制定“客户类型”代码标准时,仅凭本部门的业务习惯定义了代码集,并未与其他相关部门进行协商,也未遵循集团的审批流程。这种做法主要违背了数据标准制定的哪一项核心目标?()
A、提升数据存储效率
B、确保数据物理安全
C、建立跨部门的“通用语言”
D、简化数据备份流程
66. 根据DAMA-DMBOK,构建业务术语表(Business Glossary)的首要目标是?()
A、形成一份完整的数据模型文档
B、建立一个集中的数据备份索引
C、在组织内实现对核心业务概念和术语的共同理解
D、自动化数据质量校验规则的生成
67. 在数据治理体系中,对某个核心业务数据(如“合同签约额”)的业务口径和定义拥有最终审批权的角色是?()
A、数据开发人员
B、数据使用者
C、数据所有者
D、数据管理者
68. 某大型集团企业,各子公司IT系统独立建设,数据管理能力参差不齐,但集团层面希望快速建立一个统一的数据资产视图以支持数据查找和治理。在这种情况下,最适合作为起步的元数据管理架构是?()
A、集中式架构,要求所有子公司立即将全部元数据迁移至中央库
B、分布式架构,维持现状,各子公司自行管理元数据
C、混合式(或联邦式)架构,建立中央元数据注册中心,通过适配器连接并整合各子公司的元数据,而不进行物理迁移
D、无架构,先通过Excel表格手动汇总所有元数据
69. 相比于手动绘制数据流转图,利用自动化工具解析ETL脚本和数据库日志来构建数据血缘,其最核心的优势在于?()
A、生成的血缘图谱更美观
B、能够反映数据真实、客观的流转路径,且能随系统变更自动更新
C、不需要业务人员的参与
D、构建过程完全不需要计算资源
70. 构建数据资产目录以实现“找数、懂数、用数”的闭环中,“懂数”环节主要依赖于目录提供的哪项功能?()
A、强大的全文搜索引擎
B、友好的用户界面和交互设计
C、丰富、准确的元数据信息,如业务定义、数据所有者、质量规则和数据血缘
D、一键式的数据下载功能
71. 根据财政部《企业数据资源相关会计处理暂行规定》,企业在日常活动中持有、以出售为最终目的的数据资源,通常应被确认为哪一类会计资产?()
A、无形资产
B、存货
C、固定资产
D、交易性金融资产
72. 在处理数据质量问题时,根本原因分析(Root Cause Analysis,RCA)的主要目的是?()
A、快速清洗所有已发现的错误数据
B、识别并处罚造成数据错误的责任人
C、找到导致问题发生的深层次、系统性原因,而不仅仅是处理表面症状
D、编写一份详细的数据质量问题报告
73. 在制定项目管理计划时,强调其“整合性”的核心价值在于?()
A、确保计划文档的格式统一,便于阅读
B、确保所有子计划相互协调、不存在冲突,共同服务于项目总体目标
C、将所有项目文档物理上合并到一个文件夹中,便于归档
D、减少项目经理需要编写的文档数量
74. 项目经理通过比较项目实际完成的工作量与计划完成的工作量,发现存在差异。这个活动属于哪种项目监控技术?()
A、趋势分析
B、偏差分析
C、根本原因分析
D、假设情景分析
75. 在挣值管理(Earned Value Management,EVM)中,表示“在给定时间点,实际完成工作的预算成本”的指标是?()
A、计划价值 (PV)
B、挣值 (EV)
C、实际成本 (AC)
D、完工预算 (BAC)
76. 根据PMBOK指南,项目风险管理流程的第一步是?()
A、识别风险
B、规划风险管理
C、实施定性风险分析
D、监督风险
77. 在项目风险管理流程中,“实施风险应对”过程紧接在哪个过程之后?()
A、识别风险
B、实施定量风险分析
C、规划风险应对
D、监督风险
78. 定性风险分析最主要的目标是?()
A、计算出每个风险可能造成的具体财务损失金额
B、通过评估风险的概率和影响,对已识别的风险进行优先级排序
C、为每个风险制定详细的应对计划
D、绘制出项目成本和进度的概率分布图
79. 实施整体变更控制流程的核心活动是?()
A、鼓励项目团队成员随时进行创新性修改
B、尽可能地拒绝所有变更请求,以保证项目基准的稳定
C、对所有提交的变更请求进行全面的影响分析,并由授权机构进行审批决策
D、将所有变更请求的决策权完全下放给一线开发人员
80. 在 SQL 中,用于从表中检索数据的语句是?()
A、INSERT
B、SELECT
C、DELETE
D、UPDATE
81. 以下哪种不是常见的表关联类型?()
A、内连接
B、外连接
C、交叉连接
D、循环连接
82. 以下哪种 SQL 语法不能实现表关联?()
A、使用 JOIN 关键字
B、在 WHERE 子句中指定关联条件
C、使用 MERGE 关键字
D、使用子查询关联
83. 数据标准化(归一化)的主要目的是?()
A、处理缺失值
B、剔除异常值
C、消除量纲影响
D、简化数据
84. 以下哪种场景属于多对多关联?()
A、学生和班级(一个班级多个学生)
B、商品和订单(一个订单多个商品,一个商品多个订单)
C、员工和部门(一个部门多个员工)
D、客户和订单(一个客户多个订单)
85. 中间表中至少应包含的字段是?()
A、两个关联表的主键
B、中间表自己的主键
C、关联表的所有字段
D、以上都不是
86. 以下 SQL 语句中,哪一个可以正确处理多对多关联(假设表 A、表 B 为多对多关联,中间表为 AB)?()
A、SELECT * FROM A JOIN B ON A.id = B.aid
B、SELECT * FROM A JOIN AB ON A.id = AB.aid JOIN B ON AB.bid = B.id
C、SELECT * FROM A,B WHERE A.id = B.aid
D、SELECT * FROM AB JOIN A,B ON AB.aid = A.id AND AB.bid = B.id
87. 以下哪种分布属于离散型概率分布?()
A、正态分布
B、均匀分布
C、二项分布
D、指数分布
88. Excel中,计算一组数据的中位数应使用哪个函数?()
A、AVERAGE()
B、MEDIAN()
C、MODE()
D、STDEV()
89. 以下哪种方法不属于数据清洗的常用手段?()
A、缺失值填充
B、数据归一化
C、异常值剔除
D、重复值删除
90. SQL中,GROUP BY子句的作用是?()
A、排序数据
B、连接表
C、筛选数据
D、分组统计数据
91. 以下哪种图表适合展示数据的变化趋势?()
A、饼图
B、折线图
C、柱状图
D、散点图
92. 用于检验两个总体均值是否存在显著差异的统计方法是什么?()
A、卡方检验
B、t检验
C、方差分析
D、回归分析
93. 以下哪个是衡量数据离散程度的指标?()
A、众数
B、中位数
C、标准差
D、平均数
94. 在数据分析中,“特征工程”的核心目的是?()
A、收集更多数据
B、优化模型输入特征
C、可视化数据结果
D、验证模型准确性
95. 正态分布曲线的形状由哪个参数决定?()
A、均值
B、方差
C、中位数
D、众数
96. SQL中,用于排序数据的关键字是?()
A、GROUP BY
B、SORT BY
C、ORDER BY
D、ARRANGE BY
97. 以下哪个指标可以反映数据的对称性?()
A、峰度
B、偏度
C、均值
D、方差
98. 以下哪种图表适合展示各部分占总体的比例?()
A、折线图
B、柱状图
C、饼图
D、散点图
99. SQL中,用于更新表中数据的关键字是?()
A、UPDATE
B、INSERT
C、DELETE
D、SELECT
100. Excel中,条件格式的核心作用是?()
A、按条件筛选数据
B、按条件设置单元格格式
C、按条件排序数据
D、按条件汇总数据
101. 以下哪种数据类型属于定性数据?()
A、产量
B、设备状态
C、电流值
D、销售额
102. 正态分布中,约有多少比例的数据落在均值±1个标准差范围内?()
A、50%
B、68.27%
C、95.45%
D、99.73%
103. SQL中,DISTINCT关键字的作用是?()
A、排序数据
B、去重
C、筛选数据
D、分组统计
104. 在 Python 中,以下哪个是对 "类" 的正确描述?()
A、类是对象的实例
B、类是创建对象的模板
C、类是一种数据类型,只能包含属性
D、类不能包含方法
105. 在面向对象编程中,对象的 "属性" 指的是:()
A、对象可以执行的操作
B、对象所具有的特征或状态
C、创建对象的过程
D、对象之间的继承关系
106. 数据可视化中,热力图主要用于展示什么?()
A、数据变化趋势
B、各部分占比
C、变量间相关性
D、数据分布
107. 数据可视化的核心目的是?()
A、使数据更美观
B、满足报告格式要求
C、快速传递数据信息和洞察
D、处理大量数据
108. 在面向对象编程中,继承的主要目的是:()
A、提高代码的执行效率
B、实现代码的复用和扩展
C、隐藏类的实现细节
D、限制类的使用范围
109. 以下哪种模型属于监督学习模型?()
A、K-means聚类
B、主成分分析
C、线性回归
D、层次聚类
110. 面向对象编程中的 "封装" 指的是:()
A、将数据和操作数据的方法捆绑在一起
B、隐藏类的所有信息,不允许外部访问
C、将多个类合并为一个类
D、限制类的继承
111. 正态分布的均值、中位数和众数之间的关系是?()
A、均值<中位数<众数
B、均值=中位数=众数
C、均值>中位数>众数
D、无固定关系
112. Excel中,数据验证功能的核心作用是?()
A、筛选数据
B、限制单元格输入内容
C、格式化单元格
D、汇总数据
113. Excel中,用于查找数据的函数是?()
A、VLOOKUP()
B、HLOOKUP()
C、XLOOKUP()
D、以上都是
114. 统计学中,置信区间的核心意义是?()
A、确定总体参数的精确值
B、估计总体参数的可能范围
C、检验假设是否成立
D、描述数据离散程度
115. 以下哪种分布的均值和方差相等?()
A、正态分布
B、泊松分布
C、二项分布
D、均匀分布
116. 在包的子模块中,导入同一包内其他模块的正确方式是?()
A、from . import module
B、import module
C、from package import module
D、include module
117. 以下哪种导入方式属于包的绝对导入?()
A、from .subpackage import module
B、from .. import module
C、from package.subpackage import module
D、import .module
118. 以下关于相对导入和绝对导入的区别,说法正确的是?()
A、相对导入更适合跨包导入,绝对导入适合包内导入
B、相对导入使用模块的全路径,绝对导入使用.和..
C、相对导入依赖于当前模块的位置,绝对导入不依赖
D、绝对导入只能导入标准库包
119. 以下哪种数据预处理方法属于特征转换?()
A、独热编码(One-Hot)
B、缺失值填充
C、异常值剔除
D、重复值删除
120. 一个规范的自定义模块通常应包含的内容是?()
A、仅函数定义
B、函数、类、常量及文档字符串
C、必须包含 main 函数
D、只能有一个类
121. 以下哪种统计方法用于分析多个变量间的线性关系?()
A、简单相关分析
B、因子分析
C、聚类分析
D、多元回归分析
122. 以下哪个模块可以用于编写自定义模块的单元测试?()
A、pytest
B、unittest
C、doctest
D、以上都是
123. 统计学中,方差的计算公式是?()
A、各数据与均值差的平方和的平均值
B、各数据与均值差的绝对值的平均值
C、最大值与最小值的差
D、各数据与中位数差的平方和的平均值
124. 以下哪种模型属于无监督学习模型?()
A、K-means聚类
B、决策树分类
C、线性回归
D、逻辑回归
125. 以下哪种统计量用于描述数据的集中趋势?()
A、偏度
B、众数
C、峰度
D、标准差
126. 峰度用于描述数据分布的什么特征?()
A、集中趋势
B、离散程度
C、对称性
D、陡峭程度
127. 以下哪种图表适合展示多组数据的变化趋势?()
A、柱状图
B、饼图
C、折线图
D、散点图
128. 在假设检验中,显著性水平α通常取值为?()
A、0.01
B、0.05
C、0.1
D、0.5
129. 以下哪种方法属于数据降维的常用方法?()
A、线性回归
B、主成分分析(PCA)
C、逻辑回归
D、决策树
130. SQL中,用于计算分组数据的平均值应使用哪个函数?()
A、SUM()
B、AVG()
C、COUNT()
D、MAX()
131. SQL中,LIMIT关键字的作用是?()
A、筛选数据
B、限制查询结果的行数
C、限制查询的列数
D、排序数据
132. 安装数据库时,选择存储位置的关键注意事项是?()
A、存储位置的文件夹名称是否美观
B、存储位置的硬盘空间是否充足
C、存储位置是否在 C 盘
D、存储位置是否有多个子文件夹
133. 安装数据库前,不需要检查的环境是?()
A、硬盘剩余空间
B、操作系统版本
C、显示器分辨率
D、管理员权限
134. 选择数据库存储位置时,最关键的原则是?()
A、路径包含中文
B、空间充足且稳定
C、桌面文件夹
D、系统盘根目录
135. 同一份数据上午查询快、下午查询慢,最可能的原因是?()
A、上午电脑性能更好
B、下午同时查询的人数更多
C、数据格式发生了变化
D、下午网络信号更强
136. 优化查询速度的有效方法是?()
A、关闭杀毒软件
B、限定查询时间范围(如只查近 7 天)
C、更换查询工具图标
D、重启路由器
137. Excel中,IF函数的语法格式是?()
A、IF(条件, 真值, 假值)
B、IF(真值, 条件, 假值)
C、IF(假值, 真值, 条件)
D、IF(条件, 假值, 真值)
138. 数据恢复的第一步操作是?()
A、重启数据库系统
B、找到对应的备份文件
C、联系 IT 人员
D、格式化存储设备
139. 容灾演练中,不需要模拟的场景是?()
A、服务器断电导致数据丢失
B、误删关键生产数据
C、数据库登录密码遗忘
D、网络中断导致数据同步失败
140. 信息系统日常监控中最需关注的指标是?()
A、软件图标样式
B、登录响应时间(如是否超过 10 秒)
C、操作工电脑壁纸
D、数据库安装路径
141. 属于数据库小故障的是?()
A、服务器爆炸
B、登录后提示 “存储空间不足”
C、全公司网络中断
D、硬盘物理损坏
142. 数据采集过程中,以下哪种方式属于结构化数据采集?()
A、爬取网页文本
B、采集图片信息
C、读取数据库表
D、录制音频数据
143. 检验部门频繁录入数据、厂矿单位频繁查询数据,为避免卡顿,应采取的措施是?()
A、让检验部门暂停录入
B、为录入和查询分配独立系统资源
C、让厂矿单位减少查询次数
D、删除历史数据
144. 以下哪种业务不适合分开处理数据录入和查询?()
A、紧急插单(录入后需立即查询确认)
B、月度生产统计(月底集中录入,次月查询)
C、历史数据归档(一次性录入,偶尔查询)
D、设备维修记录(定期录入,季度查询)
145. 数据库读写分离中,录入权限应分配给?()
A、所有员工
B、生产录入员(专人负责)
C、仅管理层
D、外部审计人员
146. 读写分离后,录入数据多久同步到查询端合理?()
A、1-5 分钟
B、1-2 小时
C、1 天
D、实时(0 延迟)
147. 当录入和查询同时操作导致冲突时,优先保障?()
A、录入(避免生产数据丢失)
B、查询(确保业务部门获取数据)
C、同时中断
D、随机选择一项
148. 安装分布式数据库时,不需要填写的信息是?()
A、各存储点的名称(如 “炼钢车间服务器”)
B、存储路径(如服务器文件夹位置)
C、各存储点的管理员家庭住址
D、访问权限(如登录账号密码)
149. 日常检查分布式数据库各存储点数据是否一致的简单方法是?()
A、对比各存储点的创建时间
B、查询同一工单编号的关键信息(如数量、日期)
C、统计各存储点的文件大小
D、检查服务器的品牌型号
150. 矿业公司如果要搭建分布式数据库,节点应优先部署在?()
A、单一办公室
B、各厂矿单位机房
C、外部合作单位
D、员工宿舍
151. 当某一存储节点故障时,应立即?()
A、关闭所有节点
B、切换至其他正常节点继续业务
C、停止生产等待修复
D、删除故障节点数据
152. 按 “月份” 对生产数据分类的主要好处是?()
A、减少数据总量
B、便于快速查询某时间段的数据(如月度统计)
C、提高数据安全性
D、降低存储成本
153. 常用的数据分类维度有?()
A、时间(如年/月/日)
B、业务类型(如工单、库存、设备)
C、状态(如已完成、进行中)
D、文件格式(如 Excel、Word)
154. 优化分类检索效率的方法是?()
A、增加分类层级(如 10 级以上)
B、关键分类放在前 3 级(如年、月、车间)
C、所有数据放在同一文件夹
D、分类名称用复杂缩写
155. 从MES系统提取生产数据的第一步是?()
A、关闭MES系统
B、登录MES系统并定位目标数据模块(如 “质检综合查询”)
C、格式化存储设备
D、联系软件开发商
156. 按 “采矿→选矿→销售” 流程整理数据的好处是?()
A、减少数据存储量
B、便于追溯产品在各环节的流转情况
C、提高数据加密等级
D、降低数据录入难度
157. 某工单数据遗漏 “钢球使用量”,最可能影响的是?()
A、设备维修计划
B、物料成本核算和库存管理
C、操作工排班
D、产品包装设计
158. 矿业公司生产数据中,需统一的术语是?()
A、“矿粉”“铁精粉” 统一为 “XX高品精矿粉”或“XX低品精矿粉”
B、各车间自行命名
C、随员工习惯称呼
D、用英文术语(如 “iron power”)
159. 采矿设备实时数据中,不需要记录的信息是?()
A、记录时间
B、设备编号
C、实时温度
D、设备生产厂家的联系电话
160. 记录设备实时数据时,必须包含的信息是?()
A、记录人心情
B、数据采集时间(精确到秒)
C、天气情况
D、设备出厂日期
161. 识别重复数据的核心依据是?()
A、数据数值完全相同
B、同一设备、同一时间的重复记录
C、记录人相同
D、设备编号相同
162. 离开电脑时,保护数据不被他人查看的简单方法是?()
A、关闭显示器
B、锁定电脑(如按 Win+L)
C、隐藏桌面图标
D、拔掉网线
163. 最有效的数据防丢失措施是?()
A、定期手动复制到 U 盘
B、系统自动定时备份(本地 + 异地)
C、只存在一台电脑中
D、不允许任何人接触数据
164. 数据修改后,必须记录的信息是?()
A、修改时的天气
B、修改人、时间、原因、前后内容
C、电脑 IP 地址
D、修改时的操作姿势
165. 矿业公司GSC系统最可能需要MES系统提供的什么数据?()
A、设备维修记录
B、当月各产品的生产数量
C、操作工的考勤数据
D、车间的水电费
166. 矿业公司GSC系统与MES系统对接的核心需求是?()
A、让两系统界面相同
B、MES 生产数据同步至 ERP(用于成本核算)
C、关闭其中一个系统
D、数据无需关联,各自独立
167. 矿业公司GSC系统与MES系统对接时,必须统一的格式是?()
A、系统界面颜色
B、关键业务字段格式
C、操作人员账号
D、软件版本号
168. 验证矿业公司GSC系统和MES系统对接数据准确性的方法是?()
A、只看 ERP 数据
B、随机抽取 10 条数据,对比两系统是否一致
C、相信系统自动对接,无需验证
D、只看 MES 数据
169. 数据库处理基本类型分为ACID(Atomicity、Consistency、Isolation、Durability)和BASE(Basically Available、Soft state、Eventually consistent),关于两者的区别描述正确的是()
A、ACID的扩展依赖于在商业服务器间自动传播数据,BASE则依赖产品
B、ACID的数据结构在运行中调整,BASE的表结构必须存在
C、BASE的数据结构在运行中调整,ACID的表结构必须存在
D、ACID来源于开源,BASE则来源于商业和开源
170. 下列属于技术元数据的是?()
A、数据集、表和字段的定义和描述
B、数据标准
C、数据溯源和数据血缘
D、物理数据库表名和字段名
171. 元数据通常分为三种类型,它们是?()
A、业务,技术和操作
B、业务,战略和元数据
C、技术,基础架构和实例
D、业务,技术和战略
172. 在DAMA-DMBOK中,关于数据治理和数据管理的区别,不正确的是?()
A、数据管理是数据治理的一部分
B、数据治理管理统领其他数据管理领域,确保各项数据管理活动统筹有序开展
C、数据治理并非一次性工作。数据治理必须被嵌入数据管理生命周期和基础活动中
D、数据治理处于数据管理的核心地位,数据治理指导其他所有数据管理职能
173. 工业总产出按产品的()计算。
A、生产量
B、库存销售量
C、期末库存量
D、期初库存量
174. 统计分析是建立在丰富资料基础上的,它是要用()来"说话"的。
A、产量
B、利润
C、收入
D、数字数据
175. 时期指标的数值与()有关。
A、当期指标大小
B、计划指标大小
C、与最终时点值
D、时间长短
176. 原始记录必须具备()和直接性的特点。
A、可操作
B、灵活性
C、准确性
D、最原始性
177. 首钢矿业公司的矿产品是()。
A、精矿粉
B、重型汽车
C、球团矿
D、烧结矿
178. 下列指标中,()属于时点指标。
A、产品产量
B、实现利润
C、销售收入
D、库存量
179. 矿业公司数据管理,坚持以专业线为主的原则,实行()级管理。
A、二级
B、公司、厂矿、车间三级
C、四级
D、五级
180. 期末人数是指:()。
A、报告期最后一天的实有人数
B、报告期最后一周人数
C、报告期最后时点人数
D、报告期最后三天人数
181. 成本是指企业为:()
A、生产产品而发生的各种费用
B、生产产品、提供劳务而发生的各种费用
C、提供劳务而发生的各种费用
D、生产产品而发生的各种消耗
182. 工业产品销售率理论值为:()。
A、等于100%
B、98%
C、99%
D、97%
183. 企业经营目标是由各项()组成的。
A、计划指标
B、技术经济指标
C、技术经营指标
D、生产组织指标
184. 设置数据体系,要具体明确目的要求、数据格式、负责单位、录入及传输时间、传递流程、()等。
A、操作人员
B、明确岗位
C、计算方法及口径
D、岗位职责
185. 矿业公司各处室、各厂矿根据专业、行业特点需要新制订在本专业系统、矿业公司内部使用的数据指标,应明确统计口径、计算方法,经同级()部门审查并报矿业公司主管领导审定批准后纳入数据指标体系执行,同时报同级计划部门及上一级专业管理部门备案。
A、生产部
B、计划
C、计财部
D、设备部
186. 数据指标的统计口径、计算方法等一经确定,任何单位、任何个人不得擅自修改和变动。如确需补充、完善、修改的,要报上一级专业管理部门及主管领导审定,并会知同级()部门。
A、计划
B、生产部
C、技术质量部
D、设备部
187. ()的提高就意味着劳动者在单位时间内的效率的提高。
A、劳动生产率
B、企业效益
C、个人收入
D、个人支出
188. 某工业企业某种产品年产量100万件,其年末库存量为28万件,它们()。
A、前者是时点指标,后者是时期指标
B、前者是时期指标,后者是时点指标
C、是时期指标
D、是时点指标
189. 总量指标按所反映的时间状况不同分为()
A、时期指标和时点指标
B、总量和相对
C、比例和比率
D、比值和比率
190. 发现传输出的数据有误需改错时,经办人需报告上一级专业管理部门,经同意并办理更正手续后,在()予以修正,全年一次性核实调整。
A、本报告期
B、上一报告期
C、次年一月份
D、次年二月份
191. 矿业公司精矿粉月度结产时间()。
A、1日至30日
B、1日至31日
C、1日0点至月末24点
D、1日至28日
192. 在普查年份,基本单位统计的调查方法采用()。
A、重点查
B、全面调查
C、典型查
D、抽样查
193. 某矿山月矿石产量为1812万吨,是()。
A、时点
B、时期指标
C、阶段
D、价值
194. 质量指标的表现形式是()。
A、绝对值
B、绝对数
C、平均数
D、相对数和平均数
195. 总量指标()。
A、能从无限总体中计算出来
B、数值大小与总体范围无关
C、与数学中的绝对数是一个
D、反映一定时间、地点、条件下某种经济现象的总规模或总水平
196. 下列资料属于原始记录的是()。
A、统计台账
B、现场记录的生产记录
C、汇总报表
D、整理报表
197. 产品销售量统计的原则是()。
A、产品质量
B、已经实现销售的产品
C、产品库存
D、产品生产
198. 统计调查的基本任务是取得原始统计资料,所谓原始统计资料是指()。
A、统计部门掌握的统计资料
B、向调查单位搜集的尚待汇总整理的个体资料
C、对历史资料分析预测数据
D、统计年鉴或统计公报资料
199. 统计的认识过程是()。
A、定量认识到定量认识
B、定量认识到定性认识
C、定性认识到定量认识
D、定性认识到定量认识再到定量认识与定性认识相结合
200. 某单位人均收入最高4260元,最低为2700元,据此分为六组,形成闭口式等距数列,则组距应为()。
A、70000
B、260
C、50000
D、80000
201. ()是统计工作的基础阶段。
A、设计
B、统计调查
C、整理
D、分析
202. 某市工业企业2006年生产经营成果年报呈报时间规定在2007年1月31日,则调查期限为()。
A、1天
B、一个月
C、5天
D、7天
203. 工业总产出按()计算。
A、生产活动的最终成果
B、购买总量
C、库存总量
D、消耗总量
204. 静态数列,也称时点数列,是反映()。
A、同一时间条件下总体内部的数量分布
B、不同总体
C、数量变化
D、数量分布
205. 统计分组的关键在于确定()。
A、组值
B、组距
C、组数
D、分组标志和分组界限
206. 一些经常性说法,如超过历史最好水平、位居世界前列等,采用的是()。
A、对比分析法
B、比例法
C、弹性法
D、因素法
207. 某企业计划产品产量100万吨,实际完成115万吨,则其计划完成率为()。
A、102.3%
B、104%
C、140%
D、115%
208. 2007年国内生产总值246619亿元;2002年全国金融、保险业增加值为5948.9亿元;2003年全社会固定资产投资总额为55566.61亿元;2003年全国城乡居民人民币储蓄存款余额103617.7亿元。以上总量指标依次为()。
A、时点指标、时期指标、时点指标、时点指标
B、时点指标、时期指标、时点指标、时期指标
C、时期指标、时期指标、时期指标、时点指标
D、时点指标、时期指标、时点指标、时期指标
关闭
更多问卷
复制此问卷