大数据导论考试
本次考试旨在考察大专生对大数据导论知识的掌握情况,满分100分。请认真作答,考试时间60分钟。
1. 考生信息
姓名:
班级:
学号:
一、单选题(每题2分,共40分)
2. 大数据的特征不包括以下哪项
大量化
高速化
多样化
单一化
3. 以下哪个不是大数据存储技术
HDFS
MySQL
NoSQL
HBase
4. 数据量达到以下哪个级别通常被认为是大数据
GB
TB
PB
EB
5. MapReduce主要用于处理哪种类型的数据任务
实时数据处理
批处理数据
流数据处理
小数据处理
6. 以下哪个是开源的大数据处理框架
Spark
Oracle
SQL Server
DB2
7. 大数据分析的目的是
收集数据
存储数据
挖掘数据价值
删除数据
8. 以下哪种数据不属于结构化数据
数据库表
Excel表格
XML文件
视频文件
9. Hadoop的核心组件不包括
HDFS
MapReduce
YARN
Spark
10. 数据清洗的主要目的是
增加数据量
提高数据质量
加密数据
压缩数据
11. 以下哪个不是大数据应用领域
金融风控
智能交通
传统信件传递
医疗诊断
12. NoSQL数据库的特点是
支持事务ACID特性
以关系模型为基础
适用于非结构化数据
只支持SQL查询
13. 大数据处理的基本流程是
采集→存储→分析→应用
存储→采集→应用→分析
分析→采集→存储→应用
应用→分析→存储→采集
14. 以下哪个工具常用于数据可视化
Hadoop
Tableau
Java
Python
15. 分布式计算的优势是
单点故障风险高
处理速度慢
可扩展性强
资源利用率低
16. 数据挖掘的主要任务不包括
分类
聚类
数据备份
关联规则挖掘
17. 以下哪种是实时数据处理框架
MapReduce
Flink
HDFS
HBase
18. 大数据对社会的影响不包括
提高决策效率
促进信息共享
加剧数据隐私问题
减少数据产生
19. 数据湖的主要特点是
只存储结构化数据
数据进入前需严格清洗
存储原始数据,按需处理
数据不可复用
20. 以下哪个不是云计算的服务模式
IaaS
PaaS
SaaS
DaaS
21. 大数据安全面临的主要挑战是
数据量小
数据价值低
数据隐私保护
数据处理速度慢
二、多选题(每题3分,共30分,每题至少有两个正确答案)
22. 大数据的4V特征包括以下哪些
Volume
Velocity
Variety
Value
23. 以下属于Hadoop生态系统组件的有
HDFS
Spark
Hive
ZooKeeper
24. 数据预处理的步骤包括
数据清洗
数据集成
数据转换
数据归约
25. 常见的NoSQL数据库类型有
键值数据库
文档数据库
列族数据库
图数据库
26. 大数据分析的常用方法有
统计分析
机器学习
数据挖掘
文本分析
27. 分布式文件系统的特点包括
高容错性
高吞吐量
可扩展性
集中式管理
28. 大数据在医疗领域的应用包括
疾病预测
个性化医疗
医疗资源优化
远程诊断
29. 数据可视化的作用有
直观展示数据
发现数据规律
辅助决策
增加数据存储量
30. 云计算与大数据的关系是
云计算为大数据提供基础设施
大数据为云计算提供应用场景
两者相互独立,无关联
云计算可以处理大数据
31. 保护数据隐私的技术手段有
数据加密
数据脱敏
访问控制
数据删除
三、判断题(每题3分,共30分)
32. 大数据的数据量一定比传统数据大
对
错
33. HDFS是一种分布式文件系统
对
错
34. MapReduce只能处理结构化数据
对
错
35. NoSQL数据库不支持事务处理
对
错
36. 数据挖掘是大数据分析的核心技术之一
对
错
37. Spark比MapReduce处理速度更快
对
错
38. 大数据分析不需要考虑数据质量
对
错
39. 云计算是大数据处理的唯一方式
对
错
40. 数据可视化只能使用图表形式
对
错
41. 大数据时代,数据安全问题可以忽略
对
错
关闭
更多问卷
复制此问卷