《大数据分析》期中考试

考试时间:30分钟
考试要求:每人限做一次
基本信息:
姓名:
班级:
学号:
1. 下列不属于大数据4V特点的是()?
2. 大数据4V中Volume代表的含义是()?
3. 大数据4V中Variety指的是()?
4. 大数据4V中Velocity强调数据的()?
5. 大数据4V中Value核心特点是()?
6. 大数据处理流程的第一步是()?
7. 大数据处理流程的正确顺序是()?
8. 下列属于数据采集工具的是()?
9. 主要用于高吞吐实时数据采集与分发的工具是()?
10. Flume主要擅长采集的数据类型是()?
11. 大数据分布式文件存储系统是()?
12. HDFS不适合存储以下哪种数据()?
13. HDFS的主节点叫做()?
14. HDFS的数据实际存储节点是()?
15. 适合海量数据实时随机读写的分布式数据库是()?
16. HBase是一种什么类型数据库()?
17. 第一代大数据离线计算框架是()?
18. MapReduce计算速度慢的主要原因是()?
19. 目前主流的大数据内存计算框架是()?
20. Spark比MapReduce快的核心原因是()?
21. Spark核心抽象是()?
22. 下列不属于Spark优势的是()?
23. 将SQL转为大数据计算任务的数据仓库工具是()?
24. Hive的主要特点是()?
25. 支持大数据秒级实时SQL查询的引擎是()?
26. Impala相比Hive的优势是()?
27. 下列属于数据可视化工具的是()?
28. 下列不属于数据可视化工具的是()?
29. 数据可视化的主要目的是()?
30. 传统数据分析处理的数据特点是()?
31. 大数据处理与传统数据分析相比,优势是()?
32. 小数据量手动做报表、简单统计用()?
33. 适合存储中小规模结构化数据的关系型数据库是()?
34. 单台机器处理中量级数据,常用Python的库是()?
35. 处理亿级以上海量数据必须用()?
36. 下列属于非结构化数据的是()?
37. 下列属于结构化数据的是()?
38. 数据清洗的主要目的是()?
39. 大数据采集的核心目标是()?
40. Kafka的作用类似于()?
41. HDFS的生活化类比是()?
42. HBase适合的场景是()?
43. MapReduce适合的场景是()?
44. Spark适合的场景是()?
45. Hive适合的查询场景是()?
46. Impala适合的查询场景是()?
47. 下列不属于大数据技术应用场景的是()?
48. 大数据处理中“分布式”含义是()?
49. 大数据技术栈中,负责数据传输缓冲的是()?
50. 下列工具中,不做计算只做采集传输的是()?
51. 下列工具中,不存储数据只做查询转换的是()?
52. 大数据价值密度低指的是()?
53. 实时数据处理对应的4V特点是()?
54. 大数据处理流程中,“加工数据”的环节是()?
55. 大数据处理流程中,“存放数据”的环节是()?
56. 大数据处理流程中,“查找数据”的环节是()?
57. 下列哪种场景最需要大数据技术()?
58. 小数据的特点是()?
59. 下列不属于数据采集来源的是()?
60. HDFS默认数据备份数是()?
61. Spark不适合处理的数据规模是()?
62. 下列工具中,属于实时计算支撑的是()?
63. 数据查询的目的是()?
64. Tableau的主要作用是()?
65. 传统数据处理架构是()?
66. 大数据处理架构主要是()?
67. 下列属于半结构化数据的是()?
68. 大数据技术中,ETL中的L代表()?
69. ETL中的E代表()?
70. 数据预处理不包括()?
71. 下列哪种工具适合非技术人员查询大数据()?
72. Kafka不具备的功能是()?
73. Flume不适合采集()?
74. HBase不支持()?
75. 下列说法正确的是()?
76. 大数据分析最终服务于()?
77. 高职学习大数据应重点掌握()?
78. 下列属于大数据核心价值的是()?
79. 数据采集、存储、计算属于大数据的()?
80. 下列组合中,全部属于大数据工具的是()?
81. 下列不属于大数据采集环节作用的是()?
82. 数据采集时能保证数据不丢失、可故障恢复,体现了Flume的()?
83. Kafka作为消息队列,主要解决的问题是()?
84. HDFS将大文件分块存储,主要目的是()?
85. HBase依赖的底层存储系统是()?
86. MapReduce的核心计算思想是()?
87. Spark支持的编程语言不包括()?
88. Hive查询速度较慢,主要因为()?
89. Impala能实现秒级查询,是因为()?
90. 数据可视化最核心的价值是()?
91. 下列属于半结构化数据的是()?
92. 数据清洗中“去重”的含义是()?
93. 分布式计算的优势是()?
94. 传统数据分析处理一般采用()?
95. 电商“双11”实时订单统计,最适合用()?
96. 下列工具中,主要做“数据翻译”(SQL转计算任务)的是()?
97. 小数据量、临时快速做图表,优先选用()?
98. 大数据处理中ETL的正确顺序是()?
99. 下列场景最能体现大数据“Velocity高速”特征的是()?
100. 下列全部属于大数据存储工具的是()?
更多问卷 复制此问卷