大数据电子商务选择题

1 YARN 中负责全局资源分配与任务调度的组件是 (  )
2 Hadoop 集群搭建中,必须在hadoop-env.sh中配置的核心环境变量是。( )
3 以下哪项是 MapReduce 的核心优势(  )。
4 Hadoop 配置文件中,core-site.xml里用于指定 NameNode 访问地址的参数是 (  )
5 yarn-env.xml文件的作用是(  )。
6 HDFS 的命名空间由哪个组件管理(  )。
7 Hive 最适合的应用场景是(  )。
8 Hadoop 集群搭建中,配置 SSH 免密码登录的核心目的是(  )。
9 启动 Hadoop 集群时,首先启动的是哪个组件的服务(  )
10以下哪个命令用于将本地文件上传至 HDFS (  )
11 HDFS 的存储策略中,默认每个数据块保留的副本数是 (  )
12 HBase 表的最小存储单元是(  )
13 MapReduce 中,将输入数据转化为中间键值对的阶段是(  )
14 Hadoop 集群搭建时,必须安装的依赖软件是(  )。
15 Hive 通过哪种语言将查询转换为分布式计算任务 (  )
16 HBase 中,行键(Row Key)的特性是(  )。
17 以下哪个命令用于格式化 HDFS 文件系统(  )。
18 Hadoop 的开发语言主要是(  )。
19 YARN 中,负责在单个节点上管理资源和任务的组件是(  )。
20 搭建 Hadoop 完全分布式集群时,需要修改的核心配置文件不包括(  )
21 Hadoop 集群搭建中,用于实现节点间无密码通信的协议是(  )。
22 HDFS 中,DataNode 向 NameNode 发送心跳信息的默认间隔是(  ) 。
23 HiveQL 中,用于创建分区表的关键字是(  )。
24 HBase 中,行键(Row Key)的特性是(  )。
25 下列哪项通常是Hadoop集群的最主要的性能瓶颈? ()
26 下列关于Hadoop的说法错误的是(  )。
27 关于Secondary NameNode哪项是正确?(  )
28 使用(  )命令可以在HDFS上创建一个/Tipdm/Hadoop目录。
29 下列可以下载HDFS上的/user/root/live.xt文件至Linux本地的/opt目录下的命令是(  )。
30 使用Hadoop官方的示例程序包hadoop-mapreduce-examples-3.1.4.jar中的wordcount模块,对HDFS上的/opt/data.txt文件进行单词计数,将结果保存至HDFS的/Tipdm/Hadoop目录下,下列命令正确的是(  )。
31 当提交某个MapReduce任务后,在任务列表中显示该任务的状态为“RUNNING”,这表示该任务当前的运行状态是(  )。
32 MapReduce适用于(  )
33 下面关于MapReduce模型中Map函数与Reduce函数的描述正确的是(  )
34 对于Hadoop官方示例源码WordCount,从结构上可以分为3个部分,下列不属于程序核心模块的是(  )。
35 Hive是建立在(  )之上的一个数据仓库。
36 按粒度大小的顺序,Hive数据被分为:数据库、数据表、(  )、桶?
37 为了使Hive命令在任何目录下生效,需要在(  )文件中配置Hive的全局变量。
38 创建Hive数据表时,指定字段之间的分隔符,需要使用(  )语句。
39以下业务应用中,不属于Hive适用的场景的是(  )。
40 使用MapReduce查询某个部门中薪资最高的员工姓名,如果输出结果的格式为“薪资 员工姓名”,例如“8000 Alice”(假设薪资均为整数),那么输出键值对格式应该为(  )。
标题
更多问卷 复制此问卷