CDA LEVEL I 数据分析模拟考试
欢迎参加本次CDA LEVEL I数据分析模拟考试,请认真阅读题目并作答。考试时间为90分钟,满分100分。
1. 考生基本信息
姓名:
准考证号:
所属地区:
2. 某快消品企业搭建销售数据分析系统,采用星形模型,结构如下:fact_sales:订单编号、客户ID、商品ID、订单日期、销售额、利润 dim_customer:客户ID、客户等级、性别、所属城市 dim_product:商品ID、商品名称、品类、品牌 dim_date: 订单日期、年、月、季度 dim_region:城市、所属省、所属大区业务需求包括: 按”客户等级x商品品类x月份“维度展示销售额和利润 按城市査看客户购买力,支持"省/大区”层级下钻 快速定位销售高的品牌与地区组合 报表设计应避免使用不具分析意义的字段作为维度.某分析师正在为“客户等级 x商品品类x月份”维度的销售分析设计数据模型。以下哪项做法最符合星形模型的建模规范?
将“客户等级”、“商品品类”、“月份"分别设计为维度表字段,并通过主外键与事实表关联
将所有维度字段与销售额字段放在一张大表中,减少表关联复杂度
将商品品类和客户等级作为文本字段保留在事实表中,避免维表拆分
只使用一个维度表存放所有字段,统一连接到事实表中,提升扩展性
3. 某快消品企业搭建销售数据分析系统,采用星形模型,结构如下:fact_sales:订单编号、客户ID、商品ID、订单日期、销售额、利润 dim_customer:客户ID、客户等级、性别、所属城市 dim_product:商品ID、商品名称、品类、品牌 dim_date: 订单日期、年、月、季度 dim_region:城市、所属省、所属大区业务需求包括: 按”客户等级x商品品类x月份“维度展示销售额和利润 按城市査看客户购买力,支持"省/大区”层级下钻 快速定位销售高的品牌与地区组合 报表设计应避免使用不具分析意义的字段作为维度.如果将 dim_region 中的“省份”和“大区”字段拆分为独立维度表,并通过主外键与原表建立连接,则该数据模型的结构特征最接近于哪种模型?
扁平维度模型
星形模型
雪花模型
单表分析结构
4. 某快消品企业搭建销售数据分析系统,采用星形模型,结构如下:fact_sales:订单编号、客户ID、商品ID、订单日期、销售额、利润 dim_customer:客户ID、客户等级、性别、所属城市 dim_product:商品ID、商品名称、品类、品牌 dim_date: 订单日期、年、月、季度 dim_region:城市、所属省、所属大区业务需求包括: 按”客户等级x商品品类x月份“维度展示销售额和利润 按城市査看客户购买力,支持"省/大区”层级下钻 快速定位销售高的品牌与地区组合 报表设计应避免使用不具分析意义的字段作为维度.若要按"省 → 城市"层级透视销售额,应使用哪项模型设计支持?
在事实表中加入城市字段
将 dim_region 设计为包含城市与省份层级的维度表
将客户维度中的城市字段改为订单主键
在 dim_date 中补充区域字段信息
5. 某快消品企业搭建销售数据分析系统,采用星形模型,结构如下:fact_sales:订单编号、客户ID、商品ID、订单日期、销售额、利润 dim_customer:客户ID、客户等级、性别、所属城市 dim_product:商品ID、商品名称、品类、品牌 dim_date: 订单日期、年、月、季度 dim_region:城市、所属省、所属大区业务需求包括: 按”客户等级x商品品类x月份“维度展示销售额和利润 按城市査看客户购买力,支持"省/大区”层级下钻 快速定位销售高的品牌与地区组合 报表设计应避免使用不具分析意义的字段作为维度.以下哪个字段最不适合作为报表维度?
客户等级
品牌
城市
订单编号
6. 数据库中有两张表,users表中有三个字段 (user id,user name,create at),orders表中有三个字段(order id,user id,amount).查询每个用户的订单总金额,并按总金额降序排序()
SELECT user_id, SUM(amount) FROM orders GROUP BY user_id ORDER BY amount DESC.
SELECT user_id, SUM(amount) FROM orders ORDER BY SUM(amount) DESC GROUP BY User_id;
SELECT user_id, SUM(amount)AS total amount FROM orders GROUP BY user_id ORDER BY total_amount DESC.
SELECT user_id, SUM(amount) FROM orders GROUP BY user_id WHERE SUM(amount) >0 ORDER BY SUM(amount)DESC:
7. 数据库中有两张表,users表中有三个字段(user id,user name,create at),orders表中有三个字段(order id,user id,amount).查询所有下过订单的用户的 user_id()
SELECT user_id FROM users
SELECT DISTINCT user_id FROM orders;
SELECT user_id FROM orders WHERE user_id IS NULL;
SELECT user_id FROM orders GROUP BY user_id ORDER BY COUNT(amount).
8. 数据库中有两张表,users表中有三个字段(user id,user name,create at),orders表中有三个字段(order id,user id,amount).运行以下SQL查询语句,哪句不会报错
select user_id,avg(amount) from orders where avg(amount)>2000,
select user_id,avg(amount) from orders group by user id where avg(amount)>2000
select user_id,avg(amount) from orders where avg(amount)>2000 group by user_id.
select user_id,avg(amount) from orders group by user_id having avg(amount)>2000
9. 数据库中有两张表,users表中有三个字段(user id,user name,create_at),orders表中有三个字段(order_id,user_id,amount)查询users表中存在而orders表中不存在的user_id
select users.user_id from users left join orders on users.user_id=orders.user_id.
select users user_id from users right join orders on users.user_id=orders.user_id,
select users.user_id from users left join orders on users.user_id=orders.user_id where orders.user_id is null;
select users.user_id from users right join orders on users.user_id=orders.user_id where users.user_id is null;
10. 表t1中有id,name,salary三列,如果t1是一个论坛的发帖信息表,id是发帖人的编号,name是帖子的标题salary是每次发帖论坛奖励的分数。显示发帖数超过5个的语句是
select id ,count (name) from t1 group by id;
selectid ,count (name)from t1 group by id having count (name)>5.
selectid ,count (name)from t1 group by id having count (name)>5.
select id ,count(name) from t1 where id > 100 group by id;
11. 表t1中有id,name,salary三列,如果t1是一个论坛的发帖信息表,id是发帖人的编号,name是帖子的标题salary是每次发帖论坛奖励的分数。显示每个会员发了几个帖子的语句是
select id , count (name) from t1 group by id;
selectid ,count(name) from t1 group by id having count (name)>5;
select id , count (name) from t1 aroup by id having count (name)>5 order by count (name);
selectid ,count (name) from t1 where id > 100 group by id;
12. 表t1中有id,name,salary三列,如果t1是一个论坛的发帖信息表,id是发帖人的编号,name是帖子的标题salary是每次发帖论坛奖励的分数。查看t1表中id等于10的行
select id from t1 id=10,
select id from t1 where id=10.
select id from t1 id 10.
select id from t1 where id 10,
13. 表t1中有id,name,salary三列,如果t1是一个论坛的发帖信息表,id是发帖人的编号,name是帖子的标题salary是每次发帖论坛奖励的分数。表示更新t1表中字段内容的语句是
create table t1(id int,name char(30),salary int);
drop table t1.
create view v t1 as select id,name from t1.
update t1 set name='ixiaoming' where id=100.
14. RFM模型是一种衛量客户价值和客户创利能力的重要工具,通过三个指标来对客户进行分类:最近一次消费时间间隔(Recency)、消费频次(Frequency)和消费金额(Monetary)。在实际应用中,RFM模型可以帮助企业识别不同价值的客户群体,并制定相应的运营策略。请问,RFM模型中,最近一次消费时间间隔(Recency)的值越小,表示什么?
客户越活跃,越可能再次消费
客户越不活跃,越可能流失
客户的消费频次越高
客户的消费金额越高
15. 在波士顿矩阵中,产品的市场占有率和销售增长率是两个核心指标。市场占有率反映了企业在市场中的竞争地位,而销售增长率则反映了市场的需求和增长潜力。通过这两个指标,企业可以将产品分为明星产品、现金牛产品、问题产品和瘦狗产品。请问,波士顿矩阵中,明星产品的特征是什么?
高销售增长率和高市场占有率
低销售增长率和高市场占有率
高销售增长率和低市场占有率
低销售增长率和低市场占有率
16. 在数据分析的基础范式中,分类分析是一种根据事物的共同点和差异点对事物进行归纳和划分的方法。在实际应用中分类分析可以帮助我们从本质上理解事物规律,从而更好地指导业务决策。例如,在精准营销中,分类分析可以用于识别不同的客户群体,并根据这些群体的特征制定相应的营销策略。请问,分类分析的主要目的是什么?
识别实体、类型和属性
识别关系
识别数据的分布特征
识别数据的变动趋势
17. 指标归因用在定位根因的分析中,通常需要借助业务价值树来对指标进行拆解,形成指标树。指标拆解和计算指标的贡献度,根据业务计算逻辑包含以下几种:加/减法、乘/除法、双因素法。其中,加法是从业务计算逻辑和数据上,可以将总指标拆解为多个指标之和。请问,加法拆解指标和计算指标的贡献度时,从形式上分为哪两种?
解决变化量的问题和解决变化率的问题
解决绝对值的问题和解决相对值的问题
解决总指标的问题和解决分指标的问题
解决宏观问题和解决微观问题
18. 在归因分析中,指标归因法通过指标间的相互作用关系定位业务问题点。指标归因法效率高、计算简单,在嗯实际分析中几乎都会使用到。有时候也会用指标归因来做前期分析基础,为其他归因法分析提供切入点。以下不属于指标归因法的优点是什么?
算法简单、计算规则清晰明确
效率高、可解释性高
可以计算每个指标影响目标指标的贡献度
仅适用于宏观因素分析
19. 商业分析师和数据分析师在数据看板中发现以下三种现象,则预示着业务可能出现了问题:正向指标下降严重,比如利润率明显下降;负向指标上升严重,比如获客成本明显上升;波动性指标严重越界,比如某渠道广告点击量。请问,以下哪种现象预示着业务可能出现了问题?
正向指标上升
负向指标下降
波动性指标严重越界
指标稳定
20. 归因分析(Attribution Analysis)也称为根本原因分析(RCA,Root Cause Analysis),是一种评估不同因素对结果影响大小的方法。其目的在于识别和评估影响结果的各个因素,以便更好地理解这些因素的作用,并据此做出决策。以下不属于归因分析方法的是?
定性归因法
指标归因法
模型归因法
统计归因法
21. 商业分析师和数据分析师在数据看板中发现以下三种现象,则预示着业务可能出现了问题:正向指标下降严重,比如利润率明显下降;负向指标上升严重,比如获客成本明显上升;波动性指标严重越界,比如某渠道广告点击量。请问,以下哪种现象预示着业务可能出现了问题?
正向指标上升
负向指标下降
波动性指标严重越界
指标稳定
22. 在竟品分析中,STP模型用于帮助公司识别并优先关注最有可能购买其产品的客户群体,并针对这些客户制定有效的营销策略。以下哪项不是STP模型中的内容?
市场细分(Segmentation)
目标市场选择(Targeting)
产品定位(Positioning)
价格策略(Pricing)
23. 波特五力模型由迈克尔·波特(MichaelE.Porer)提出,通过对比行业结构和企业竞争强度,分析行业竞争结构和盈利潜力以下哪项不是波特五力模型中的内容?
行业内竞争者的竞争程度
潜在的新进入者威胁
供应商的议价能力
政府的监管能力
24. PEST分析是一种宏观环境分析工具,有助于组织了解外部环境的变化对其战略和业务运营可能产生的影响。以下哪项不是PEST模型中的内容?
政治因素
经济因素
环境因素
技术因素
25. 价值流分析(Value Stream Mapping,VSM)是一种精益生产管理工具,它通过图形化的方法呈现了产品从原材料到成品、再到客户手中的整个流程中的所有活动节点、消耗时间及主体对象。在内部流程视角分析方法中,VSM价值流分析的主要目的是什么?
提高产品质量
优化生产流程
增加生产成本
延长生产周期
26. 远景战略视角分析的两大核心组成部分是外部能力分析和内部能力分析,这两个部分共同构成了企业战略规划的基础,其中外部能力分析,主要分析企业所处的宏观环境和行业状况。以下不属于外部能力分析方法的是?
SWOT分析
PESTEL分析
行业分析
竟争对手分析
27. 假设你是这家电商平台的营销经理,负责新产品的市场定价。你的目标是找到一个既能吸引客户又能保证利润的最佳定价,能够在竞争激烈的市场中脱颖而出,同时确保公司的利润。为此你收集了过去几年的销售数据、竞争对手的定价策略以及市场需求预测。使用Python构建线性规划模型,使用优化算法求解,并根据不同市场情景模拟多种定价策略。以上数据分析过程在数据科学的方法层级中属于哪一类?
描述性分析
诊断性分析
预测性分析
规范性分析
28. 数据是指对客观事件进行记录并可以鉴别的符号,是对客观事物的性质、状态以及相互关系等进行记载的物理符号或这些物理符号的组合。它是可识别的、抽象的符号,不仅指狭义上的数字,还可以是具有一定意义的文字、字母、数字符号的组合、图形、图像、视频、音频等。从数据管理的视角可以将数据划分为主数据、交易数据(事务数据)、统计分析数据(指标)、参考数据、元数据,其中主数据主要描述什么?
业务运营过程中的事件
业务实体的数据
企业业务活动的分析数据
用于分类或目录整编的数据
29. 在现代企业决策支持系统中,多维数据分析扮演着关键角色。它通过多维模型对数据进行上钻和下钻等操作,帮助数据分析师快速展现分析结果。以下关于多维数据分析的描述,哪一项是正确的?
多维数据分析主要用于实时事务处理,如订单处理和库存管理
多维数据分析通过连接信息孤岛,创建多维信息模型,帮助用户发现数据中的模式和趋势
多维数据分析仅适用于单一维度的数据分析,无法处理多维度数据
多维数据分析无法支持交互式的分析功能
30. 报表是展现数据的主要信息,包括维度(分类变量)和度量(连续变量)。条形图是运用非常广泛的一种数据展示图,便于分类变量之间的数据对比。盒须图(箱线图)能够提供某变量分布以及异常值的信息。请问,以下哪个选项正确描述了盒须图的特点?
盒须图只能用于分类变量
盒须图只能用于连续变量
盒须图能够提供某变量分布以及异常值的信息
盒须图不能反映数据的中位数
31. 一家餐厅统计顾客的性别、年龄、消费金额等信息,在进行数据分析时,发现性别这一变量在数据存储时用"1”代表男性,"2”代表女性,若不特别声明,数据分析软件可能会把性别当作连续变量处理,此时如果对性别求均值,这种做法?
一家餐厅统计顾客的性
有一定意义,可以辅助分析顾客性别分布
没有意义,因为性别是名义变量
可以帮助餐厅了解顾客性别比例
32. 偏度描述了数据分布的偏斜程度,峰度描述了数据分布的高矮程度。对于标准正态分布,偏度和峰度都为0。请问,以下哪个选项正确描述了偏度的特点?
偏度大于0表示左偏分布
偏度小于0表示右偏分布
偏度为0表示对称分布
偏度为0表示偏态分布
33. 连续变量的离散程度参数(统计量),包括极差、方差和标准差。极差是变量的最大值与最小值之差,方差和标准差反映了数据的离散程度,具有优秀的数学性质,得到广泛使用。请问,以下哪个选项正确描述了方差和标准差的特点?
方差和标准差受极端值影响较小
方差和标准差受极端值影响较大
方差和标准差不能反映数据的离散程度
方差和标准差只能用于分类变量
34. 连续变量的集中趋势参数(统计量),包括平均数、中位数和众数。以下关于平均数、中位数和众数的描述不正确的是?
平均数反映了数据的集中水平,但当存在极端值时,平均数的代表性会下降
中位数使用了数据的次序信息,不受极端值影响,更能反映数据的集中趋势,
众数是数据中出现次数最多的值。
中位数只能用于分类变量
35. 变量的分布类型,包括离散数据的概率分布和连续数据的概率分布。离散数据的概率分布描述了离散变量可能取到的每个值的概率,常见的离散概率分布有二项分布、伯努利分布和泊松分布。连续数据的概率分布描述了连续变量的分布形态,常见的连续变量分布有均匀分布、正态分布、对数正态分布、伽玛分布和指数分布。请问,以下哪个选项正确描述了正态分布的特点?
正态分布的概率密度函数呈钟形曲线,对称且中心集中在均值处
正态分布的概率密度函数呈均匀分布
正态分布的概率密度函数呈偏态分布
正态分布的概率密度函数呈泊松分布
36. 在数据分析中,变量的度量类型对统计量的计算有着重要的影响。在进行数据分析之前,要先明确变量的度量类型,三种主要的变量度量类型:名义变量、等级变量和连续变量。其中,名义变量的特征是?
名义变量的类别间有大小、高低、次序之分
名义变量的类别间没有大小、高低、次序之分
名义变量可以取任意数值
名义变量的类别可以进行数学运算
37. 教育水平作为等级变量,若要描述其离散程度,可选用以下哪种方法()
平均差
四分位差
方差
标准差
38. 某调研机构随机抽取 1000 名消费者,计算出某商品的满意度均值为 4.2(满分5分)。若以此直接估计所有消费者的满意度均值,这种方法属于:
点估计
区间估计
假设检验
方差分析
39. 某公司员工月薪数据呈右偏分布(存在少数极高收入者),若要反映多数员工的收入水平,最适合的统计量是:
均值
中位数
众数
标准差
40. 某电商平台收集了客户对商品的评价数据,分为“非常不满意
名义变量(无序分类变量)
等级变量(有序分类变量)
连续变量
离散变量
41. 数据库中的数据不要随意修改,如必须修改更新表中数据的命令是()
CLEAR
UPDATE
DELETE
ADD
42. 在SQL语言中对查询结果排序可以使用ORDER BY语句,在ORDER BY子句中如果指定了多个字段,则()
只按第一个字段排序
只按最后一个字段排序
按从左至右优先依次排序,前一个字段取值相同时,再按照后一个字段排序
无法进行排序
43. 在SQL语句中我们判断数据是否在某个范围内可以使用BETWEEN关键字,现有语句XBETWEEN 10 AND 20 ,下列与其等价的表达式是()
X>10 AND X
X>10 AND X
X>=10 AND X
X>=10 AND X
44. 某数据表中包含name字段,现要查找name字段中包含"a"的姓名,下面哪个选项获取的结果最准确()
name LlKE '%a%'
name LlkE 'a%'
name LlKE '%a'
name LlKE’a%'
45. 别名可以让查询结果可读性增强。在SQL语句中列别名通常出现在哪个子句中?
SELECT
WHERE
FROM
JOIN
46. SQL连接查询时,建立连接的连接条件可以有几个
一个
两个
多个
一个或多个
47. 电子表格工具中存在大星处理计算表格结构数据使用的函数,以下属于电子表格工具中文本函数的是
date
vlookup
left
count
48. 表格结构数据先引用再计算,以下针对表格结构数据引用计算方式描述错误的是
可以引用其他工作表中的单元格值进行计算
单元格是基本引用、计算单位
可以进行单元格区域与单元格区域间的计算
不能引用其他工作簿中的单元格进行计算
49. 表结构是常用的数据组织结构,下面不属于表结构数据的引用参照对象的是
字段
记录
单元格值
数据表
50. 理解表结构数据特征是使用表结构数据的前提,以下关于表结构数据特征描述正确的是
一个表只能有一种数据类型
字段中不能有nul值
一行记录只能有一种数据类型
主键可以由多个字段构成
51. 主键是表结构数据中重要概念之一,针对主键描述错误的是
一个表只能有一个主键
主键中不能有nuIl值
主键只能是一个字段
主键中不能有重复值
52. 某物流公司需同时实现"实时追踪包妻状态"和"分析区域运输成本趋势"。以下方案最合理的是:
为两类需求均部署OLAP系统
使用OLTP实时更新处理包事状态,OLAP分析运输成本
将实时包惠状态信息写入OLAP系统
将运输成本数据写入OLTP数据库
53. 数据分析师小张在分析"用户订单表"时,发现表中有orderid(订单编号)、userid(用户ID)、product code(商品编码)、order time(下单时间)等字段。根据主键的特征,以下关于主键的判断及业务影响最准确的是?
user id为主键,可分析用户复购行为
order id为主键,保证每条订单记录唯一性
product code为主键,便于统计商品销量
需联合user id order time作为主键
54. 某银行在数据仓库构建过程中,发现部分客户年龄字段存在"-1"异常值,地址字段包含"不详"等无效信息。根据ETL过程的描述,应在哪个阶段优先解决该问题?
Extract(抽取)时过滤异常数据
Transfomm(转换)时清洗数据
Load(加载)时设置数据校验
直接在数据字典中标记异常
55. 某电商平台使用消费次数和消费额两个指标划分用户价值,某用户半年前被标记为“低价值用户",近期消费次数提升至"中"水平,消费额仍为“中"水平。以下哪项操作最符合用户忠诚度模型的分类标准?
维持原有标签,因消费额未变化
重新评估并更新为“普通用户”
标记为"低价值用户"以节省资源
标记为"忠诚用户"以提供优质服务
56. 某企业在进行指标体系管理时,发现不同部门对“客户满意度"指标的计算方法和数据来源定义不一致,导致数据横向不致。这种情况属于指标体系管理中的()问题?
定义模糊
分类混乱
格式不一致
分析难度
57. 一家金融机构想要构建企业级指标体系,目前已经拥有大量历史报表,但指标存在定义不一致、管理混乱的情况。该机构应采用以以下哪种指标体系构建方法?
自上而下法
自下而上法
OSM 模型法
以上方法都不适用
58. 在数据仓库体系中,从源系统到数据仓库再到数据集市的过程中,实现数据集成和抽取的关键环节是?
OLTP
OLAP
ETL
数据立方体
59. 维度建模中,由事实表和维表组成,每个维表的主键结合成事实表主键的模型是?
雪花模型
星座模型
星形模型
关系模型
60. 在数据建模的层次中,主要面向业务管理人员,描述企业内主要业务实体以及实体间业务关系的是?
主题域模型
概念模型
逻辑模型
物理模型
61. 某企业为了确保精准营销结果的准确性,对同一客户在不同系统中的行业分类差异进行验证,并自动用正确数据覆盖错误数据,这属于精准营销应用中的?
客户画像及标签
精准营销模型
客户信息整合及验证
产品创新应用
62. 某银行想根据用户的不同情况确定其收入等级标签,对于非代发薪但在该行有贷款或信用卡业务的客群,应采用的方法是?
直接根据代发薪数据确认收入的统计范围
根据人行征信中的社保信息推断收入
通过渠道合作方采集税收、社保等信息评估收入
通过有收入数据客群和第三方支付客群的交集建模预测收入
63. 在对申请信用卡的用户制作用户画像,用于判断该用户是否有逾期的风险时,对于信用卡客户的动态期间数据,应取()的数据?
申请信用卡时点前最近的时间点
申请信用卡时点前任何时间点
申请时间点往前推一段时间,如一年内
申请信用卡之后的时间点
64. 数据立方体在销售分析场景中,若要查看不同地区在不同时间段内的产品销售利润,其中“地区” 和“时间段”属于数据立方体的?
度量值
维度
数据项
聚合结果
65. OLAP(Online Analytical Processing,联机分析处理)是一种用于多维数据分析的技术和工具,通常建立在数据仓库之上,甚主要作用是?
快速插入、更新和查询数据
处理实时的交互式事务
连接信息孤岛,创建多维信息模型,提供多维分析功能
存储大量原始业务数据
66. OLTP 主要用于处理日常业务操作,以下场景中最适合使用 OLTP 的是?
分析过去一年各地区产品销售的总体趋势
实时处理客户的订单信息
对公司近五年的财务数据进行深度分析
探索市场上不同竟争对手的产品特点
67. Bl(Business Inteligence,商业智能)是一种用于支持企业决策和业务分析的技术和方法。以下关于BI工具的描述,哪一项是正确的?
BI工具主要用于实时事务处理,如订单处理和库存管理
BI工具通过收集、整理、分析和报告数据,帮助企业管理者和决策者更好地理解企业运营情况
BI工具的应用范围仅限于销售和市场营销领域
BI工具无法帮助企业实现持续的业务增长和竞争优势
68. 上钻(Dril Up)和下钻(Dril Down)是OLAP工具中常见的操作,用于在多维数据立方体中导航和探索数据的不同层次。以下关于上钻和下钻的描述,哪一项是正确的?
上钻是指从一个较高层次的摘要级别向下导航到更低层次的细分数据
下钻是指从一个较低层次的摘要级别向上导航到更高层次的概要级别
上钻和下钻操作使用户能够逐步导航和探索数据的不同层次和细节
上钻和下钻操作无法支持交互式的数据分析和探索
69. 数据立方体(Data Cube)是多维数据模型中的核心概念,它是一个多维数组,包含了各种维度的交叉组合下的度量值。以下关于数据立方体的描述,哪一项是正确的?
数据立方体仅适用于单一维度的数据分析,无法处理多维度数据
数据立方体通过切片、钻取和旋转等操作,支持用户进行多维度的分析和探索
数据立方体无法用于销售分析、市场营销分析等业务场景
数据立方体不依赖于数据仓库,独立存储数据
70. OLTP(Online Transaction Processing,在线事务处理系统)是现代企业中用于支持实时、交互式事务处理的数据库处理方式。以下关于OLTP的描述,哪一项是正确的?
OLTP主要用于支持复杂的数据分析和决策支持
OLTP具备实时性、高并发性和快速的数据插入、更新和查询的特点
OLTP系统通常建立在数据仓库之上,用于多维数据分析
OLTP无法处理日常业务操作,如订单处理和库存管理
71. 关于CRUD和RACI,以下哪项描述是正确的
CRUD表示负责、批注、咨询、通知
RACI表示创建、读取、更新、删除
RACI和CRUD是一样的,无非是两种不同的表达
RACI是关于责任,而CRUD是关于权限
72. 哪种工具最常用于支持数据科学中的统计分析与建模?
Microsoft Word
Apache Kafka
Python(及其如 Pandas、scikit-learn 等库)
AutoCAD
73. 在大数据处理框架中,Apache Hadoop 最初主要解决的问题是:
高性能图形处理
分布式计算和存储海量数据
小文件高频更新问题
实时视频流压缩
74. “大数据 ”通常被描述为具有多种“V ”特征,其中“Velocity(速度)”主要指:
数据处理算法的执行效率
数据生成与处理的速度
数据压缩率
数据可视化速度
75. 哪类元数据最能支持自助式BI 分析工具的使用?
加密密钥元数据
技术性能元数据
描述性业务元数据
系统日志元数据
76. 以下哪项属于数据仓库的“前端工具 ”?
SQL Server
Linux Shell
报表工具与仪表盘系统
网络协议分析器
关闭
更多问卷
复制此问卷