CDA LEVEL I 数据分析模拟考试

欢迎参加本次CDA LEVEL I数据分析模拟考试,请认真阅读题目并作答。考试时间为90分钟,满分100分。
1. 考生基本信息
姓名:
准考证号:
所属地区:
2. 某快消品企业搭建销售数据分析系统,采用星形模型,结构如下:fact_sales:订单编号、客户ID、商品ID、订单日期、销售额、利润 dim_customer:客户ID、客户等级、性别、所属城市 dim_product:商品ID、商品名称、品类、品牌 dim_date: 订单日期、年、月、季度 dim_region:城市、所属省、所属大区业务需求包括: 按”客户等级x商品品类x月份“维度展示销售额和利润 按城市査看客户购买力,支持"省/大区”层级下钻 快速定位销售高的品牌与地区组合 报表设计应避免使用不具分析意义的字段作为维度.某分析师正在为“客户等级 x商品品类x月份”维度的销售分析设计数据模型。以下哪项做法最符合星形模型的建模规范?
3. 某快消品企业搭建销售数据分析系统,采用星形模型,结构如下:fact_sales:订单编号、客户ID、商品ID、订单日期、销售额、利润 dim_customer:客户ID、客户等级、性别、所属城市 dim_product:商品ID、商品名称、品类、品牌 dim_date: 订单日期、年、月、季度 dim_region:城市、所属省、所属大区业务需求包括: 按”客户等级x商品品类x月份“维度展示销售额和利润 按城市査看客户购买力,支持"省/大区”层级下钻 快速定位销售高的品牌与地区组合 报表设计应避免使用不具分析意义的字段作为维度.如果将 dim_region 中的“省份”和“大区”字段拆分为独立维度表,并通过主外键与原表建立连接,则该数据模型的结构特征最接近于哪种模型?
4. 某快消品企业搭建销售数据分析系统,采用星形模型,结构如下:fact_sales:订单编号、客户ID、商品ID、订单日期、销售额、利润 dim_customer:客户ID、客户等级、性别、所属城市 dim_product:商品ID、商品名称、品类、品牌 dim_date: 订单日期、年、月、季度 dim_region:城市、所属省、所属大区业务需求包括: 按”客户等级x商品品类x月份“维度展示销售额和利润 按城市査看客户购买力,支持"省/大区”层级下钻 快速定位销售高的品牌与地区组合 报表设计应避免使用不具分析意义的字段作为维度.若要按"省 → 城市"层级透视销售额,应使用哪项模型设计支持?
5. 某快消品企业搭建销售数据分析系统,采用星形模型,结构如下:fact_sales:订单编号、客户ID、商品ID、订单日期、销售额、利润 dim_customer:客户ID、客户等级、性别、所属城市 dim_product:商品ID、商品名称、品类、品牌 dim_date: 订单日期、年、月、季度 dim_region:城市、所属省、所属大区业务需求包括: 按”客户等级x商品品类x月份“维度展示销售额和利润 按城市査看客户购买力,支持"省/大区”层级下钻 快速定位销售高的品牌与地区组合 报表设计应避免使用不具分析意义的字段作为维度.以下哪个字段最不适合作为报表维度?
6. 数据库中有两张表,users表中有三个字段 (user id,user name,create at),orders表中有三个字段(order id,user id,amount).查询每个用户的订单总金额,并按总金额降序排序()
7. 数据库中有两张表,users表中有三个字段(user id,user name,create at),orders表中有三个字段(order id,user id,amount).查询所有下过订单的用户的 user_id()
8. 数据库中有两张表,users表中有三个字段(user id,user name,create at),orders表中有三个字段(order id,user id,amount).运行以下SQL查询语句,哪句不会报错
9. 数据库中有两张表,users表中有三个字段(user id,user name,create_at),orders表中有三个字段(order_id,user_id,amount)查询users表中存在而orders表中不存在的user_id
10. 表t1中有id,name,salary三列,如果t1是一个论坛的发帖信息表,id是发帖人的编号,name是帖子的标题salary是每次发帖论坛奖励的分数。显示发帖数超过5个的语句是
11. 表t1中有id,name,salary三列,如果t1是一个论坛的发帖信息表,id是发帖人的编号,name是帖子的标题salary是每次发帖论坛奖励的分数。显示每个会员发了几个帖子的语句是
12. 表t1中有id,name,salary三列,如果t1是一个论坛的发帖信息表,id是发帖人的编号,name是帖子的标题salary是每次发帖论坛奖励的分数。查看t1表中id等于10的行
13. 表t1中有id,name,salary三列,如果t1是一个论坛的发帖信息表,id是发帖人的编号,name是帖子的标题salary是每次发帖论坛奖励的分数。表示更新t1表中字段内容的语句是
14. RFM模型是一种衛量客户价值和客户创利能力的重要工具,通过三个指标来对客户进行分类:最近一次消费时间间隔(Recency)、消费频次(Frequency)和消费金额(Monetary)。在实际应用中,RFM模型可以帮助企业识别不同价值的客户群体,并制定相应的运营策略。请问,RFM模型中,最近一次消费时间间隔(Recency)的值越小,表示什么?
15. 在波士顿矩阵中,产品的市场占有率和销售增长率是两个核心指标。市场占有率反映了企业在市场中的竞争地位,而销售增长率则反映了市场的需求和增长潜力。通过这两个指标,企业可以将产品分为明星产品、现金牛产品、问题产品和瘦狗产品。请问,波士顿矩阵中,明星产品的特征是什么?
16. 在数据分析的基础范式中,分类分析是一种根据事物的共同点和差异点对事物进行归纳和划分的方法。在实际应用中分类分析可以帮助我们从本质上理解事物规律,从而更好地指导业务决策。例如,在精准营销中,分类分析可以用于识别不同的客户群体,并根据这些群体的特征制定相应的营销策略。请问,分类分析的主要目的是什么?
17. 指标归因用在定位根因的分析中,通常需要借助业务价值树来对指标进行拆解,形成指标树。指标拆解和计算指标的贡献度,根据业务计算逻辑包含以下几种:加/减法、乘/除法、双因素法。其中,加法是从业务计算逻辑和数据上,可以将总指标拆解为多个指标之和。请问,加法拆解指标和计算指标的贡献度时,从形式上分为哪两种?
18. 在归因分析中,指标归因法通过指标间的相互作用关系定位业务问题点。指标归因法效率高、计算简单,在嗯实际分析中几乎都会使用到。有时候也会用指标归因来做前期分析基础,为其他归因法分析提供切入点。以下不属于指标归因法的优点是什么?
19. 商业分析师和数据分析师在数据看板中发现以下三种现象,则预示着业务可能出现了问题:正向指标下降严重,比如利润率明显下降;负向指标上升严重,比如获客成本明显上升;波动性指标严重越界,比如某渠道广告点击量。请问,以下哪种现象预示着业务可能出现了问题?
20. 归因分析(Attribution Analysis)也称为根本原因分析(RCA,Root Cause Analysis),是一种评估不同因素对结果影响大小的方法。其目的在于识别和评估影响结果的各个因素,以便更好地理解这些因素的作用,并据此做出决策。以下不属于归因分析方法的是?
21. 商业分析师和数据分析师在数据看板中发现以下三种现象,则预示着业务可能出现了问题:正向指标下降严重,比如利润率明显下降;负向指标上升严重,比如获客成本明显上升;波动性指标严重越界,比如某渠道广告点击量。请问,以下哪种现象预示着业务可能出现了问题?
22. 在竟品分析中,STP模型用于帮助公司识别并优先关注最有可能购买其产品的客户群体,并针对这些客户制定有效的营销策略。以下哪项不是STP模型中的内容?
23. 波特五力模型由迈克尔·波特(MichaelE.Porer)提出,通过对比行业结构和企业竞争强度,分析行业竞争结构和盈利潜力以下哪项不是波特五力模型中的内容?
24. PEST分析是一种宏观环境分析工具,有助于组织了解外部环境的变化对其战略和业务运营可能产生的影响。以下哪项不是PEST模型中的内容?
25. 价值流分析(Value Stream Mapping,VSM)是一种精益生产管理工具,它通过图形化的方法呈现了产品从原材料到成品、再到客户手中的整个流程中的所有活动节点、消耗时间及主体对象。在内部流程视角分析方法中,VSM价值流分析的主要目的是什么?
26. 远景战略视角分析的两大核心组成部分是外部能力分析和内部能力分析,这两个部分共同构成了企业战略规划的基础,其中外部能力分析,主要分析企业所处的宏观环境和行业状况。以下不属于外部能力分析方法的是?
27. 假设你是这家电商平台的营销经理,负责新产品的市场定价。你的目标是找到一个既能吸引客户又能保证利润的最佳定价,能够在竞争激烈的市场中脱颖而出,同时确保公司的利润。为此你收集了过去几年的销售数据、竞争对手的定价策略以及市场需求预测。使用Python构建线性规划模型,使用优化算法求解,并根据不同市场情景模拟多种定价策略。以上数据分析过程在数据科学的方法层级中属于哪一类?
28. 数据是指对客观事件进行记录并可以鉴别的符号,是对客观事物的性质、状态以及相互关系等进行记载的物理符号或这些物理符号的组合。它是可识别的、抽象的符号,不仅指狭义上的数字,还可以是具有一定意义的文字、字母、数字符号的组合、图形、图像、视频、音频等。从数据管理的视角可以将数据划分为主数据、交易数据(事务数据)、统计分析数据(指标)、参考数据、元数据,其中主数据主要描述什么?
29. 在现代企业决策支持系统中,多维数据分析扮演着关键角色。它通过多维模型对数据进行上钻和下钻等操作,帮助数据分析师快速展现分析结果。以下关于多维数据分析的描述,哪一项是正确的?
30. 报表是展现数据的主要信息,包括维度(分类变量)和度量(连续变量)。条形图是运用非常广泛的一种数据展示图,便于分类变量之间的数据对比。盒须图(箱线图)能够提供某变量分布以及异常值的信息。请问,以下哪个选项正确描述了盒须图的特点?
31. 一家餐厅统计顾客的性别、年龄、消费金额等信息,在进行数据分析时,发现性别这一变量在数据存储时用"1”代表男性,"2”代表女性,若不特别声明,数据分析软件可能会把性别当作连续变量处理,此时如果对性别求均值,这种做法?
32. 偏度描述了数据分布的偏斜程度,峰度描述了数据分布的高矮程度。对于标准正态分布,偏度和峰度都为0。请问,以下哪个选项正确描述了偏度的特点?
33. 连续变量的离散程度参数(统计量),包括极差、方差和标准差。极差是变量的最大值与最小值之差,方差和标准差反映了数据的离散程度,具有优秀的数学性质,得到广泛使用。请问,以下哪个选项正确描述了方差和标准差的特点?
34. 连续变量的集中趋势参数(统计量),包括平均数、中位数和众数。以下关于平均数、中位数和众数的描述不正确的是?
35. 变量的分布类型,包括离散数据的概率分布和连续数据的概率分布。离散数据的概率分布描述了离散变量可能取到的每个值的概率,常见的离散概率分布有二项分布、伯努利分布和泊松分布。连续数据的概率分布描述了连续变量的分布形态,常见的连续变量分布有均匀分布、正态分布、对数正态分布、伽玛分布和指数分布。请问,以下哪个选项正确描述了正态分布的特点?
36. 在数据分析中,变量的度量类型对统计量的计算有着重要的影响。在进行数据分析之前,要先明确变量的度量类型,三种主要的变量度量类型:名义变量、等级变量和连续变量。其中,名义变量的特征是?
37. 教育水平作为等级变量,若要描述其离散程度,可选用以下哪种方法()
38. 某调研机构随机抽取 1000 名消费者,计算出某商品的满意度均值为 4.2(满分5分)。若以此直接估计所有消费者的满意度均值,这种方法属于:
39. 某公司员工月薪数据呈右偏分布(存在少数极高收入者),若要反映多数员工的收入水平,最适合的统计量是:
40. 某电商平台收集了客户对商品的评价数据,分为“非常不满意
41. 数据库中的数据不要随意修改,如必须修改更新表中数据的命令是()
42. 在SQL语言中对查询结果排序可以使用ORDER BY语句,在ORDER BY子句中如果指定了多个字段,则()
43. 在SQL语句中我们判断数据是否在某个范围内可以使用BETWEEN关键字,现有语句XBETWEEN 10 AND 20 ,下列与其等价的表达式是()
44. 某数据表中包含name字段,现要查找name字段中包含"a"的姓名,下面哪个选项获取的结果最准确()
45. 别名可以让查询结果可读性增强。在SQL语句中列别名通常出现在哪个子句中?
46. SQL连接查询时,建立连接的连接条件可以有几个
47. 电子表格工具中存在大星处理计算表格结构数据使用的函数,以下属于电子表格工具中文本函数的是
48. 表格结构数据先引用再计算,以下针对表格结构数据引用计算方式描述错误的是
49. 表结构是常用的数据组织结构,下面不属于表结构数据的引用参照对象的是
50. 理解表结构数据特征是使用表结构数据的前提,以下关于表结构数据特征描述正确的是
51. 主键是表结构数据中重要概念之一,针对主键描述错误的是
52. 某物流公司需同时实现"实时追踪包妻状态"和"分析区域运输成本趋势"。以下方案最合理的是:
53. 数据分析师小张在分析"用户订单表"时,发现表中有orderid(订单编号)、userid(用户ID)、product code(商品编码)、order time(下单时间)等字段。根据主键的特征,以下关于主键的判断及业务影响最准确的是?
54. 某银行在数据仓库构建过程中,发现部分客户年龄字段存在"-1"异常值,地址字段包含"不详"等无效信息。根据ETL过程的描述,应在哪个阶段优先解决该问题?
55. 某电商平台使用消费次数和消费额两个指标划分用户价值,某用户半年前被标记为“低价值用户",近期消费次数提升至"中"水平,消费额仍为“中"水平。以下哪项操作最符合用户忠诚度模型的分类标准?
56. 某企业在进行指标体系管理时,发现不同部门对“客户满意度"指标的计算方法和数据来源定义不一致,导致数据横向不致。这种情况属于指标体系管理中的()问题?
57. 一家金融机构想要构建企业级指标体系,目前已经拥有大量历史报表,但指标存在定义不一致、管理混乱的情况。该机构应采用以以下哪种指标体系构建方法?
58. 在数据仓库体系中,从源系统到数据仓库再到数据集市的过程中,实现数据集成和抽取的关键环节是?
59. 维度建模中,由事实表和维表组成,每个维表的主键结合成事实表主键的模型是?
60. 在数据建模的层次中,主要面向业务管理人员,描述企业内主要业务实体以及实体间业务关系的是?
61. 某企业为了确保精准营销结果的准确性,对同一客户在不同系统中的行业分类差异进行验证,并自动用正确数据覆盖错误数据,这属于精准营销应用中的?
62. 某银行想根据用户的不同情况确定其收入等级标签,对于非代发薪但在该行有贷款或信用卡业务的客群,应采用的方法是?
63. 在对申请信用卡的用户制作用户画像,用于判断该用户是否有逾期的风险时,对于信用卡客户的动态期间数据,应取()的数据?
64. 数据立方体在销售分析场景中,若要查看不同地区在不同时间段内的产品销售利润,其中“地区” 和“时间段”属于数据立方体的?
65. OLAP(Online Analytical Processing,联机分析处理)是一种用于多维数据分析的技术和工具,通常建立在数据仓库之上,甚主要作用是?
66. OLTP 主要用于处理日常业务操作,以下场景中最适合使用 OLTP 的是?
67. Bl(Business Inteligence,商业智能)是一种用于支持企业决策和业务分析的技术和方法。以下关于BI工具的描述,哪一项是正确的?
68. 上钻(Dril Up)和下钻(Dril Down)是OLAP工具中常见的操作,用于在多维数据立方体中导航和探索数据的不同层次。以下关于上钻和下钻的描述,哪一项是正确的?
69. 数据立方体(Data Cube)是多维数据模型中的核心概念,它是一个多维数组,包含了各种维度的交叉组合下的度量值。以下关于数据立方体的描述,哪一项是正确的?
70. OLTP(Online Transaction Processing,在线事务处理系统)是现代企业中用于支持实时、交互式事务处理的数据库处理方式。以下关于OLTP的描述,哪一项是正确的?
71. 关于CRUD和RACI,以下哪项描述是正确的
72. 哪种工具最常用于支持数据科学中的统计分析与建模?
73. 在大数据处理框架中,Apache Hadoop 最初主要解决的问题是:
74. “大数据 ”通常被描述为具有多种“V ”特征,其中“Velocity(速度)”主要指:
75. 哪类元数据最能支持自助式BI 分析工具的使用?
76. 以下哪项属于数据仓库的“前端工具 ”?
更多问卷 复制此问卷