期末复习
一、选择题(共37题)
1. 1. 在Python中,用于创建数据框(DataFrame)的库是()
A. NumPy
B. Pandas
C. Matplotlib
D. Scipy
2. 2. 使用Pandas读取CSV文件的函数是()
A. pd.read_csv()
B. pd.open_csv()
C. pd.load_csv()
D. pd.import_csv()
3. 3. 数据清洗中处理缺失值的常用方法不包括()
A. 删除缺失行
B. 用平均值填充
C. 用中位数填充
D. 忽略所有缺失值
4. 4. 以下哪个库主要用于数据可视化?()
A. NumPy
B. Pandas
C. Matplotlib
D. Scikit-learn
5. 5. 用于数据分组和聚合操作的Pandas方法是()
A. groupby()
B. merge()
C. concat()
D. pivot()
6. 6. 执行如下代码的输出结果是()A=[1,2,3,4]B=AA[1:3]=(6,9)print('修改列表A的第2、3个元素的值。')print()
A. A
B. [1,2,3,4]
C. [1,6,9,4]
D. [1,(6,9),4]
答案:C
7. 7. 执行如下代码的输出结果是()strFormat = "姓名:%s\t年龄:%d岁\t性别:%s"print(strFormat%("吉祥",29,"男"))
A. 姓名:吉祥 年龄:29岁 性别:男
B. 吉祥 29岁 男
C. 姓名:"吉祥" 年龄:29岁 性别:"男"
D. strFormat%(吉祥,29,男)
8. 8. 执行如下代码的输出结果是()aList = [1,5,3,9]aList.sort( )print(aList)
A. aList
B. [1, 3, 5, 9]
C. [9, 5,3,1]
D. [9531]
9. 9. 执行如下代码的输出结果是( )import datetime as dtaDt= dt.datetime(2024,10,1,20,3,50)aStr = aDt.strftime('%Y/%m/%d')print(aStr)
A. 2024/10/1
B. 2024/10/01
C. 20/3/50
D. 2024%10%01
10. 10. 执行如下代码的输出结果是( )import numpy as npaArray = np.arange(1,6)x = aArray[2]print(x)
A. 1
B. 2
C. 3
D. 4
11. 11. 执行如下代码的输出结果是( )import numpy as npaArray= np.arange(1,6)bArray = aArray[-3:]print(bArray)
A. [1 2 3]
B. [2 3 4]
C. [3 4 5]
D. [4 5 6]
12. 12. 以下哪个参数用于控制read_csv()函数的编码方式?()
A. encoding
B. codec
C. charset
D. decode
13. 13. 用于时间序列数据处理的Pandas数据类型是()
A. Timestamp
B. DateTime
C. Date
D. Time
14. 14. 以下哪个函数用于将数据保存为CSV文件?()
A. df.to_csv()
B. df.save_csv()
C. df.export_csv()
D. df.write_csv()
15. 15. 在DataFrame中,用于选择多列的正确语法是()
A. df['col1', 'col2']
B. df[['col1', 'col2']]
C. df.select('col1', 'col2')
D. df.get(['col1', 'col2'])
16. 16. 以下哪个函数用于检测重复行?()
A. df.duplicated()
B. df.find_duplicates()
C. df.check_duplicates()
D. df.repeated()
17. 17. 处理缺失值时,df.dropna()函数的默认行为是()
A. 删除所有包含缺失值的行
B. 删除所有包含缺失值的列
C. 用0填充缺失值
D. 用前一行的值填充
18. 18. 在Pandas中,用于查看数据统计摘要(均值、标准差等)的函数是()
A. describe()
B. info()
C. summary()
D. stats()
19. 19. 以下哪个函数用于合并两个DataFrame,基于相同列名进行连接?()
A. concat()
B. merge()
C. join()
D. combine()
20. 20. 在Pandas中,重置索引的函数是()
A. reset_index()
B. reindex()
C. set_index()
D. clear_index()
21. 21. 执行以下代码后,输出结果是什么?()import pandas as pddata = {'A': [1, 2, 3], 'B': [4, 5, 6]}df = pd.DataFrame(data)print(df.shape)
A. (2, 2)
B. (3, 2)
C. (1, 2)
D. (2, 3)
22. 22. 以下代码创建了什么类型的图表?()import matplotlib.pyplot as pltplt.hist([1, 2, 2, 3, 3, 3, 4, 4, 5], bins=5)plt.show()
A. 折线图
B. 柱状图
C. 直方图
D. 散点图
23. 23. 以下代码的功能是什么?()import pandas as pddf = pd.read_csv('data.csv')df_filled = df.fillna(method='ffill')
A. 删除所有包含缺失值的行
B. 用0填充所有缺失值
C. 用前一个非缺失值向前填充
D. 用平均值填充缺失值
24. 24. 执行以下代码后,arr的维度是多少?()import numpy as nparr = np.random.rand(3, 4, 5)print(arr.ndim)
A. 2
B. 3
C. 4
D. 5
25. 25. 执行以下代码后,df_filtered包含多少行?()import pandas as pddata = {'Age': [25, 30, 35, 40, 45], 'Income': [50000, 60000, 70000, 80000, 90000]}df = pd.DataFrame(data)df_filtered = df[(df['Age'] > 30) & (df['Income'] < 85000)]
A. 1
B. 2
C. 3
D. 4
26. 26. 创建一个包含数字1到5的NumPy数组,正确的代码是()
A. np.array(1, 2, 3, 4, 5)
B. np.array([1, 2, 3, 4, 5])
C. np.create([1, 2, 3, 4, 5])
D. np.list([1, 2, 3, 4, 5])
27. 27. 创建一个3行4列的全零数组,正确的代码是()
A. np.zeros(3, 4)
B. np.zeros([3, 4])
C. np.zero(3, 4)
D. np.zeros((3, 4))
28. 28. 以下代码的输出结果是()import numpy as nparr = np.array([1, 2, 3, 4,5])print(arr.mean())
A. 3
B. 3.0
C. 15
D. 5
29. 29. 获取数组[5, 2, 8, 1, 9]中的最大值,正确的代码是()
A. arr.max()
B. arr.maximum()
C. np.maximum(arr)
D. arr.largest()
30. 30. 导入Matplotlib的pyplot模块的正确方式是()
A. import matplotlib
B. import matplotlib.pyplot
C. from matplotlib import pyplot
D. import matplotlib as plt
31. 31. 设置图表标题的函数是()
A. plt.title()
B. plt.heading()
C. plt.name()
D. plt.caption()
32. 32. 设置x轴标签的函数是()
A. plt.xlabel()
B. plt.xlable()
C. plt.x_title()
D. plt.xtitle()
33. 33. 显示图表的函数是()
A. plt.display()
B. plt.show()
C. plt.view()
D. plt.render()
34. 34. 添加图例(显示数据系列对应标签)的函数是()
A. plt.legend()
B. plt.key()
C. plt.note()
D. plt.explain()
35. 35. 获取DataFrame列名的属性是()
A. df.names
B. df.columns
C. df.headers
D. df.labels
36. 36. 选择DataFrame中"age"列的正确语法是()
A. df['age']
B. df.age
C. df.select('age')
D. df.get('age')
37. 37. 计算DataFrame每列平均值的函数是()
A. df.average()
B. df.mean()
C. df.avg()
D. df.median()
38. 1. Python仅能在Windows系统中运行。()
A. 正确
B. 错误
39. 2. 使用pip安装第三方扩展包,可以使用在线安装或者离线安装。()
A. 正确
B. 错误
40. 3. 使用open()函数打开一个文件,默认模式是读写模式()
A. 正确
B. 错误
41. 4. 对序列对象进行切片操作,切片的数值不可以是负数。()
A. 正确
B. 错误
42. 5. 通过使用flatten函数将二维数组aArray展平,并将结果赋值给数组bArray。此时修改bArray元素的值,不会修改aArray的值。()
A. 正确
B. 错误
43. 6. 可以使用vsplit()函数将数组在水平方向进行分割。()
A. 正确
B. 错误
44. 7. 可以使用字典创建DataFrame对象,但不能使用嵌套的字典创建DataFrame对象。()
A. 正确
B. 错误
45. 8. 数据清洗就是删除所有包含缺失值的行。( )
A. 正确
B. 错误
46. 9. df.head()函数默认显示DataFrame的前10行数据。( )
A. 正确
B. 错误
47. 10. Matplotlib中绘制折线图的函数是plt.bar()。( )
A. 正确
B. 错误
48. 11. 在Python数据分析中,通常使用import pandas as np导入pandas库。( )
A. 正确
B. 错误
49. 12. 数据归一化(Normalization)是将数据缩放到[0,1]区间。( )
A. 正确
B. 错误
50. 13. df.shape返回一个元组,表示DataFrame的行数和列数。( )
A. 正确
B. 错误
51. 14. 使用pd.read_excel()函数可以读取Excel文件。( )
A. 正确
B. 错误
52. 15. 直方图(Histogram)和柱状图(Bar Chart)是同一种图表的不同名称。( )
A. 正确
B. 错误
53. 16. 在Python中,NaN表示一个缺失值或空值。( )
A. 正确
B. 错误
54. 17. 热力图(Heatmap)常用于展示相关系数矩阵。( )
A. 正确
B. 错误
55. 18. Pandas中读取CSV文件的函数是pd.read_csv()。( )
A. 正确
B. 错误
56. 19. df.info()函数可以显示DataFrame的基本统计信息。( )
A. 正确
B. 错误
57. 20. df['column'].value_counts()可以查看某列中各个值的出现次数。( )
A. 正确
B. 错误
58. 21. 在Pandas中,df.iloc[0]可以获取第一行数据。( )
A. 正确
B. 错误
59. 14. numpy提供的ndarray对象由两部分组成,__和__描述这些数据的。
答案:数据、元数据
二、判断题(共22题)
三、填空题(共20题)
60. 1. 两个整数相除,如果有余数,则结果会自动转换为_____。
61. 2. 安装 Python 3.12.0 之后,如果需要查看安装的 Python 版本,可以在 cmd命令窗口中使用命令______。
62. 3. 在 cmd 命令窗口中完成了 Python 程序的开发,现在要退出开发环境,则需用命令_____。
63. 4. 使用pip安装numpy,需要使用命令______。
64. 5. 使用 pip 卸载 pandas,需要使用命令 ______。
65. 6. 已经开发了 Python 程序 test.py,现在要在 cmd 命令窗口中运行该代码,需要使用命令______。
66. 7. Anaconda 进行包管理的工具是______。
67. 8. 需要在 cmd 命令窗口中运行源代码 hello.py,使用的命令是______。
68. 9. 有一个字符串 aStr="hello world",需要将该字符串中所有字符转换为大写,并复制给变量bStr,使用的命令是 ______。
69. 10. 创建一个元组对象,其值是(1,2,3,4),复制给变量 aTuple,使用的命令是______。
70. 11. print(“Windows\0007”)的输出结果是______。
71. 12. 两个datetime对象进行相减运算,其结果是一个______对象。
72. 13. ______对象中的元素是无序的,而且其元素值唯一,即在这种类型的对象中不存在重复的元素。
73. 15. 使用A=numpy.arange(n)创建了一维数组A,该数组的最小值是______,最大值是______。
74. 16. 使用Series对象的______属性,可以获取该Series对象的索引。
75. 17. 可以使用numpy的______方法对数组进行转置操作。
76. 18. 使用 numpy 的______函数可以求解矩阵的对角线元素。
77. 19. 使用numpy 的______函数可以求解矩阵的迹。
78. 20. 使用 numpy 的______函数可以求解两个数组的协方差矩阵。
关闭
更多问卷
复制此问卷