期末复习

一、选择题（共37题）

1. 1. 在Python中，用于创建数据框（DataFrame）的库是（）

A. NumPyB. PandasC. MatplotlibD. Scipy

2. 2. 使用Pandas读取CSV文件的函数是（）

A. pd.read_csv()B. pd.open_csv()C. pd.load_csv()D. pd.import_csv()

3. 3. 数据清洗中处理缺失值的常用方法不包括（）

A. 删除缺失行B. 用平均值填充C. 用中位数填充D. 忽略所有缺失值

4. 4. 以下哪个库主要用于数据可视化？（）

A. NumPyB. PandasC. MatplotlibD. Scikit-learn

5. 5. 用于数据分组和聚合操作的Pandas方法是（）

A. groupby()B. merge()C. concat()D. pivot()

6. 6. 执行如下代码的输出结果是（）A=[1,2,3,4]B=AA[1:3]=(6,9)print('修改列表A的第2、3个元素的值。')print（）

A. AB. [1,2,3,4]C. [1,6,9,4]D. [1,(6,9),4]答案：C

7. 7. 执行如下代码的输出结果是（）strFormat = "姓名：%s\t年龄：%d岁\t性别：%s"print(strFormat%("吉祥",29,"男"))

A. 姓名：吉祥年龄：29岁性别：男B. 吉祥 29岁男C. 姓名："吉祥" 年龄：29岁性别："男"D. strFormat%（吉祥，29，男）

8. 8. 执行如下代码的输出结果是（）aList = [1,5,3,9]aList.sort( )print(aList)

A. aListB. [1, 3, 5, 9]C. [9, 5,3,1]D. [9531]

9. 9. 执行如下代码的输出结果是( )import datetime as dtaDt= dt.datetime(2024,10,1,20,3,50)aStr = aDt.strftime('%Y/%m/%d')print(aStr)

A. 2024/10/1B. 2024/10/01C. 20/3/50D. 2024%10%01

10. 10. 执行如下代码的输出结果是( )import numpy as npaArray = np.arange(1,6)x = aArray[2]print(x)

A. 1B. 2C. 3D. 4

11. 11. 执行如下代码的输出结果是( )import numpy as npaArray= np.arange(1,6)bArray = aArray[-3:]print(bArray)

A. [1 2 3]B. [2 3 4]C. [3 4 5]D. [4 5 6]

12. 12. 以下哪个参数用于控制read_csv()函数的编码方式？（）

A. encodingB. codecC. charsetD. decode

13. 13. 用于时间序列数据处理的Pandas数据类型是（）

A. TimestampB. DateTimeC. DateD. Time

14. 14. 以下哪个函数用于将数据保存为CSV文件？（）

A. df.to_csv()B. df.save_csv()C. df.export_csv()D. df.write_csv()

15. 15. 在DataFrame中，用于选择多列的正确语法是（）

A. df['col1', 'col2']B. df[['col1', 'col2']]C. df.select('col1', 'col2')D. df.get(['col1', 'col2'])

16. 16. 以下哪个函数用于检测重复行？（）

A. df.duplicated()B. df.find_duplicates()C. df.check_duplicates()D. df.repeated()

17. 17. 处理缺失值时，df.dropna()函数的默认行为是（）

A. 删除所有包含缺失值的行B. 删除所有包含缺失值的列C. 用0填充缺失值D. 用前一行的值填充

18. 18. 在Pandas中，用于查看数据统计摘要（均值、标准差等）的函数是（）

A. describe()B. info()C. summary()D. stats()

19. 19. 以下哪个函数用于合并两个DataFrame，基于相同列名进行连接？（）

A. concat()B. merge()C. join()D. combine()

20. 20. 在Pandas中，重置索引的函数是（）

A. reset_index()B. reindex()C. set_index()D. clear_index()

21. 21. 执行以下代码后，输出结果是什么？（）import pandas as pddata = {'A': [1, 2, 3], 'B': [4, 5, 6]}df = pd.DataFrame(data)print(df.shape)

A. (2, 2)B. (3, 2)C. (1, 2)D. (2, 3)

22. 22. 以下代码创建了什么类型的图表？（）import matplotlib.pyplot as pltplt.hist([1, 2, 2, 3, 3, 3, 4, 4, 5], bins=5)plt.show()

A. 折线图B. 柱状图C. 直方图D. 散点图

23. 23. 以下代码的功能是什么？（）import pandas as pddf = pd.read_csv('data.csv')df_filled = df.fillna(method='ffill')

A. 删除所有包含缺失值的行B. 用0填充所有缺失值C. 用前一个非缺失值向前填充D. 用平均值填充缺失值

24. 24. 执行以下代码后，arr的维度是多少？（）import numpy as nparr = np.random.rand(3, 4, 5)print(arr.ndim)

A. 2B. 3C. 4D. 5

25. 25. 执行以下代码后，df_filtered包含多少行？（）import pandas as pddata = {'Age': [25, 30, 35, 40, 45], 'Income': [50000, 60000, 70000, 80000, 90000]}df = pd.DataFrame(data)df_filtered = df[(df['Age'] > 30) & (df['Income'] < 85000)]

A. 1B. 2C. 3D. 4

26. 26. 创建一个包含数字1到5的NumPy数组，正确的代码是（）

A. np.array(1, 2, 3, 4, 5)B. np.array([1, 2, 3, 4, 5])C. np.create([1, 2, 3, 4, 5])D. np.list([1, 2, 3, 4, 5])

27. 27. 创建一个3行4列的全零数组，正确的代码是（）

A. np.zeros(3, 4)B. np.zeros([3, 4])C. np.zero(3, 4)D. np.zeros((3, 4))

28. 28. 以下代码的输出结果是（）import numpy as nparr = np.array([1, 2, 3, 4,5])print(arr.mean())

A. 3B. 3.0C. 15D. 5

29. 29. 获取数组[5, 2, 8, 1, 9]中的最大值，正确的代码是（）

A. arr.max()B. arr.maximum()C. np.maximum(arr)D. arr.largest()

30. 30. 导入Matplotlib的pyplot模块的正确方式是（）

A. import matplotlibB. import matplotlib.pyplotC. from matplotlib import pyplotD. import matplotlib as plt

31. 31. 设置图表标题的函数是（）

A. plt.title()B. plt.heading()C. plt.name()D. plt.caption()

32. 32. 设置x轴标签的函数是（）

A. plt.xlabel()B. plt.xlable()C. plt.x_title()D. plt.xtitle()

33. 33. 显示图表的函数是（）

A. plt.display()B. plt.show()C. plt.view()D. plt.render()

34. 34. 添加图例（显示数据系列对应标签）的函数是（）

A. plt.legend()B. plt.key()C. plt.note()D. plt.explain()

35. 35. 获取DataFrame列名的属性是（）

A. df.namesB. df.columnsC. df.headersD. df.labels

36. 36. 选择DataFrame中"age"列的正确语法是（）

A. df['age']B. df.ageC. df.select('age')D. df.get('age')

37. 37. 计算DataFrame每列平均值的函数是（）

A. df.average()B. df.mean()C. df.avg()D. df.median()

38. 1. Python仅能在Windows系统中运行。（）

A. 正确B. 错误

39. 2. 使用pip安装第三方扩展包，可以使用在线安装或者离线安装。（）

A. 正确B. 错误

40. 3. 使用open（）函数打开一个文件，默认模式是读写模式（）

A. 正确B. 错误

41. 4. 对序列对象进行切片操作，切片的数值不可以是负数。（）

A. 正确B. 错误

42. 5. 通过使用flatten函数将二维数组aArray展平，并将结果赋值给数组bArray。此时修改bArray元素的值，不会修改aArray的值。（）

A. 正确B. 错误

43. 6. 可以使用vsplit（）函数将数组在水平方向进行分割。（）

A. 正确B. 错误

44. 7. 可以使用字典创建DataFrame对象，但不能使用嵌套的字典创建DataFrame对象。（）

A. 正确B. 错误

45. 8. 数据清洗就是删除所有包含缺失值的行。（）

A. 正确B. 错误

46. 9. df.head()函数默认显示DataFrame的前10行数据。（）

A. 正确B. 错误

47. 10. Matplotlib中绘制折线图的函数是plt.bar()。（）

A. 正确B. 错误

48. 11. 在Python数据分析中，通常使用import pandas as np导入pandas库。（）

A. 正确B. 错误

49. 12. 数据归一化（Normalization）是将数据缩放到[0,1]区间。（）

A. 正确B. 错误

50. 13. df.shape返回一个元组，表示DataFrame的行数和列数。（）

A. 正确B. 错误

51. 14. 使用pd.read_excel()函数可以读取Excel文件。（）

A. 正确B. 错误

52. 15. 直方图（Histogram）和柱状图（Bar Chart）是同一种图表的不同名称。（）

A. 正确B. 错误

53. 16. 在Python中，NaN表示一个缺失值或空值。（）

A. 正确B. 错误

54. 17. 热力图（Heatmap）常用于展示相关系数矩阵。（）

A. 正确B. 错误

55. 18. Pandas中读取CSV文件的函数是pd.read_csv()。（）

A. 正确B. 错误

56. 19. df.info()函数可以显示DataFrame的基本统计信息。（）

A. 正确B. 错误

57. 20. df['column'].value_counts()可以查看某列中各个值的出现次数。（）

A. 正确B. 错误

58. 21. 在Pandas中，df.iloc[0]可以获取第一行数据。（）

A. 正确B. 错误

59. 14. numpy提供的ndarray对象由两部分组成，＿＿和＿＿描述这些数据的。

答案：数据、元数据

二、判断题（共22题）

三、填空题（共20题）

60. 1. 两个整数相除，如果有余数，则结果会自动转换为_____。

61. 2. 安装 Python 3.12.0 之后，如果需要查看安装的 Python 版本，可以在 cmd命令窗口中使用命令______。

62. 3. 在 cmd 命令窗口中完成了 Python 程序的开发，现在要退出开发环境，则需用命令_____。

63. 4. 使用pip安装numpy，需要使用命令______。

64. 5. 使用 pip 卸载 pandas，需要使用命令 ______。

65. 6. 已经开发了 Python 程序 test.py,现在要在 cmd 命令窗口中运行该代码，需要使用命令______。

66. 7. Anaconda 进行包管理的工具是______。

67. 8. 需要在 cmd 命令窗口中运行源代码 hello.py，使用的命令是______。

68. 9. 有一个字符串 aStr="hello world"，需要将该字符串中所有字符转换为大写，并复制给变量bStr，使用的命令是 ______。

69. 10. 创建一个元组对象,其值是(1,2,3,4),复制给变量 aTuple,使用的命令是______。

70. 11. print（“Windows\0007”）的输出结果是______。

71. 12. 两个datetime对象进行相减运算，其结果是一个______对象。

72. 13. ______对象中的元素是无序的，而且其元素值唯一，即在这种类型的对象中不存在重复的元素。

73. 15. 使用A=numpy.arange(n)创建了一维数组A，该数组的最小值是______，最大值是______。

74. 16. 使用Series对象的______属性，可以获取该Series对象的索引。

75. 17. 可以使用numpy的______方法对数组进行转置操作。

76. 18. 使用 numpy 的______函数可以求解矩阵的对角线元素。

77. 19. 使用numpy 的______函数可以求解矩阵的迹。

78. 20. 使用 numpy 的______函数可以求解两个数组的协方差矩阵。

更多问卷复制此问卷