数据挖掘 Quiz 1

请在本周五晚上12点以前完成以下作业:
1. 基本信息:
姓名:
学号:
上午/下午:
2. 混淆矩阵中False Negative的含义是:
3.

在ROC分析中,分类器的性能曲线的理想状态是:

学习材料提示:

(1)https://zh.wikipedia.org/wiki/ROC%E6%9B%B2%E7%BA%BF

(2)https://baike.baidu.com/item/ROC%E6%9B%B2%E7%BA%BF

(3)https://www.jianshu.com/p/c61ae11cc5f6

4.

代价敏感是指在分类问题中,不同分类任务在分类错误时所导致的代价(Cost)不同。例如在医疗中,“将病人误诊为健康人的代价”与“将健康人误诊为病人的代价”不同;在金融信用卡盗用检测中,“将盗用误认为正常使用的代价”与将“正常使用误认为盗用的代价”也不同。

以下最有可能涉及代价敏感的分类问题是:

5. 彩票号码难以预测的原因在于:
6.

负相关是指两列变量变动方向相反,一列变量由大到小或由小到大变化时,另一列变量反而由小到大或由大到小变化。两个变量X和Y呈现负相关性,说明:

参考学习资料:

https://zh.wikipedia.org/wiki/%E7%9B%B8%E9%97%9C%E4%B8%8D%E8%98%8A%E6%B6%B5%E5%9B%A0%E6%9E%9C

7. 在超市环境中对客户位置轨迹进行记录和分析的主要目的有哪些?
8. ETL系统的主要作用包括:
9. 聚类(clustering)与分类(classification)的主要区别在于:
10. 在实际数据分析工作中,数据类型转换和数据自身的错误是面临的主要挑战之一。
11.

大数据和传统数据分析相比,核心特征就是数据量大。

参考资料:https://www.oracle.com/cn/big-data/guide/what-is-big-data.html

12.

分类器在训练样本上的误差越低越好。

学习资料:https://blog.csdn.net/MosBest/article/details/51477833

13. 短期股票价格波动难以精准预测的主要原因在于现有模型本身不够精密。
更多问卷 复制此问卷