我们建立一个5000个特征,100万数据的机器学习模型.我们怎么有效地应对这样的大数据训练()
A.我们随机抽取一些样本,在这些少量样本之上训练
B.我们可以试用在线机器学习算法
C.我们应用PCA算法降维,减少特征数
D.B和C
E.A和B
F.以上所有
第1题:
当一个较为复杂的机器学习模型对于训练数据集杰出表现,而对于验证或是实际数据表现较差,此类现象我们称之为()。通过代表性不足的数据训练出来的机器模型对于验证或是实际数据表现较差,我们称这种现象为()。
第2题:
1、海浪数值模拟数据一般不能作为机器学习模型的训练数据。
第3题:
我们要用概率模型对数据和标签进行学习,需要数据/标签对服从某种概率分布,称为 。
第4题:
97、在拿到一个具体的大数据问题之后,在建立解决问题的模型前,我们首先一般应该做哪些工作
A.概览数据,了解问题背景
B.清洗数据
C.调整模型参数
D.特征的构造与筛选
第5题:
4、机器学习和数据科学间是存在交集的。例如,逻辑回归可以用来研究关系,也可以用来做预测。我们可以将数据科学和机器学习想象成一个“谱”,较容易解释的模型更靠近数据科学一侧,“黑箱”模型则更靠近机器学习一侧。