下面关于ID3算法中说法错误的是()
A.ID3算法要求特征必须离散化
B.信息增益可以用熵,而不是GINI系数来计算
C.选取信息增益最大的特征,作为树的根节点
D.ID3算法是一个二叉树模型
第1题:
9、ID3 算法的缺点不包括()。
A.ID3 没有剪枝策略,容易过拟合
B.信息增益准则对可取值数目较多的特征有所偏好,类似“编号”的特征其信息增益接近于 1
C.既能用于处理离散分布的特征,也能用于连续分布的特征处理
D.没有考虑缺失值
第2题:
下列说法正确的是
A.ID3, C4.5,CART算法都可以处理特征类型为连续型的数据集
B.ID3,C4.5,和CART算法的目标特征都是连续型
C.ID3算法使用信息增益作为不纯度的度量
D.CART算法可以使用方差作为不纯度的度量
第3题:
12、ID3选择属性用的是()。
A.信息增益
B.信息增益率
C.交叉熵
D.信息熵
第4题:
85、ID3算法在分类树构建中, 没有使用下面哪些度量来进行分类节点?
A.gini指标
B.信息增益
C.信息增益率
D.准确率
第5题:
ID3算法在分类树构建中, 使用哪个度量来进行分类节点?
A.gini指标
B.信息增益
C.信息增益率
D.准确率