首页 > 计算机类考试

网友您好，请在下方输入框内输入要搜索的题目：

请输入或粘贴题目内容搜题

搜题

拍照、语音搜题，请扫码下载APP

题目内容（请给出正确答案）

[单选题]

如果在大型数据集上训练决策树。为了花费更少的时间来训练这个模型，下列哪种做法是正确的（）。

A.增加树的深度

B.增加学习率

C.减小树的深度

D.减少树的数量

答案

查看答案

发布时间：2023-01-13

更多“如果在大型数据集上训练决策树。为了花费更少的时间来训练这个模型，下列哪种做法是正确的（）。”相关的问题

第1题

决策树递归停止的条件为（）。

A.训练数据集使用完

B.所有的类标签完全相同

C.特征用完

D.遇到丢失值

点击查看答案

第2题

关于bagging下列说法错误的是：（）。

A.各基分类器之间有较强依赖，不可以进行并行训练

B.最著名的算法之一是基于决策树基分类器的随机森林

C.当训练样本数量较少时，子集之间可能有重叠

D.为了让基分类器之间互相独立，需要将训练集分为若干子集

点击查看答案

第3题

过拟合问题是模型在训练集表现较好，但在测试集表现较差，为了避免过拟合问题,我们可以采取以下哪些方法？（)

A.数据集合扩充

B.L1和L3正则化

C.提前停止训练

D.使用Dropout方法

点击查看答案

第4题

假设我们拥有一个已完成训练的、用来解决车辆检测问题的深度神经网络模型，训练所用的数据集由汽车和卡车的照片构成，而训练目标是检测出每种车辆的名称（车辆共有10种类型）。现在想要使用这个模型来解决另外一个问题，问题数据集中仅包含一种车（福特野马）而目标变为定位车辆在照片中的位置（）。

A.除去神经网络中的最后一层，冻结所有层然后重新训练

B.对神经网络中的最后几层进行微调，同时将最后一层（分类层）更改为回归层

C.使用新的数据集重新训练模型

D.所有答案均不对

点击查看答案

第5题

随机森林的随机性主要体现在（）。

A.决策树选择的随机性

B.数据集的随机性

C.待选特征的随机性

D.参数选择的随机性

点击查看答案

第6题

下列关于误差的说法，正确的是（）。

A.训练样本容量增加，泛化误差也会增加

B.过拟合指数据在训练集上的误差过大

C.过拟合可以通过减少模型参数数量解决

D.交叉验证不重复使用数据

点击查看答案

第7题

我们想要训练一个ML模型，样本数量有100万个，特征维度是5000，面对如此大数据，如何有效地训练模型（）。

A.对训练集随机采样，在随机采样的数据上建立模型

B.尝试使用在线机器学习算法

C.使用PCA算法减少特征维度

点击查看答案

第8题

关于数据挖掘C4.5算法错误的是（)。

A.一种分类决策树算法

B.核心算法是ID3

C.在树构造过程中进行剪枝

D.不需要对数据集进行多次的顺序扫描和排序，因此算法效率高

点击查看答案

第9题

（)是一种用于线性和非线性数据的分类算法，它将原数据变换到高维空间，使用称作支持向量的基本训练元组，从中发现分离数据的超平面。

A.贝叶斯算法

B.支持向量机算法

C.神经网络算法

D.决策树算法

点击查看答案

第10题

我们想要减少数据集中的特征数，即降维.选择以下适合的方案：（）。

A.使用前向特征选择方法

B.使用后向特征排除方法

C.我们先把所有特征都使用，去训练一个模型，得到测试集上的表现.然后我们去掉一个特征，再去训练，用交叉验证看看测试集上的表现.如果表现比原来还要好，我们可以去除这个特征

D.查看相关性表，去除相关性最高的一些特征

点击查看答案

第11题

决策树（）情况下会导致递归返回。

A.当前节点包含的样本全属于同一类

B.当前属性集为空

C.当前节点包含的样本集合为空

D.所有样本在所有属性上取值相同

点击查看答案

账号：尚未登录

登录没有账号？去注册

搜题明细

联系客服

购买搜题卡

下载APP

关注公众号

TOP