这是70-774考试参考书章节末尾提出的问题。
如果您将一个神经网络连接到配置为随机扫描且最大随机扫描运行次数为1的调节模型超参数模块,那么在实验执行期间会训练多少个神经网络?为什么?如果您将验证数据集连接到调节模型超参数模块的第三个输入,現在会训练多少个神经网络?
答案是:
没有验证数据集时会训练11个神经网络(10个k折交叉验证 + 1个使用所有数据和最佳超参数组合训练的)。如果提供了验证集,只会训练1个神经网络,因此最佳模型不会使用验证集进行训练。
10这个数字从何而来?我理解的应该是分别为2和1。难道不应该创建n折,其中n等于运行次数吗?
回答:
当您在没有验证数据集的情况下使用调节模型超参数模块时,即仅使用第二个输入数据端口,模块会以交叉验证模式工作。因此,通过对提供的数据集进行交叉验证来找到最佳参数模型,为此,数据集被分成k折。默认情况下,模块将数据分成10折。如果您想将数据分成不同数量的折,可以在第二个输入连接一个分区和样本模块,选择分配到折,并指明所需的折数。在许多情况下,k=5是一个合理的选择。