我正在阅读一本关于机器学习的文本,其中有一个问题:
如果我们有一个监督者可以为任何x提供标签,我们应该选择哪个x来减少查询次数进行学习?
所以我理解这意味着:
我们被要求通过选择提供最具区分信息的测试元素来加速学习过程。
我认为这应该是一个迭代算法:即后续测试元素的选择取决于之前选择的元素。问题中不清楚的是:
- 后续元素的选择是否也依赖于先前查询的结果。
所以我在这里的问题是:是否存在某种信息论上的唯一答案?还是有多个方法可能具有相似的有效性/速度?
** 脚注:这不是作业 – 这是我的独立学习
回答:
有多种方法。事实上,这种设置是一种称为主动学习的机器学习任务。有很多方法可以根据不同的策略选择x – 请参阅这篇调查论文的第3部分。