我有一组示例,每个示例都标注了特征数据。这些示例和特征描述了任意领域实验的设置(例如开关数量、执行天数、参与者数量等)。某些特征是固定的(即静态的),而其他特征我可以在未来的实验中手动设置(即变量)。每个示例还具有一个“奖励”特征,这是一个在0到1之间的连续数值,由专家评定实验的成功程度。
基于这组示例,并给定未来实验的一组静态特征,我如何确定某个特定变量的最优值,以最大化奖励?
另外,这个过程有正式的名称吗?我做了一些研究,这听起来类似于回归分析,但我仍然不确定它们是否是同一件事。
回答:
这个过程被称为“实验设计”。根据参数数量的不同,以及你是否能够在试验之间进行计算,或者必须提前选择所有处理方法,可以使用各种技术。
- 完全因子设计 – 尝试每一种组合,属于蛮力方法
- 部分因子设计 – 按一定模式消除一些组合,并使用回归来填补缺失的数据
- Plackett-Burman设计、响应面方法 – 更复杂的方法,在统计努力和实验努力之间进行权衡
- …还有许多其他方法。这是统计研究的一个活跃领域。
一旦你从实验数据中构建了一个回归模型,你可以通过应用常规的数值优化技术来找到最优值。