学习最优参数以最大化奖励

我有一组示例,每个示例都标注了特征数据。这些示例和特征描述了任意领域实验的设置(例如开关数量、执行天数、参与者数量等)。某些特征是固定的(即静态的),而其他特征我可以在未来的实验中手动设置(即变量)。每个示例还具有一个“奖励”特征,这是一个在0到1之间的连续数值,由专家评定实验的成功程度。

基于这组示例,并给定未来实验的一组静态特征,我如何确定某个特定变量的最优值,以最大化奖励?

另外,这个过程有正式的名称吗?我做了一些研究,这听起来类似于回归分析,但我仍然不确定它们是否是同一件事。


回答:

这个过程被称为“实验设计”。根据参数数量的不同,以及你是否能够在试验之间进行计算,或者必须提前选择所有处理方法,可以使用各种技术。

一旦你从实验数据中构建了一个回归模型,你可以通过应用常规的数值优化技术来找到最优值。

Related Posts

L1-L2正则化的不同系数

我想对网络的权重同时应用L1和L2正则化。然而,我找不…

使用scikit-learn的无监督方法将列表分类成不同组别,有没有办法?

我有一系列实例,每个实例都有一份列表,代表它所遵循的不…

f1_score metric in lightgbm

我想使用自定义指标f1_score来训练一个lgb模型…

通过相关系数矩阵进行特征选择

我在测试不同的算法时,如逻辑回归、高斯朴素贝叶斯、随机…

可以将机器学习库用于流式输入和输出吗?

已关闭。此问题需要更加聚焦。目前不接受回答。 想要改进…

在TensorFlow中,queue.dequeue_up_to()方法的用途是什么?

我对这个方法感到非常困惑,特别是当我发现这个令人费解的…

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注