学习最优参数以最大化奖励

我有一组示例,每个示例都标注了特征数据。这些示例和特征描述了任意领域实验的设置(例如开关数量、执行天数、参与者数量等)。某些特征是固定的(即静态的),而其他特征我可以在未来的实验中手动设置(即变量)。每个示例还具有一个“奖励”特征,这是一个在0到1之间的连续数值,由专家评定实验的成功程度。

基于这组示例,并给定未来实验的一组静态特征,我如何确定某个特定变量的最优值,以最大化奖励?

另外,这个过程有正式的名称吗?我做了一些研究,这听起来类似于回归分析,但我仍然不确定它们是否是同一件事。


回答:

这个过程被称为“实验设计”。根据参数数量的不同,以及你是否能够在试验之间进行计算,或者必须提前选择所有处理方法,可以使用各种技术。

一旦你从实验数据中构建了一个回归模型,你可以通过应用常规的数值优化技术来找到最优值。

Related Posts

使用LSTM在Python中预测未来值

这段代码可以预测指定股票的当前日期之前的值,但不能预测…

如何在gensim的word2vec模型中查找双词组的相似性

我有一个word2vec模型,假设我使用的是googl…

dask_xgboost.predict 可以工作但无法显示 – 数据必须是一维的

我试图使用 XGBoost 创建模型。 看起来我成功地…

ML Tuning – Cross Validation in Spark

我在https://spark.apache.org/…

如何在React JS中使用fetch从REST API获取预测

我正在开发一个应用程序,其中Flask REST AP…

如何分析ML.NET中多类分类预测得分数组?

我在ML.NET中创建了一个多类分类项目。该项目可以对…

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注