能否用基于模拟数据训练的预测模型来预测实验数据?

我正在进行一个材料科学领域的机器学习模型项目。目标是构建一个基于实验数据的预测模型。然而,由于实验成本和时间有限,我们预计无法从实验中获得足够的数据。因此,我们考虑使用有限元或离散元模拟等生成的模拟数据来训练模型,并用实验数据来评估模型的表现。但我对这种混合方法持怀疑态度。尽管模拟是基于实验参数进行的,但并不能保证目标输出的分布会与实验结果相符。

你怎么看?


回答:

我认为我无法给你一个准确的答案。然而,在高能物理领域,基于模拟数据进行训练并在类似真实环境中部署是常见做法。他们使用蒙特卡洛高统计模拟来训练模型,并使用实验收集的真实数据来评估其预测性能:

一个例子

你可以做的一件事是,在你的网络中加入一个领域适应层,以减少实验与模拟之间的差异:

这是一篇解释领域适应的好文章

所有这些考虑可能取决于你将要开发的架构类型,具体任务(二元分类或其他?),以及你的模拟的可靠性如何。

Related Posts

L1-L2正则化的不同系数

我想对网络的权重同时应用L1和L2正则化。然而,我找不…

使用scikit-learn的无监督方法将列表分类成不同组别,有没有办法?

我有一系列实例,每个实例都有一份列表,代表它所遵循的不…

f1_score metric in lightgbm

我想使用自定义指标f1_score来训练一个lgb模型…

通过相关系数矩阵进行特征选择

我在测试不同的算法时,如逻辑回归、高斯朴素贝叶斯、随机…

可以将机器学习库用于流式输入和输出吗?

已关闭。此问题需要更加聚焦。目前不接受回答。 想要改进…

在TensorFlow中,queue.dequeue_up_to()方法的用途是什么?

我对这个方法感到非常困惑,特别是当我发现这个令人费解的…

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注