使用强化学习解决分类问题

我可以将强化学习用于分类问题吗？例如人类活动识别？如何使用呢？

回答：

反馈有两种类型。一种是评估性的，用于强化学习方法；另一种是指导性的，主要用于监督学习，常用于分类问题。

当使用监督学习时，神经网络的权重会根据训练数据集中提供的正确标签信息进行调整。因此，在选择错误的类别时，损失会增加，权重会进行调整，以确保对于此类输入，不再选择该错误类别。

然而，在强化学习中，系统会探索所有可能的动作，在这种情况下是针对各种输入的类别标签，并通过评估奖励来决定什么是对的，什么是错的。也可能在找到正确类别标签之前，它会一直给出错误的类别名称，因为这是它目前找到的最佳输出。因此，它不利用我们对类别标签的具体知识，导致收敛速度显著减慢，相较于监督学习而言。

你可以使用强化学习来解决分类问题，但它不会给你带来任何额外的好处，反而会减慢你的收敛速度。

学技术

使用强化学习解决分类问题

发表回复取消回复

相关文章：

Related Posts

使用LSTM在Python中预测未来值

如何在gensim的word2vec模型中查找双词组的相似性

dask_xgboost.predict 可以工作但无法显示 – 数据必须是一维的

ML Tuning – Cross Validation in Spark

如何在React JS中使用fetch从REST API获取预测

如何分析ML.NET中多类分类预测得分数组？

发表回复 取消回复

发表回复取消回复