我有一本 人工智能:一种现代方法(作者:Stuart Russell)。我正在阅读第 16 章“做出简单的决策”,但我不太理解 效用理论
的主要思想,你能提供一个详细的例子吗?
回答:
效用理论的核心思想非常简单:一个智能体对可能结果的偏好可以通过一个函数来表示,该函数将这些结果映射到一个实数;数字越高,智能体就越喜欢该结果。这个函数被称为效用函数。
例如,我们可以说我对拥有各种物品的效用是:
u(apple) = 10u(orange) = 12u(basketball) = 4u(macbookpro) = 45
经济学家(通常)认为人类是效用最大化的主体。也就是说,我们总是试图最大化我们内部的效用函数。
一旦你有了这些数字,你就可以将它们与概率混合在一起,并讨论期望效用、最优策略、折现的未来回报以及许多其他有趣的东西。
如果你想了解更多,可以拿起一本博弈论教科书,或者阅读这本代理书籍的第一章。