我在寻找一些研究论文或书籍,其中有关于监督学习和无监督学习的基本定义,以便我在项目中引用这些定义。
非常感谢。
回答:
我会引用以下书籍:Artificial Intelligence: A Modern Approach(第三版)由Stuart Russell和Peter Norvig编写。第18章及693页以后有对监督学习和无监督学习的详细分析。关于无监督学习:
在无监督学习中,代理即使没有明确的反馈,也能学习输入中的模式。最常见的无监督学习任务是聚类:检测输入示例中可能有用的聚类。例如,一个出租车代理可能会逐渐形成“交通顺畅的日子”和“交通堵塞的日子”的概念,而无需老师提供每个类别的标记示例。
而关于监督学习:
在监督学习中,代理观察到一些输入-输出对,并学习一个从输入到输出的映射函数。在上述组件1中,输入是感知,输出由一个老师提供,他说“刹车!”或“左转”。在组件2中,输入是摄像头图像,输出再次来自一个老师,他说“这是公交车”。在3中,刹车理论是从状态和刹车动作到以英尺为单位的停止距离的函数。在这种情况下,输出值可以直接从代理的感知中获得(事后);环境是老师。