本文概述
根据代理人感知的智力和能力的程度,他们可以分为五类。随着时间的推移,所有这些代理都可以提高其性能并产生更好的操作。这些在下面给出:
- 简单的反射代理
- 基于模型的反射代理
- 目标代理
- 基于实用程序的代理
- 学习代理
1.简单的反射代理
- 简单反射代理是最简单的代理。这些代理根据当前的感知做出决策,而忽略其余的感知历史。
- 这些代理仅在完全可观察的环境中成功。
- 简单反射代理在决策和操作过程中不会考虑感知历史的任何部分。
- 简单反射代理根据条件操作规则工作,这意味着它将当前状态映射到操作。例如“房间清洁剂”,它仅在房间中有灰尘时才起作用。
- 简单的反射代理设计方法存在的问题:他们的智能非常有限,他们不了解当前状态的非感知部分,通常太大而无法生成和存储。不适应环境变化。
2.基于模型的反射代理
- 基于模型的代理可以在部分可观察的环境中工作并跟踪情况。
- 基于模型的代理具有两个重要因素:模型:它是有关“世界如何发生”的知识,因此称为基于模型的代理。内部状态:它是基于感知历史记录的当前状态的表示。
- 这些代理具有“这是世界知识”的模型,并基于该模型执行操作。
- 更新代理状态需要有关以下信息:世界如何演变代理的行为如何影响世界。
3.基于目标的代理
- 当前状态环境的知识并不总是足以决定代理要做什么。
- 代理需要知道其描述理想情况的目标。
- 基于目标的代理通过获取“目标”信息来扩展基于模型的代理的功能。
- 他们选择一项行动,以便实现目标。
- 在决定目标是否实现之前,这些主体可能必须考虑一系列可能的措施。不同情况下的这种考虑称为搜索和计划,这使代理变得主动。
4.基于实用程序的代理
- 这些代理类似于基于目标的代理,但提供了效用度量的额外组成部分,通过在给定状态下提供成功度量来使其与众不同。
- 基于效用的代理不仅根据目标采取行动,而且还基于实现目标的最佳方法。
- 当有多种可能的替代方案且必须选择代理以执行最佳操作时,基于实用程序的代理将很有用。
- 实用程序功能将每个状态映射为实数,以检查每个动作达到目标的效率。
5.学习代理
- AI中的学习代理是可以从其过去的经验中学习或具有学习能力的代理。
- 它从基础知识开始行动,然后能够通过学习自动行动和适应。
- 学习主体主要具有四个概念性组成部分:学习要素:负责通过从环境中学习来进行改进批评:学习要素吸收批评者的反馈,这些评论描述了主体在固定绩效标准方面的表现。绩效要素:负责选择外部行动问题产生者:此组件负责建议行动,这些行动将带来新的和有益的经验。
- 因此,学习代理能够学习,分析性能,并寻找提高性能的新方法。