本文概述
乌鸦世界
Wumpus世界是一个简单的世界示例,用于说明基于知识的代理的价值并表示知识表示。它的灵感来自于1973年格里高里·尤布(Gregory Yob)的电子游戏《猎杀大亨》
Wumpus世界是一个山洞,有4/4个房间,这些房间与通道相连。因此,共有16个房间相互连接。我们有一个以知识为基础的代理商,他将在这个世界上前进。这个山洞里有一间屋子,里面有个叫巫普斯(Wumpus)的野兽,他会吃掉进屋的任何人。代理人可以射杀乌鸦,但代理人只有一个箭头。在Wumpus世界中,有一些无底洞室,如果特工落在深坑中,那么他将永远被困在那里。这个洞穴令人兴奋的是,在一个房间里有可能找到一大堆金子。因此,探员的目标是找到金子并爬出洞穴,而不会掉入坑或被Wumpus吞噬。如果特工用金子出来,他会得到奖励;如果被金鸡吞下或掉进坑里,他会受到惩罚。
注意:这里的Wumpus是静态的,不能移动。
以下是代表Wumpus世界的示例图。它显示了在世界(1,1)正方形位置上的一些带有坑的房间,带有Wumpus的一个房间和一个代理商。
还有一些组件可以帮助特工导航洞穴。这些组件如下所示:
- 与Wumpus房间相邻的房间很臭,因此会有些恶臭。
- 与PIT相邻的房间微风轻拂,因此,如果业务代表到达PIT附近,则他会感觉到微风。
- 当且仅当房间有金色时,房间才会闪闪发光。
- 如果特工面对它,则该特工可能会杀死该特工,并且特工会发出可怕的尖叫声,在山洞的任何地方都可以听到。
PEAS对Wumpus世界的描述
为了解释Wumpus世界,我们对PEAS进行了如下描述:
性能指标:
- 如果特工带着金从洞穴中出来,则可获得1000点奖励积分。
- 被Wumpus吃掉或掉进坑里的点数为-1000分。
- -1表示每个操作,-10表示使用箭头。
- 如果特工死亡或从山洞出来,游戏就会结束。
环境:
- 4 * 4的房间网格。
- 该代理最初位于房间正方形[1,1]中,朝向右侧。
- 除了第一个正方形[1, 1]以外,都是随机选择Wumpus和黄金的位置。
- 洞穴的每个正方形都可以是第一个正方形以外的概率为0.2的坑。
执行器:
- 左转,
- 右转
- 前进
- 抓
- 发布
- 射击。
传感器:
- 如果代理商在Wumpus附近的房间里,他会感觉到恶臭。 (不是对角线的)。
- 如果特工在紧邻坑的房间内,他会感觉到微风。
- 代理会感知到存在金的房间中的闪光。
- 特工走进墙壁会感觉到撞击。
- 射杀乌鸦时,它会发出可怕的尖叫声,在山洞的任何地方都可以感觉到。
- 这些感知可以表示为五个元素列表,其中每个传感器都有不同的指标。
- 例如,如果特工感觉到恶臭,微风,但没有闪光,没有碰碰和尖叫声,则可以表示为:[恶臭,微风,无,无,无]。
乌普普斯世界酒店
- 部分可观察:Wumpus世界是部分可观察的,因为代理只能感知附近的环境,例如相邻的房间。
- 确定性的:确定性的,因为世界的结果和结果是已知的。
- 顺序的:顺序很重要,因此顺序是顺序的。
- 静态:由于Wumpus和坑不移动,它是静态的。
- 离散的:环境是离散的。
- 一个代理:环境是一个代理,因为我们只有一个代理,而Wumpus不被视为代理。
探索Wumpus世界
现在,我们将探索Wumpus世界,并通过应用逻辑推理来确定代理如何找到目标。
代理的第一步:
最初,业务代表位于第一个房间或正方形[1, 1]上,并且我们已经知道该房间对于业务代表是安全的,因此在下图(a)中表示该房间是安全的,我们将添加符号好。符号A代表代理,符号B代表微风,G代表闪光或金币,V代表已访问房间,P代表小坑,W代表Wumpus。
在[1, 1]室,代理人不会感到微风或恶臭,这意味着相邻的正方形也可以。
代理的第二步:
现在代理需要向前移动,因此它将移动到[1,2]或[2, 1]。假设代理移动到房间[2,1],在这个房间,代理感觉到微风,这意味着Pit在这个房间周围。凹坑可以在[3,1]或[2, 2]中,因此我们将添加符号P?这样说,这是坑室吗?
现在,代理将停止思考,不会采取任何有害措施。座席将回到[1,1]房间。座席访问了房间[1, 1]和[2, 1],因此我们将使用符号V表示访问的正方形。
代理的第三步:
在第三步,现在代理将移动到房间[1, 2],这很好。在房间[1, 2]中,特工感觉到恶臭,这意味着附近必须有一个乌鸦。但是按照游戏规则,Wumpus不能在房间[1, 1]中,也不能在[2, 2]中(Agent在[2, 1]时没有发现任何恶臭)。因此,代理人推断出Wumpus在房间[1, 3]中,并且在当前状态下没有微风,这意味着在[2, 2]中没有坑也没有Wumpus。因此这是安全的,我们将其标记为OK,并且代理在[2, 2]中进一步移动。
代理的第四步:
在房间[2, 2]上,这里没有恶臭,也没有微风,所以让我们假设代理决定移动到[2, 3]。在[2, 3]房间,特工感知到闪光,因此它应该抓住金子并爬出洞穴。