世界超市世界超市

两个AI在一起会发生什么

从谷歌的AlphaGo与人类的对弈中,人们发现AlphaGo使用了很多人类没有想到甚至以为是错误的策略,可以说AlphaGo的出现,拓宽了人类在围棋这个项目上的视野。那么在不同规则下,人工智能之间会如何互动呢?谷歌的Deepmind的团队真的将两个人工智能放在不同的规则下,看他们会选择什么样的交互策略。从实践上看,未来社会人工智能将应用在很多领域上,在不同领域中,必然会存在人工智能之间的互动,搞清楚人工智能间如何互动就成了非常实际的问题了。为此Deepmind做了个实验,将数个人工智能植入到一个类似囚徒困境的情形中,在此情况下,个体可以通过背叛他人获利,但如果所有人都十分自私,就没有人能获利。Deepmind设计了两个游戏,一个叫捡苹果,玩家可以再一条管道上收集苹果,谁捡的苹果多谁获胜,每个玩家还拥有一项叫激光的技能,玩家可以用激光让对手消失一段时间。另一个游戏叫狼群,两名玩家在一个充满困难和障碍的环境中捕猎一只猎物,当猎物被猎杀时,不但抓到猎物的玩家能得分,周围的玩家也可以得分。实验结果显示,人工智能会根据不同的情况改变自己的策略,时而合作时而敌对,但无论怎样都是尽量让自己的利益最大化。在捡苹果游戏中,如果苹果数量很多,人工智能就很少会阻碍对手,专心捡苹果。但随着苹果数量越来越少,人工智能使用技能阻碍对手的频率就会逐渐增加。但是如果你在游戏中引入一个较强的人工智能时,这个较强的人工智能会从一开始就尽量阻碍对手,表面上看,这好像是说明更聪明的人工智能更好斗,但事实却是,阻碍对手是一项比艰难的行为,需要大量的计算,如果没有足够的能力,那么随意使用这个技能反而会影响自己捡苹果,但更强大的人工智能有能力在捡好苹果的同时,计算如何阻碍对手,所以他们更倾向于使用技能。在狼群游戏中,情况却截然相反,更聪明的人工智能会更倾向于和其他玩家配合,因为配合捕猎不但需要计算自己和猎物的关系,还得将其他玩家计算进来。可以说规则导致了人工智能行为的不同,当人工智能面临零和博弈时,就会倾向于更加好斗,但在它们面临正和博弈时,就会倾向于合作。实验结果显示,在涉及到多人工智能交互的场景中,一定要保证规则合理,否则人工智能会为了自己的目标无所不用其极。控制人工智能行为的关键就是设置合理的规则。除此以外,该实验也有心理学意义,在试验中的人工智能和无情绪和道德感的人类行为很类似,通过实验可以看到人工智能的行为模式是因为环境的变化,这和心理学的假设基本一致。(王蔚)从谷歌的AlphaGo与人类的对弈中,人们发现AlphaGo使用了很多人类没有想到甚至以为是错误的策略,可以说AlphaGo的出现,拓宽了人类在围棋这个项目上的视野。那么在不同规则下,人工智能之间会如何互动呢?谷歌的Deepmind的团队真的将两个人工智能放在不同的规则下,看他们会选择什么样的交互策略。从实践上看,未来社会人工智能将应用在很多领域上,在不同领域中,必然会存在人工智能之间的互动,搞清楚人工智能间如何互动就成了非常实际的问题了。为此Deepmind做了个实验,将数个人工智能植入到一个类似囚徒困境的情形中,在此情况下,个体可以通过背叛他人获利,但如果所有人都十分自私,就没有人能获利。Deepmind设计了两个游戏,一个叫捡苹果,玩家可以再一条管道上收集苹果,谁捡的苹果多谁获胜,每个玩家还拥有一项叫激光的技能,玩家可以用激光让对手消失一段时间。另一个游戏叫狼群,两名玩家在一个充满困难和障碍的环境中捕猎一只猎物,当猎物被猎杀时,不但抓到猎物的玩家能得分,周围的玩家也可以得分。实验结果显示,人工智能会根据不同的情况改变自己的策略,时而合作时而敌对,但无论怎样都是尽量让自己的利益最大化。在捡苹果游戏中,如果苹果数量很多,人工智能就很少会阻碍对手,专心捡苹果。但随着苹果数量越来越少,人工智能使用技能阻碍对手的频率就会逐渐增加。但是如果你在游戏中引入一个较强的人工智能时,这个较强的人工智能会从一开始就尽量阻碍对手,表面上看,这好像是说明更聪明的人工智能更好斗,但事实却是,阻碍对手是一项比艰难的行为,需要大量的计算,如果没有足够的能力,那么随意使用这个技能反而会影响自己捡苹果,但更强大的人工智能有能力在捡好苹果的同时,计算如何阻碍对手,所以他们更倾向于使用技能。在狼群游戏中,情况却截然相反,更聪明的人工智能会更倾向于和其他玩家配合,因为配合捕猎不但需要计算自己和猎物的关系,还得将其他玩家计算进来。可以说规则导致了人工智能行为的不同,当人工智能面临零和博弈时,就会倾向于更加好斗,但在它们面临正和博弈时,就会倾向于合作。实验结果显示,在涉及到多人工智能交互的场景中,一定要保证规则合理,否则人工智能会为了自己的目标无所不用其极。控制人工智能行为的关键就是设置合理的规则。除此以外,该实验也有心理学意义,在试验中的人工智能和无情绪和道德感的人类行为很类似,通过实验可以看到人工智能的行为模式是因为环境的变化,这和心理学的假设基本一致。

上一条:《女神叮有料》1分钟教你学料理 乐视视频蓄势发力短视频

相关推荐