世界超市世界超市

攻下象棋、围棋、扑克之后 AI在游戏上还怎么玩

人工智能日益复杂,和人类玩游戏成为非常有技巧的事情。研究人员Arend Hintze对人工智能和游戏的发展前途展开了探索。早在20世纪80年代,一名教师曾向我提出挑战:写一个叫作井字棋的游戏程序,我不幸失败了。但就在几周前,我向我的一位计算机科学研究生解释了如何使用所谓的极大极小算法来完成井字棋游戏程序的编写,最后我们花了大约一个小时编写完这个程序。不可否认,多年来我的编程技能一直在提高,但计算机科学的进步也走过了一段漫长的道路。几十年前看似不可能的事情,在今天却变得异常轻松。1997年,在一场六局国际象棋比赛中,一款名为深蓝的IBM电脑击败了国际象棋大师Garry Kasparov,这令人们感到震惊。2015年,谷歌透露其DeepMind系统已经掌握了数个20世纪80年代的视频游戏,其中包括一个关键的制胜策略。2016年,谷歌的AlphaGo系统在五局比赛中击败了排名第一的围棋选手。对能在游戏中击败人类的技术系统的探索仍在继续。5月底,AlphaGo将会在中国乌镇举行的围棋峰会上对战世界上最优秀的选手柯洁。随着计算技术的提高和工程的改进,计算机甚至可以在我们本认为需要依赖于人类直觉、智慧、欺骗或虚张声势的游戏中击败人类比如扑克。最近我看到一段视频,排球运动员练习对着机器人控制的橡胶手臂进行活动和刺击,试图阻止投篮。我得到一个教训::当机器努力赢得胜利时,人类的努力是徒劳的。我们都想要一个完美的人工智能系统来驱动我们的汽车,一个不知疲倦的系统在x射线中寻找癌症的迹象,这种想法是美好的。但说到游戏,人类不想输。幸运的是,人工智能可以让游戏变得更有趣,甚至可以带来无穷无尽的快乐。今天的游戏设计师们,他们编写的东西比一部大片更赚钱,这说明了一个问题:打造一个不可战胜的人工智能系统是毫无意义的。没有人想要打一场不可能赢的比赛。但人们确实想玩那种沉浸式、复杂和刺激的游戏。即使是当现在最好的游戏,玩了一段时间后也会变得不新奇。有趣的游戏会让玩家通过调整并作出反应来保持游戏的趣味性,也许可以维持到永远。所以,当我们在设计人工智能系统时,我们不应该去看那些得意洋洋的深蓝和阿尔法人工智能,而是要去看获得巨大成功的魔兽世界这样的大型多人在线游戏。这些游戏都是图形设计的,但它们的主要吸引力在于其互动性。大多数人似乎都不喜欢像国际象棋和围棋这样极其复杂的逻辑谜题,而更倾向于富有意义的人脉圈子和社区活动。这些大型多人在线游戏的真正挑战在于如何保持玩家每一次的全新体验,而不是他们是否能被智能(人为或非人为)打败。目前,很多游戏环境允许玩家之间进行充分的互动。在地牢里的小队中扮演的角色是明确的:战士们遭到伤害,治疗者帮助他们从伤痛中恢复过来,而脆弱的巫师们则从远处施展魔法。想想传送门2,这是一款多人游戏,完全集中在机器人协作上,让他们在迷宫般的认知测试中迷失方向。一起探索世界可以让你和朋友们拥有共同的回忆。但对这些环境或基本布局的任何改动,都必须由人类设计师和开发人员做出。在现实世界中,改变是自然发生的,没有监督、设计或人工干预。玩家可以学习,生物也会适应。有些生物甚至会共同进化,对彼此的发展作出反应。(在武器技术军备竞赛中也出现了类似的现象)如今的电脑游戏缺乏这样的复杂性。出于这个原因,我认为开发出能够玩现代游戏的人工智能并不会对人工智能研究有实质性的推进。一款值得玩的游戏应该是不可预测的,因为它能适应,保持永久的新颖性,并且它是通过玩游戏创造出来的。未来的游戏有待发展。游戏的角色不应该只是做出反应;他们需要探索,看到弱点,学会合作。我们知道,达尔文的进化论和他的学问是地球上所有新奇事物的驱动因素。这也可能是推动虚拟环境变化的原因。进化论可以解释自然智慧的创造。难道我们不应该把开发人工智变成进化人工智能吗?包括我自己和我的同事Christoph Adami在内的几个实验室正在研究神经进化。在计算机中,我们模拟复杂的环境,比如道路网络或生物生态系统。我们创造出虚拟的生物,并挑战它们,让它们进化出成千上万的虚拟后代。进化本身就是最好的驱动力,或者可以说是最好的适应环境的有机体,它们就是存活下来的生物。今天的AlphaGo正在进行这一过程,通过不断地和自己玩游戏,分析顶级围棋冠军的游戏记录来学习。但它不会像我们一样学习,体验无人监督的实验。而且它不能适应一个特定的对手:对电脑玩家来说,最好的动作是认定的,不考虑对手的风格。从经验中学习的程序是人工智能的下一步。它们会让电脑游戏变得更有趣,让机器人不仅能在现实世界中发挥更大的作用,还能让机器人在运行中适应它。(英文来源/AI研究院 编译/机器小易 审校/前言)

上一条:海尔换道超车的真正秘密

相关推荐