阿尔法狗的弟弟出道人类110惨败,5

图片来源:DeepMind博客继围棋之后,强大的人工智能(AI)在北京时间25日凌晨再次震撼世界:仅仅5分钟,谷歌旗下的人工智能公司DeepMind开发的全新AI程序AlphaStar就让《星际争霸2》(以下简称星际2)职业选手MaNa投降。DeepMind当天公布的录像显示,去年12月,AlphaStar分别以5-0战胜星际2的两位职业选手TLO和MaNa,成为第一个打败电竞职业选手的人工智能。在比赛之前,AlphaStar的训练量,相当于打了年的星际2。但在之后的现场比赛中,MaNa因为发现了AI操作上的缺陷,才成功为人类扳回一局。这同样也创造了历史——AlphaStar首次成为职业选手的手下败将。每日经济新闻()记者注意到,尽管10战连败,人类职业高手仍然对AlphaStar不吝称赞。“AlphaStar在每局游戏中采用的操作和不同策略令人印象十分深刻,近乎人类选手般的游戏策略出乎我的意料,”MaNa说,“我这才意识到,自己之前的策略过分依赖对手失误和人类的反应力,因此这场比赛让我对游戏有了全新的认识。我们很期待未来的无限可能。”而TLO的说法跟李世石输给AlphaGo后很像。他说:相信我,和AlphaStar比赛很难。不像和人在打,有种手足无措的感觉。他还说,每局比赛都是完全不一样的套路。赛后,DeepMind在其官方博客上表示,实现最高水平的星际2对弈代表了人工智能在有史以来最复杂电子游戏中取得的重大突破。AlphaStar背后的技术可以用来解决其他的问题,比如天气预报、气候建模、语言理解等。让AI玩星际争霸有多难?暴雪出品的星际2近年来已被公认为AI研究的“大挑战(grandchallenge)”。与下围棋相比,星际2可难得多——在围棋世界,动作空间只有种,而星际2大约是10的26次方。DeepMind也在其官方博客上解释了人工智能玩星际2的难点:游戏理论:星际2是个游戏,就想剪刀石头布一样,没有单一最佳战略。因此人工智能训练过程中需不断探索和扩展最战略知识前沿。瑕疵信息:不同于国际象棋或围棋那种一览无余的状态,星际玩家无法直接观察到重要信息,必须积极探索“探路”。长期规划:和许多现实世界中的问题并非是从“因”立即生“果”一样,游戏是可以从任何一个地方开始,需要1个小时时间出结果,这意味着在游戏开始时的行动可能在很长一段时间不会有收效。即时性:不像传统桌面游戏,玩家轮流行动,星际玩家必须在游戏时间内持续排兵布阵。庞大的行动空间:要同时控制上百个单位及建筑,这就导致了大量的可能性,行动是分级别的,可以被修改和扩张。我们将游戏参数化后,每个时间步骤平均约有10到26个合理行为。AlphaStar是如何做到跟星际2职业选手对战的呢?DeepMind表示,对决时,AlphaStar借助原始界面与星际2游戏引擎交流,也就是说,它可以直接观察地图上的我方单位和敌方可见单位,不需要移动摄像头。如果是人类玩家,注意力有限,必须调整摄像头,让它瞄准应该


转载请注明:http://www.dannanyan.com/myws/12201.html


当前时间: