外设堂

 找回密码
 立即注册

QQ登录

只需一步,快速开始

搜索
外设堂 首页 业界动态 创意 查看内容

1:10!《星际争霸2》沦陷 人类被AI血洗

2019-1-25 09:26| 发布者: 大胖鸟| 查看: 1028| 评论: 9|来自: 快科

摘要: 1997年,“深蓝”在国际象棋上击败人类冠军卡斯帕罗夫的时候,人们说来一盘围棋啊,结果有了AlphaGo横扫人类顶尖高手李世石、柯洁。这时候,有人说来一盘“星际”啊……结果,还不到三年,《星际争霸2》又被AI拿下, ...

1997年,“深蓝”在国际象棋上击败人类冠军卡斯帕罗夫的时候,人们说来一盘围棋啊,结果有了AlphaGo横扫人类顶尖高手李世石、柯洁。这时候,有人说来一盘“星际”啊……

结果,还不到三年,《星际争霸2》又被AI拿下,而且人类输得几乎体无完肤!

北京时间1月25日凌晨,Google DeepMind的最新AI人工智能程序“AlphaStar”以两个5:0连续血洗《星际争霸2》职业选手TLO、MaNa,只是在随后的一场表现赛中输给了MaNa。

其中,TLO是Liquid战队的虫族选手,目前世界排名第68,MaNa则是2018年WSC大赛的奥斯汀站亚军,神族选手,世界排名第19。

这次是AlphaStar首次公开亮相,比赛用的游戏版本是4.6.2,只进行神族内战,固定在Catalyst LE地图。

尤其令人称奇的是,AlphaStar与两位人类对手的比赛相隔只有两周,就迅速自学成才,对战TLO时虽然完胜但表现还相当菜鸟,而对战MaNa的时候已经有了几乎的完美,非人类的操作让人猝不及防。

DeepMind科学家Oriol Vinyals、David Silver介绍说,AlphaStar的训练首先是模仿学习,训练大量的比赛回放资料,让AI通过观察一个人所处的环境,尽可能地模仿某个特定的动作,从而理解游戏基本知识。

然后使用“Alpha League”循环比赛方法,先对比从人类数据中训练出来的神经网络,然后逐次迭代,产生新的Agent和分支,使其发展壮大。

接下来,这些Agent通过强化学习过程与Alpha League中的其他竞争对手进行比赛,尽可能有效地击败所有这些不同的策略,并调整个人学习目标,鼓励竞争对手朝特定方式演进,比如说获得特定奖励。

最后在Alpha League中选择最不容易被利用的Agent,称之为“The nash of League”,去挑战人类。

至于为何选择《星际争霸2》,主要是因为这款游戏具备策略性、竞争性的特性,需要即时做出大量决策,是非常有趣和复杂的游戏,在全球都很火爆,每年都有大量的比赛,有着海量的玩家基础。

发表评论

最新评论

引用 CraZy_ZyQ 2019-1-27 00:51
看看
引用 JackyS 2019-1-26 16:52
希望早点实现
引用 大树在生长 2019-1-26 08:57
围观
引用 81834266 2019-1-26 08:26
AI牛逼了
引用 只是试玩啊 2019-1-25 20:50
apm人类完全比不上的。。。
引用 CAPTMICHAEL 2019-1-25 17:41
电脑apm1500,而且都是有效apm,人类五打一还差不多
引用 CraZy_ZyQ 2019-1-25 14:55
可怕啊。在过20-30年又是什么样子。
引用 woohyukwzf 2019-1-25 11:26
有看过视频的说是吹
引用 Kuriboh 2019-1-25 11:00
沙发

查看全部评论(9)

手机版|外设堂 ( 辽ICP备13014379号 )辽公网安备 21010202000549号

GMT+8, 2026-2-10 14:36 , Processed in 0.041898 second(s), 15 queries , Gzip On.

Powered by Discuz! X3.4

Copyright © 2001-2021, Tencent Cloud.

返回顶部