新浪微博 | 腾讯微博 | 收藏艺淼环保 | 在线留言 | 网站地图 欢迎光临艺淼环保网站

艺淼环保

污水治理工程首选 专注有机污水治理12年 国家专利技术

咨询热线 15109212130
艺淼环保
新闻资讯
联系艺淼环保

咨询热线: 0871-63337100

云南艺淼环保科技有限公司

手机:13808710689

邮箱:admin@ymhb100.com

办公地址:昆明经开区出口加工区第三城映象欣城

我和AI打了六局王者荣耀心态崩了

时间:2020-05-04 14:44:04来源:中国在线赌城-中国赌城在线-中国赌城官网

  PVP对战手游王者荣耀在五一节期间上线了一种新玩法——挑战 · 绝悟,也就是5人组队和5个AI对战。

  早就听闻「绝悟」在测试版的的胜率高达99.8%,而身赋「王者段位」操作水平的我,觉得是时候在王者峡谷中大展不凡身手了。

  进入挑战入口后,可以看到这是一个通关玩法,一共5关,想必难度会随着关卡而提高。

  开局前,我还在想「绝悟」会不会像人类一样有策略,果不其然,刚上线,对面李白就带着牛魔准备反我家的“蓝爸爸”(见左上角小地图)。

  然而,就在这时,让我更意外的事情发生了——我被后裔“阴”了,原来他一直蹲在草丛里注视着我……大半管血就被消耗没了。

  当我想反手回击,中路小乔又过来支援了……还好我身轻如燕,没造成送一血的悲剧。

  此后,坚信发育就是王道的我,就开始安心清兵线,队友们也非常给力,开局不到3分钟,已经拿下7个人头。

  这局凭借着我家猴子碾压「绝悟」操作的猴子,以及夏侯惇优秀的上单表现,即便面对伽罗、干将莫邪这种长手怪,也顺利拿下胜利。

  这局开场,「绝悟」采取的策略,是最近比较流行的一种战术——辅助跟着中单快速清理第一波兵线。

  在「绝悟」的迅速支援下,我方伽罗成功送上了第一个人头,这个场景跟第一局如出一辙……毕竟,这局的射手不是我,操作不出那华丽的身法……

  这局并没有像之前那般顺利,在接近6分钟时,双方战绩可以说55开,13:11。

  其实,对线婉儿我是比较怕的,毕竟在一个“贼6”的婉儿面前,我只能是个活靶子。然而,「绝悟」操作的婉儿,简直让我惊呆了。

  举个例子,我家狄仁杰处于残血状态,婉儿突然从野区中冲出来,看她行进的路径,应该是那套“一气呵成带走人”的招式没错了。

  正当我以为她的“133233上天”要带走我们俩人时,她的上天……竟然是被我的吹起来的……然后就灰头土脸的跑!掉!了!

  而就在7分钟左右,系统突然弹出了一个提示——绝悟AI集体升级换代中……滴滴滴。

  毫无悬念,13:30,14分钟,已经分不清这个“人机模式”下,谁是人,谁是机。

  明知道「绝悟」支援非常迅速的情况下,各种“冲锋陷阵”,那种“我不入地狱谁入地狱”的勇气简直让人感动。

  「绝悟」的 1v1 版本首次露面,是在2018年的 KPL 秋季总决赛上,而后在去年8月份,在5v5比赛中击败了人类职业战队,实力不容小觑。

  而有关「绝悟」的技术细节,在去年年底时,腾讯在一篇入围AAAI 2020的论文中也有所披露。

  首先需要指明的是,腾讯的这篇新论文关注的是 1v1 游戏AI,并不是 5v5 游戏AI。

  研究人员在论文中解释称,后者更注重所有智能体的团队合作策略,而不是单个智能体的动作决策。

  考虑到这一点,1v1游戏更适合用来研究游戏中的复杂动作决策问题,也能够更加全面系统的研究游戏 AI 智能体的构建。

  这是一种高可扩展低耦合的系统架构,可以用来构建数据并行化。主要考虑的是复杂智能体的动作决策问题可能引入高方差的随机梯度,所以有必要采用较大的批大小以加快训练速度。

  其中,AI服务器实现的是 AI 模型与环境的交互方式。分发模块是用于样本收集、压缩和传输的工作站。记忆池是数据存储模块,能为 RL 学习器提供训练实例。

  这些模块是分离的,可灵活配置,从而让研究者可将重心放在算法设计和环境逻辑上。这样的系统设计也可用于其它的多智能体竞争问题。

  在强化学习学习器中,他们还实现了一个 actor-critic 神经网络,用于建模1v1 游戏中的动作依赖关系。

  为了应对游戏中的多个场景决策,研究人员们还提出了一系列算法策略,来实现更高效率的训练:

  为了学习英雄的技能释放组合,以便AI在序列决策中,快速输出大量伤害,使用了LSTM;

  为了确保使用大和有偏差的数据批进行训练时的收敛性,改进 PPO 算法提出dual-clip PPO,其示意图如下所示:

  研究人员在论文中指出,基于这样的方法训练一个英雄,使用48个P40 GPU卡和18000个CPU 内核,训练一天相当于人类打500年,训练30个小时就能达到王者段位水平,70个小时比肩职业玩家,其表现要显著优于多种baseline方法。