Connect with us

NewsMaker

最前线 | “开悟AI+游戏高校大赛”启动,AI为何要学打王者荣耀?


SPORT

最前线 | “开悟AI+游戏高校大赛”启动,AI为何要学打王者荣耀?

8月18日,腾讯宣布首届“开悟AI+游戏高校大赛”初赛正式启动,这也是腾讯开悟平台首次面向高校开放。该大赛由腾讯AI Lab携手王者荣耀、腾讯高校合作、腾讯游戏学院等共同发起,邀请来自清华大学、北京大学、上海交通大学等国内18所顶尖高校的100多名学生同台竞技。 参赛队伍需要在指定的时间内,在给定的资源下训练出最优模型,并最终部署好使用最优模型的AI服务器,提交系统进行1V1(初赛)、5V5(决赛)对局。大赛总奖金池高达50万元,最终成绩将于今年12月发布。 《王者荣耀》的基本玩法是通过推塔、击杀敌人、赚取经济来得到优势,胜利条件是摧毁敌方的水晶基地。 看似简单的规则,对于AI来讲是巨大的挑战——AI要在不完全信息、高度复杂度的情况作出复杂快速的决策。在庞大且信息不完备的地图上,10位参与者要在策略规划、英雄选择、技能应用、路径探索及团队协作上面临大量、不间断、即时的选择,这带来了极为复杂的局面,预计有高达10的20000次方种操作可能性,而整个宇宙原子总数也只是10的80次方。 要实现胜利目标,需要考查AI的多项能力:智能体解决方案、特征、动作空间、模型结构设计、强化学习算法设计、奖励函数设计、训练方式探索等。 正如AI业界普遍认为的,下一个 AI 里程碑可能会在复杂策略游戏中诞生。能够适用于这种游戏的AI,将更可能在多变、复杂的真实环境中,学会像人一样实时感知、分析、理解、推理、决策到行动。世界顶级科技公司均在推进此类研究,如Google Deepmind(星际争霸2)、Facebook(星际争霸2) 及 Open AI(Dota 2)等。 国内各大高校的学者们也在这一领域做出了相关研究,并取得了一些成果。 北京大学教授李文新团队,曾发表相关论文研究初始手牌对“地主”或“农民”的获胜难度有何影响;另外,他们还提出了另一种新方法,可以评价一个斗地主 AI 的牌技好不好。 中国科学院自动化研究所兴军亮团队,为了达到让多个智能体学会合作的目的,提出了一种自我提升式强化学习框架。先让智能体通过模仿来学习,再通过自我互博来进阶进化,加上他们提出的一种新策略,可有效缓解一些多智能学习的常见问题。 上海交通大学教授温颖也曾提出一种新技术,让AI们的合作方式更多样化,从而不那么容易暴露自己的套路,让游戏变得更有挑战性。这种技术还可以用于训练自动驾驶汽车。 腾讯 AI Lab本身,也在智能体研究领域经验颇丰。2016年起,研发的围棋 AI “绝艺”(Fine Art),现担任中国国家围棋队训练专用 AI ;2017年,基于王者荣耀游戏测试环境启动MOBA策略协作型AI“绝悟”研发,2019年达到职业电竞水平;腾讯还在射击类顶级 AI 竞赛 VizDoom 夺冠,并在《星际争霸2》首先研发出击败内置 AI 的智能体。 学会打王者荣耀的AI,能否学会应对更多实际生活中的问题?未来的AI,又会拥有怎样的可能性?

最前线 | “开悟AI+游戏高校大赛”启动,AI为何要学打王者荣耀?

8月18日,腾讯宣布首届“开悟AI+游戏高校大赛”初赛正式启动,这也是腾讯开悟平台首次面向高校开放。该大赛由腾讯AI Lab携手王者荣耀、腾讯高校合作、腾讯游戏学院等共同发起,邀请来自清华大学、北京大学、上海交通大学等国内18所顶尖高校的100多名学生同台竞技。

参赛队伍需要在指定的时间内,在给定的资源下训练出最优模型,并最终部署好使用最优模型的AI服务器,提交系统进行1V1(初赛)、5V5(决赛)对局。大赛总奖金池高达50万元,最终成绩将于今年12月发布。

《王者荣耀》的基本玩法是通过推塔、击杀敌人、赚取经济来得到优势,胜利条件是摧毁敌方的水晶基地。

看似简单的规则,对于AI来讲是巨大的挑战——AI要在不完全信息、高度复杂度的情况作出复杂快速的决策。在庞大且信息不完备的地图上,10位参与者要在策略规划、英雄选择、技能应用、路径探索及团队协作上面临大量、不间断、即时的选择,这带来了极为复杂的局面,预计有高达10的20000次方种操作可能性,而整个宇宙原子总数也只是10的80次方。

要实现胜利目标,需要考查AI的多项能力:智能体解决方案、特征、动作空间、模型结构设计、强化学习算法设计、奖励函数设计、训练方式探索等。

正如AI业界普遍认为的,下一个 AI 里程碑可能会在复杂策略游戏中诞生。能够适用于这种游戏的AI,将更可能在多变、复杂的真实环境中,学会像人一样实时感知、分析、理解、推理、决策到行动。世界顶级科技公司均在推进此类研究,如Google Deepmind(星际争霸2)、Facebook(星际争霸2) 及 Open AI(Dota 2)等。

国内各大高校的学者们也在这一领域做出了相关研究,并取得了一些成果。

Real Life. Real News

Help us tell more of the stories that matter

Become a founding member

北京大学教授李文新团队,曾发表相关论文研究初始手牌对“地主”或“农民”的获胜难度有何影响;另外,他们还提出了另一种新方法,可以评价一个斗地主 AI 的牌技好不好。

中国科学院自动化研究所兴军亮团队,为了达到让多个智能体学会合作的目的,提出了一种自我提升式强化学习框架。先让智能体通过模仿来学习,再通过自我互博来进阶进化,加上他们提出的一种新策略,可有效缓解一些多智能学习的常见问题。

上海交通大学教授温颖也曾提出一种新技术,让AI们的合作方式更多样化,从而不那么容易暴露自己的套路,让游戏变得更有挑战性。这种技术还可以用于训练自动驾驶汽车。

腾讯 AI Lab本身,也在智能体研究领域经验颇丰。2016年起,研发的围棋 AI “绝艺”(Fine Art),现担任中国国家围棋队训练专用 AI ;2017年,基于王者荣耀游戏测试环境启动MOBA策略协作型AI“绝悟”研发,2019年达到职业电竞水平;腾讯还在射击类顶级 AI 竞赛 VizDoom 夺冠,并在《星际争霸2》首先研发出击败内置 AI 的智能体。

学会打王者荣耀的AI,能否学会应对更多实际生活中的问题?未来的AI,又会拥有怎样的可能性?

Subscribe to the newsletter news

We hate SPAM and promise to keep your email address safe

Click to comment

Leave a Reply

Ваш адрес email не будет опубликован. Обязательные поля помечены *

Top Stories

To Top