启东双杰防爆电器有限公司

防爆电器产品:防爆正压柜,防爆控制箱,防爆灯具,防爆开关,防腐操作柱

0513-83320018
新闻动态

Minecraft钻石挑战让AI创作者陷入困境

发布时间:2019/12/13
  对于大多数新的Minecraft玩家来说,花几分钟的时间才能弄清楚如何挖掘出游戏中至关重要的钻石,但是事实证明,培训人工智能技术来完成这项工作比预期的要困难。
  整个夏天,Minecraft的发行商Microsoft和其他组织向编码人员提出挑战,要求他们创建可以找到令人垂涎的宝石的AI代理。
  大多数人可以在第一次练习中破解它。
  但是在提交的660多个条目中。没有人能胜任这项任务。
  MineRL(明显是矿物)竞赛的结果将于周六在加拿大温哥华的NeurIPS AI会议上正式宣布。
  目的是查看是否可以在不需要大量计算能力的情况下解决该问题。
  尽管缺少获胜者,一位组织者表示,她仍然对一些参与者“印象深刻”。
  微软研究院首席研究员卡特亚·霍夫曼说:“我们提出的任务非常艰巨。” “在Minecraft中查找钻石需要很多步骤-从砍伐树木到制作工具,再到探索洞穴并实际找到钻石。
  “虽然没有提交的代理完全解决了任务,但他们已经取得了很大的进步,并学会了制作此过程中所需的许多工具。”
  自2011年发布以来,《我的世界》就已经大受欢迎。
  这款开放世界游戏的销量已超过1.8亿套,月活跃玩家超过1.12亿。
  钻石是Minecraft中最重要的资源之一,因为它可以用来制造强大的装甲和强大的武器。
  然而,为了获得宝石,玩家必须首先完成许多其他步骤。
  Minecraft玩家朱尔斯·波特利(Jules Portelly)告诉英国广播公司:“如果您熟悉这款游戏,则不需要花费超过20分钟即可获得第一枚钻石。”
  参赛者只能使用一个图形处理单元(GPU)和四天的培训时间。就上下文而言,人工智能系统通常需要数月或数年的游戏时间才能掌握《星际争霸2》之类的游戏。
  参赛者还可以使用一个相对较小的Minecraft数据集,其中包含6000万帧已记录的人类玩家数据,以训练他们的系统。
  霍夫曼博士解释说:“每集开始时,它们都是在程序生成的Minecraft世界中产生的。”
  “因此,他们确实需要学习寻找资源,制造工具和寻找钻石的概念。”
  组织者希望编码人员通过称为“模仿学习”的技术来创建通过示例学习的程序。
  这涉及通过让AI代理模仿人类或其他软件解决任务的方式来尝试使AI代理采用最佳方法。
  它与仅依靠“强化学习”形成对比,在这种情况下,对坐席进行了有效的培训,可以通过反复试验的过程来找到最佳解决方案,而无需汲取以往的知识。
  研究人员发现,仅使用强化学习有时可以取得优异的结果。
  例如,DeepMind的AlphaGo Zero计划胜过了研究中心较早的一项工作,该计划使用强化学习和对人类游戏中标记数据的研究来学习棋盘游戏Go。
  但是这种“纯粹的”方法通常需要更多的计算能力,这对于大型组织或政府以外的研究人员而言过于昂贵。
  主要比赛的组织者,卡内基梅隆大学的博士生William Guss告诉BBC,比赛的重点是表明“在问题上投入大量计算并不一定是我们推动挑战的正确方法。作为领域的艺术”。
  他补充说:“它直接阻止了对这些强化学习系统的民主化访问,而使在复杂环境中培训代理的能力交给了拥有大量计算能力的公司。”
  但是结果可能有助于强调这些资金雄厚的实体所具有的优势。沙特阿拉伯石油袭击:联合国“无法确认伊朗参与”