科学家可以在一台计算机上解决最先进的AI问题

cslehe · 发表于 2021-4-11 07:03:28

#111723#练习进步的人工智能体系所需的宏大盘算资本象征着，教训丰盛的科技公司将学术团队置于灰尘中。然而一种新方式能够辅助均衡范围，使迷信家能够在一台盘算机上处理最早进的AI成绩。
OpenAI 2018年的一份讲演发明，用于练习最强盛的人工智能的处置才能正以惊人的速率增加，每3.4个月翻一番。最须要数据的方式之一是深度强化进修，此中AI通过遍历数百万次仿真来通过重复实验来进修。电子游戏如《星际争霸》和《Dota2》的最新停顿都依附于装无数百个CPU和GPU的效劳器。

诸如Cerebras System的Wafer Scale Engine之类的公用硬件无望用完善优化用于练习AI的单个大型芯片来代替这些机架势处置器。然而，因为价钱高达数百万美元，对于资金缺乏的研讨职员来讲，这并不是甚么抚慰。
当初，来自南加州大学和英特尔试验室的一个团队曾经发现了一种在学术试验室中常用的硬件上练习深度强化进修（reinforcement learning，RL）算法的方式。在克日举办的2020国际呆板进修大会（International Conference on Machine Learning，ICML）上宣布的一篇论文中，他们描写了怎样可能应用一个高端任务站来练习人工智能，在第一人称射击游戏Doom上具有最早进的表示。他们还应用一小部份畸形盘算才能来处理DeepMind提出的30种多样化3D挑衅套件。
德州大学奥斯汀分校（University of Texas at Austin）专门研讨深度RL的教学Peter Stone说：“发现对商品硬件停止深度RL的方式是一个了不起的研讨目的。而且，除了将较小的研讨小组抛在死后以外，停止此类研讨平日所需的盘算资本也会发生大批的碳脚印。”
USC研讨生的重要作者Aleksei Petrenko说，该名目的灵感来自于必需成为发现之母的经典案例。跟着在英特尔的暑期练习期停止，Petrenko得到了进入该公司的超等盘算集群的权限，这使尚未实现的深度RL名目堕入伤害当中。因而，他和共事决议找到一种方式来持续停止简略体系的任务。
应用一台装备36核CPU和一个GPU的呆板，研讨职员可能在接收Atari视频游戏和Doom练习时每秒处置大概14万帧图象，或许是次优方式的两倍。
Using a single machine equipped with a 36-core CPU and one GPU, the researchers were able to process roughly 140,000 frames per second while training on Atari videogames and Doom, or double the next best approach.
“依据我的教训，良多研讨职员没法打仗到尖真个、花梢的硬件，”Petrenko说。“咱们认识到，只有从新斟酌怎样最大限制地进步硬件应用率，现实上便可以濒临平日从大型集群中挤出的机能，即便是在单个任务站上。”
深度RL的重要方式是将AI代办置于一个摹拟情况中，该情况为实现特定目的供给嘉奖，agent将此作为反应来制订最好战略。这触及三个重要的盘算任务：摹拟情况和代办；依据进修到的规矩（称为战略）决议下一步要做甚么；以及应用这些操纵的成果来更新战略。
Petrenko说，培训老是遭到最慢流程的限度，但这三个任务平日在尺度的深档次RL方式中交错在一同，因而很难独自优化它们。研讨职员的新方式被称为“样本工场（Sample Factory）”，将它们离开，如许便可以投入资本让它们都以峰值速率运转。
Petrenko说明说，过程之间的管道数据是另一个重要瓶颈，由于这些数据平日会散布在多台呆板上。他的团队应用在一台呆板上任务的上风，只要将全部数据塞进同享内存中，全部过程都能够即时拜访这些数据。
与当先的深度RL方式比拟，这构成了明显的减速。应用一台装备36核CPU和一个GPU的呆板，研讨职员可能在接收Atari视频游戏和Doom练习时每秒处置大概14万帧图象，或许是次优方式的两倍。在三维练习情况DeepMind试验室中，他们每秒的帧数为40000帧，比第二名超过15%。
为了检讨帧速度是怎样转化为练习时光的，研讨小组将样本工场（Sample Factory）与谷歌大脑（Google Brain）在3月份开源的一种算法停止了比拟，该算法旨在明显进步深度RL的效力。研讨小组还在DeepMind试验室用一台功效更强盛的36核4-GPU呆板，对30个挑衅停止了测试。由此发生的人工智能的机能显明优于DeepMind用来应答挑衅的原始人工智能，后者是在大型盘算集群上练习的。
固然论文中应用的盘算机依然是为人工智能研讨而计划的高端任务站，但Petrenko说，他和他的配合者也始终在更简略的装备上应用样品工场。他说，他乃至能够在他的中档游戏条记本电脑长进行一些高等的深度RL试验。“这是前所未闻的。”
更多内容阅读推荐：美的冰箱低鸣声怎么回事

账号		自动登录	找回密码
密码			立即注册