人工智能又一次战胜了人类世界冠军,这一次是在无人机竞速领域。
这一重磅成果由瑞士苏黎世大学工程师团队于刊登在《Nature》和《Science Robotics》杂志上。自2011年的第一场与AI的无人机比赛后,在Swift以前,还没有一款自主操控无人机能够击败人类飞行员。Swift战胜的是世界冠军级人类玩家,他们分别是:2019年无人机竞速联盟世界冠军Alex Vanover、两届MultiGP国际公开赛冠军Thomas Bitmatta和三届瑞士全国冠军Marvin Schaepper。
这也是继国际象棋、跳棋、围棋和星际争霸等虚拟领域之后,人工智能首次在物理挑战当中战胜人类。
这项比赛是由"第一人称视角"(FPV)无人机进行的,这些无人机配备了高分辨率摄像头。"雨燕"(Swift)无人机的开发团队在《Science Robotics》杂志上发表文章,详细介绍了这场历史性的胜利,该款无人机与三位无人机竞技选手进行激烈竞争,并在25项挑战中的15项中获胜。该项目负责人表示,"我们的成果标志着由AI驱动的机器人,首次在一项为人类设计并主导的真实体验赛事当中击败人类。”
"雨燕"(Swift)无人机成功秘诀在于其强大的人工神经网络,能够优化无人机的航线和速度。它通过机载摄像头实时收集环境细节,为无人机提供精确的引导,而人类飞行员则依赖传输到耳机的视频信号,体验"第一人称视角"。
在这场无人机比赛中,人类操纵者通过机载摄像机操纵无人机通过3D赛道。Swift系统的创新之处在于能够将无人机的状态映射到调整推力和旋转速率的命令。这项成果是移动机器人和机器智能领域的一个里程碑。
Swift技术介绍
Swift是一个仅使用机载传感器和计算完成自主控制的四旋翼飞行器,由两个关键模块组成:
其中,控制策略由一个前馈神经网络来表征,并使用无模型on-policy深度强化学习(RL)进行训练。
由于模拟与现实世界在传感和动力学方面存在差异,仅在模拟中优化策略会导致无人机的现实性能较差,因此研究团队利用物理系统收集的数据来估计非参数经验噪声模型(non-parametric empirical noise model)。
实验表明,这些经验噪声模型有助于将控制策略从模拟成功转移到现实。
具体来说,Swift 将机载传感器的读数映射成控制命令,这一映射包括两部分:
(1) 观察策略,将高维的视觉和惯性信息提炼成特定于任务的低维编码;
(2) 控制策略,将编码转换成无人机命令。
在Swift记录的10次失利中,40%是因为与对手相撞,40%是因为与竞赛门相撞,20%是因为比人类控制的无人机慢。总体而言,在与人类控制无人机进行的比赛中,Swift获胜次数最多,并且它还创造了最快的比赛纪录,比人类控制无人机(A. Vanover)的最佳时间快了半秒。
虽然从整体上看,Swift比所有人类控制无人机都要快,但它在赛道的每个赛段上的速度并不快。
研究团队仔细分析发现:在起飞时,Swift的反应时间较短,平均比人类飞行员早120毫秒起飞;Swift的加速也更快,进入第一个竞赛门时速度更高。在急转弯时,Swift的动作更加紧凑。
研究团队还提出一种假设,Swift在比人类操控者更长的时间尺度上优化轨迹。众所周知,无模型RL可以通过价值函数优化长期奖励(long-term reward)。相反,人类操控者规划运动的时间尺度较短,最多只能预测未来一个竞赛门。