Champion-level drone racing using deep reinforcement learning - Nature
摘要
第一人称视角 (FPV) 无人机竞速是一项电视转播的运动,专业选手驾驶高速飞机穿越 3D 赛道。每位飞行员通过无人机的视角通过机载摄像头传输的视频观察周围环境。要达到专业飞行员的自主无人 机水平是一项挑战,因为机器人需要在极限范围内飞行,同时仅通过机载传感器 [^1] 估计其在赛道上的速度和位置。这里我们介绍 Swift,这是一个可以与人类世界冠军水平的实体车辆竞赛的自主系统。该系统将模拟中的深度强化学习 (RL) 与现实世界中收集的数据相结合。Swift 在现实世界的正面交锋中与三位人类冠军展开竞争,其中包括两个国际联赛的世界冠军。Swift 赢得了与每位人类冠军的几场比赛,并创下了最快的比赛时间记录。这项工作代表了移动机器人和机器智能的一个里程碑 [^2] ,这可能会启发在其他物理系统中部署基于混合学习的解决方案。
主要的
深度强化学习 [^3] 推动了人工智能的一些最新进展。使用深度强化学习训练的策略在复杂的竞技游戏中表现优于人类,包括雅达利 4、5、6 、 围棋 5、7、8、9 、 国际 象棋 5、9 、 星际 争霸 [^10] 、 Dota 2 ( 参考 文献 [^11] ) 和 Gran Turismo 12、13 。这些令人印象深刻