《用于自主无人机探测、跟踪和拦截的新型无人机蜂群防御端到端系统》论文
北约科学技术组织发布了一篇名为《用于自主无人机探测、跟踪和拦截的新型无人机蜂群防御端到端系统》的论文。全文主要包括摘要、引言、模拟和真实环境中的系统部件、用例定义、无人机群人工智能代理之间的系统协调、模拟和真实飞行操作的结果、对推进安全措施的贡献和结论。
图:BlueSwarm系统的高级架构
摘要
随着无人机在各种应用中的使用持续增长,与无人机在禁飞区内未经批准的操作相关的安全挑战变得越来越关键。为了应对这些挑战,我们提出了一种新的自动和自主威胁管理方法,该方法可以探测无人机入侵并执行实时反制。所提出的系统名为BlueSwarm,它集成了传感器数据,实现了资源之间的数据通信,并利用人工智能来操作无人机群进行反制。这项工作在模拟和真实环境的实验中得到了验证,证实了其探测、跟踪和拦截能力。
所提出的反无人机系统集成了地面部分和空中部分。地面部分由一个地面控制站组成,由一名操作员操作,充当指挥和控制中心,旁边还有一台地面雷达和一台PTZ摄像机,用于远程探测、分类和定位来袭威胁。空中部分由五架无人机组成,每架无人机嵌入一个光电传感器和一个可部署网作为拦截有效载荷。这些无人机以集群的形式自主部署,拦截、跟踪、评估和压制入侵的无人机,同时保持操作员在环路中。每架无人机都由自己的人工智能代理操作,与其他无人机和操作员协同工作。该系统的设计具有可扩展性和适应性。地面传感器的数量、类型和空间分布可以根据需要和保护空间的配置进行调整。同样,防御无人机及其有效载荷的数量也可以调整。该系统依靠机器学习技术来探测、跟踪和定位入侵者,并适应不断演变的威胁。
我们与主题专家合作,研究、设计和实现了不同的用例,以在模拟和真实世界演示中测试我们的系统。这些用例涉及多达五架敌方无人机的入侵,这些无人机呈现出粗心、无知和犯罪的操作模式,在模拟中进化为独立的个体或群体,以及两架用于真实环境演示的敌方无人机。
每项任务分为四个不同的阶段,确保从探测到消除的过程精简高效:(1)基于地面传感器的潜在威胁探测、分类和定位;(2)部署防御性无人机群;(3)将每架无人机分配给单个目标;(4)结合地面和嵌入式传感器,追踪和消灭入侵的无人机。在执行任务期间,空域被划分为特定区域。首先,划定保护区,严格禁止任何未经授权的无人机活动。第二,缓冲区,任何入侵都会触发我们系统的反应,从而在到达保护区之前进行协调响应。
我们的研究通过提供全面、适应性强、可扩展的解决方案,借助相关技术和程序实现协作自主,有助于推进应对不断升级的无人机威胁的安全措施。通过将我们的新组件和现有系统相结合,我们旨在降低风险,保护禁飞区免受未经授权的无人机活动的影响。该研究是与主题专家合作开发的,有助于北约科技界反无人机技术的进步。
1.引言
在快速技术进步和广泛可及性的推动下,无人机现在成为一个重大的安全问题。打击未经授权的无人机行动的必要性比以往任何时候都更加突出。在本文中,我们提出了一种创新的端到端系统,该系统使用自主无人机的防御群来有效地拦截入侵的无人机群。
1.1无人机使用背景和安全挑战
一些学术和技术努力都致力于创建反无人机系统。在最近的一项工作中,已经确定了537款反无人机产品,而只有138款反无人机产品包括探测和拦截过程,且只有3个国家具备将网作为拦截手段并结合探测能力的能力。本综述中没有一种产品将无人机群作为拦截手段,作为从探测到拦截的端到端系统的一部分。此外,将人工智能算法应用到真实环境是最近才出现的,而且很少部署。
无人机滥用事件越来越多。手动反制或使用单一的拦截手段是无效的。操作多架无人机以增加成功拦截的机会可能会让操作员不堪重负。需要注意的是,管理多架无人机以对抗一架入侵的无人机并非易事,更不用说培训多名操作员的财务影响和运营成本本身了。反制一群无人机是一项更为复杂的行动,特别是由于无人机的协调方面的挑战。
1.2研究目标与BlueSwarm系统
这项研究旨在设计、开发、实施和评估一种名为BlueSwarm的创新反无人机系统,该系统可以利用一支协作的自主无人机群,对入侵的无人机群进行探测、跟踪和拦截,用于真实作战环境的应用。该系统主要用于在指定的“缓冲区”内探测潜在威胁,然后再到达“保护区”。系统唯一地识别和定位探测到的威胁。任何被归类为入侵者的被跟踪无人机都会触发防御蜂群的响应,以便进行跟踪。如果一个入侵者被探测到并被分配给防御蜂群的一个或多个人工智能代理进行跟踪,则会启动自主感知控制。然后,当防御群的定位符合拦截标准时,系统就会过渡到拦截阶段,从而进行安全拦截。
1.3BlueSwarm系统的描述和功能
在实际飞行操作之前,系统在模拟中进行测试。该系统在模拟演示和真实演示过程中集成了一台雷达、一台PTZ摄像机、五架无人机组成的防御群、多达五架入侵无人机、每个群一个地面控制站(GCS)、每个防御无人机上的嵌入式摄像机和一个模拟站。每架无人机和地面军事系统都通过自己的人工智能代理进行操作。对于真实环境的飞行演示,集成了额外的组件,以符合现行的安全和法律标准(例如手动无人机控制器或控制STOP操作系统)。现场操作员包括技术人员、安全飞行观察员、飞行员和地面控制站操作员。
2. 模拟和真实环境中的系统部件
2.1系统组件概述
BlueSwarm系统分为地面部分和空中部分,每个部分由各种硬件组件组成。BlueSwarm的效率很大程度上归功于这些精心编排的元素。一队入侵的无人机和一些模拟器刺激系统进行训练和测试。
2.1.1地面部分
地面段由地面控制站(GCS)、地面雷达和地面云台组成。
地面控制站(GCS)充当通信中心。它不仅是系统的人机界面,而且还处理无人机部署、总体任务信息和系统响应的协调。地面军事系统具有基于地理信息系统的用户界面,使操作员能够与系统交互,监控正在进行的任务,做出明智的决策,并控制所需的系统响应。
远程雷达构成了该系统的第一道防线。它是早期探测和分类远距离来袭威胁的关键部件,从而提供充足的响应时间。为了这个项目,我们使用了一种雷达传感器,可以在1000米的高空探测无人机。
与地面雷达一起,PTZ摄像机提供互补的视觉信息,以提高远程探测和分类的质量。它有助于验证基于雷达轨迹的分类,并由于其更好的分辨率而有助于提高入侵无人机数量的确定。
2.1.2空中部分
空中部分由一队无人机组成。每架防御无人机都配备了一个电光传感器和一个可部署网(在本项目框架内模拟),作为对抗入侵无人机的主要对策。在具有先进决策和信息处理算法的人工智能代理的指导下,这些无人机协同工作,拦截和消除潜在威胁。它们与防御的地面控制站通信,以传递捕获的信息。
图:ARA Robotics®制造的无人机着陆(左)和运行期间(右)。
每架防御无人机都嵌入了一个安装在万向节上的光电传感器。该传感器为整个系统提供了“空中之眼”功能。除了雷达和地面云台外,该组件对目标跟踪和分类至关重要。嵌入式传感器由其所嵌入平台的人工智能代理控制缩放和定向。
2.1.3入侵的无人机
入侵的无人机的行为被设计成代表破坏性的无人机活动。他们执行不同模式的粗心、无知或犯罪操作。与防御无人机一样,每架入侵的无人机都由自己的人工智能代理控制,并与入侵的地面控制站通信。在我们的现场实验中,防御和入侵无人机由ARA Robotics®提供,型号相同。
2.1.4模拟器
我们使用三种不同的3D模拟器对系统进行了训练和测试,逼真度和复杂性逐渐提高。
第一个模拟器是多粒子环境。这是最快也是最简单的。它将人工智能代理绘制为简单的粒子,除了速度限制、粒子边界和动量之外,不考虑任何物理约束。由于其速度,这种多粒子环境用于训练初始机器学习模型。
第二个模拟器是法国泰雷兹集团专有的,被称为SE Star,它更接近于蜂群在现实世界中执行任务时可能面临的一般条件。该模拟器使用了飞行平台的通用物理动力学模型。它用于测试目的和微调之前使用第一模拟器学习的机器学习模型。
图:SE Star模拟了地面传感器、无人机及其有效载荷。
最后一个模拟器嵌入SkyControl®,ARA Robotics®的GCS软件中。该模拟器包括用于真实世界演示的实际四旋翼机的真实动力学。它用于降低真实飞行过程中潜在冲突的风险。SkyControl®使我们能够在实际部署之前对系统进行高质量的测试和验证。
图:SkyControl®模拟和真实世界飞行试验的用户界面。
2.2任务阶段的组成
2.2.1探测、分类、定位和威胁级别评估
地面雷达作为预警传感器,在远程探测、分类和定位潜在的来袭威胁。在我们项目的框架内,为了进行真实世界的演示,我们使用的雷达传感器的探测范围高达1000米。地面云台摄像机是第二个投入使用的传感器。其目的是通过计算机视觉帮助确认传入威胁的性质和数量。地面军事系统人工智能代理根据雷达数据控制传感器的平移、倾斜和缩放。
地面军事系统人工智能代理还通过信息处理来评估检测到的物体的威胁程度,分配敌人、友军或中立军等标签。威胁评估过程考虑了入侵物体的大小、速度、飞行模式和雷达横截面等多个方面。这一探测、分类、定位和威胁级别评估过程不仅是部署防御群的第一步,而且是整个任务的连续步骤。
2.2.2防御群的部署和方法
一旦探测到“敌人”(即带有指定敌人标签的实体),系统就会自主部署防御无人机,其目标是接近、跟踪和消除威胁。这些无人机成群地向已识别的威胁移动,每架无人机都由自己的人工智能代理独立控制,不断适应其所处的任务阶段。每个人工智能代理控制四个相互依存的决策功能。首先,导航功能,允许人工智能代理控制其无人机的轨迹。第二,传感功能,将嵌入式光电传感器的平移、倾斜和缩放控制交给人工智能代理。第三,拦截功能,让人工智能代理决定何时触发其拦截有效载荷(网)。最后,目标定位功能,用于人工智能代理为自己分配一个目标无人机。这些功能的实现要归功于人工智能代理精心安排的决策算法。
更具体地说,每个人工智能代理可以根据任务阶段在不同的导航功能决策算法之间切换。为了增强群体之间的协作行为,通过多智能体深度强化学习算法学习用于接近和跟踪阶段的导航策略,以使这些阶段快速、协调和适应性强。然而,在拦截过程中的导航必须是可控的、精确的和可解释的,因此在我们的系统中优选基于规则的算法。
对于目标定位功能,所使用的算法确保了无人机之间目标的最佳分配,减少了由于潜在冲突或任务重复而造成的效率损失。例如,该算法通过减少与可用目标的协作距离来计算最佳分配,确保并在必要时进行校正,以使缓冲区内没有目标不被防御群的无人机跟踪。只有当入侵者的数量高于防御群的无人机数量时,才能打破这一规则。
2.2.3跟踪
一旦防御无人机到达敌方无人机,它们就进入跟踪阶段。根据敌方无人机的数量,可以为每架敌方无人机分配一架或多架防御无人机。跟踪依赖于雷达和视觉数据的组合以及蜂群之间的共享信息。只要无人机没有进入拦截阶段,或者只要目标没有离开缓冲区或被拦截,防御无人机就应跟踪其指定目标。
2.2.4拦截
每一次任务的高潮都是消灭入侵的无人机。一旦防御无人机跟踪目标,它就可以根据考虑到目标接近度、防御群中其他实体的位置和网可用性等因素的标准自愿进行拦截。然后,当入侵的无人机被批准与目标交战时,该无人机部署其基于网的有效载荷,将其捕获。虽然在本文的调查中,无人机与目标的交战是自动的,但它被设计为由操作员触发。
图:网部署和目标捕获模拟。左图,无人机与目标交战,并在满足拦截条件后部署了网。右图为无人机捕获目标。在这两幅图上,我们可以观察到右侧的无人机是如何在安全距离内支持视觉跟踪。
虽然网部署在实际飞行操作中被证明是成功的,但对于我们的实验,我们只在模拟环境中部署网。由于相关的运营成本,尚未使用实际净值。在现实世界的实验中,遥测数据被输入模拟器,以虚拟地捕捉无人机。
3.用例定义
适应性和多功能性是我们系统的核心属性,使其能够有效地处理无人机入侵的不同场景和行为。我们定义了几个代表典型入侵无人机行为的用例来测试我们的系统。
我们推导出了四种不同的无人机操作员行为模型,与这些应用程序相匹配。
1)无线索操作员:这个用例代表了测试无人机的爱好者,他们不知道附近有他们可能无意中飞越的禁飞区。由此产生的无人机行为相当不稳定,速度、航向和高度都有很大变化。
2)粗心的操作员:在这种用例中,无人机操作员愿意忽略已知的受限空域,以利用尽可能短的路线,例如用于交付等商业目的。由此产生的无人机行为在速度、航向和高度上是相当恒定的。
3)无意伤害的罪犯:本用例代表运营商旨在以获取信息为目的,未经授权访问受限区域,但无意造成直接伤害。他们可能会将拍摄照片或视频作为企业间谍活动、犯罪活动的一部分,或者仅仅作为狗仔队或被误导的粉丝。由此产生的无人机行为在航向上相当稳定,瞄准保护区,接近的高度降低,到达保护区的速度增加。无人机不一定会进入保护区,可能会绕过它,不时空转拍照。
4)有意伤害的罪犯:在这种最紧急的使用情况下,操作员故意闯入保护区,目的是造成直接伤害,例如涉及装有爆炸有效载荷的无人机的恐怖袭击。由此产生的无人机行为在航向上相当稳定,瞄准保护区,接近的高度降低,速度在最后一段加速,以有效穿透保护区。
图:我们将4种无人机行为作为基线来构建我们的用例,其中包括(a)无知的操作员,(b)粗心的操作员,以及(c)无意伤害的罪犯和(d)有意伤害的罪犯。
随后,我们通过确定入侵无人机的数量(范围在1架到5架之间)并选择每个入侵无人机行为模型来设计我们的用例。
4.群体智能代理之间的系统协调
每架无人机的人工智能代理并没有直接嵌入其无人机上。它们在地面上执行,在同时托管GCS和GCS人工智能代理的工作站中执行。这一限制是根据项目的目标做出的重点选择,即开发人工智能代理,而不是关注其嵌入能力。然而,从架构的角度来看,尽管通信存在延迟,但该系统的运行方式就像无人机的人工智能代理嵌入在自己的平台上一样。
人工智能代理及其群集行为的协作是通过两种方式实现的。
首先,人工智能代理都在相互交流,交换与他们对所面临情况的感知有关的信息。人工智能代理对当前情况的感知是通过处理其平台传感器捕获的数据(无人机人工智能代理的嵌入式万向节安装光电或地面雷达和地面军事系统人工智能智能代理的地面云台)以及通过融合所产生的信息和其他人工智能代理共享的信息来阐述的。通过这个过程,我们确保所有人工智能代理对全球形势有相同的感知。
其次,我们的人工智能代理嵌入了多代理强化学习(MARL)算法,以学习如何作为一个团队执行一些特定的决策功能(例如,导航或目标定位)。每个人工智能代理学习的策略本质上嵌入了协作模型,从而在系统级别实现群集行为,因为它们被训练为一起执行相关功能。
我们的系统在蜂群无人机、传感器和地面军事系统之间的互联通信,允许对任何无人机威胁做出无缝和协调的反应,从而维护和保护禁飞区。
5.模拟和真实飞行操作的结果
5.1模拟结果
在SE Star提供的模拟环境中,我们执行了四个不同的用例。我们的反无人机系统显示了从监控到捕获五个入侵者的不同阶段。
1)监测和探测:最初,在武装和起飞后,系统处于空闲状态,等待入侵。直到雷达探测到未知无人机的出现才触发行动。
2)入侵:进入缓冲区后,不明身份的无人机被识别为威胁,导致我们的系统做出反应。防御无人机启动了对入侵者的拦截路径,如果多个入侵者在缓冲区内,防御无人机将分裂成单独的目标。
3)系统交战:如果满足确认防御无人机和目标之间最短距离的条件,以及拦截有效载荷(网)的可用性,系统将过渡到“准备拦截模式”,等待进一步批准。此过程可防止任何冗余的捕获尝试。该批准旨在由未来开发的人工操作员触发。在我们的试验中,由于审批接口机制尚未实施,在代表运营商响应时间的任意延迟后批准。
4)捕获和释放:一旦获得批准,无人机就会部署网进行捕获,然后将捕获的无人机运送到回收区。
在所有使用案例中,入侵群的所有无人机在到达保护区之前都被成功拦截、跟踪和捕获。
5.2混合环境中的真实飞行操作
真实世界的实验是在混合环境中进行的,除了模拟的拦截有效载荷外,BlueSwarm系统和红色资产的所有硬件组件都是带电的。为了能够执行完整的任务,该系统将所有真实无人机的行为镜像到SE Star,直到进入拦截阶段。一旦进入拦截阶段,参与该阶段的真实无人机与其模拟无人机之间的行为就会发生差异,以便在模拟世界中进行拦截,同时保持真实世界中的安全条件,以消除实际捕获过程中的任何碰撞风险。
1)监测和探测:在武装和起飞后,该系统有效地将环境噪声分类为无威胁,使无人机保持闲置状态。
2)入侵和识别:与模拟一样,系统在无人机进入缓冲区时对其进行识别和分类。
3)系统参与:在这一阶段,我们的系统表现与模拟实验期间相似,唯一的区别是将真实世界的扰动(噪声)识别为中性实体(如鸟类),以允许我们的人工智能代理将其考虑在内,避免碰撞。
4)捕获进展:在现实世界的作战中,部署网是一种仅在模拟中进行的虚拟行动。因此,在反映实际情况的模拟环境中评估捕获的成功与否。捕获后,被捕获的红色无人机的行为不再反映在现实世界中。模拟捕获的红色无人机被捕获它的模拟蓝色无人机拖进检索区域。然而,真正的红色无人机只是通过将高度降低到缓冲区以下而退出游戏,并一直被系统忽视,直到场景结束。真正捕获的蓝色无人机向检索区域移动,模仿拖动捕获的红色无人机并在该区域释放的事实。它的模拟计数器部分反映了这种行为。
该系统的这些调整使我们能够成功测试各种场景,包括在两架防御无人机对抗两架入侵者的比赛中对捕获目标的探测、定位、分类、跟踪、拦截和安全检索。
6.对推进安全措施的贡献
我们的研究设计成功地展示了应对不断升级的无人机威胁的能力,正如我们的理论和实践执行所证明的那样。值得注意的是,我们的系统旨在应对防御群无人机面临的同等数量的威胁。尽管如此,我们必须强调的是,该系统目前仅针对小型蜂群进行了验证。这在我们的模拟实验和实际飞行试验中得到了证实,五架无人机在模拟中成功跟踪了同等数量的敌方无人机,实现了对所有渗透部队的安全拦截。在实际飞行操作中,我们的两架无人机小型防御群应对了两架敌方无人机,这证实了我们的系统在不同条件下的适应性和可扩展性,以及它在未来版本的真实世界场景中的应用前景。还需要注意的是,我们的系统不知道它正在使用的硬件设备。无人机的制造和型号、传感器类型或中和有效载荷类型都可以很容易地被不同的传感器替换或更改。
7.结论
我们设计的系统展示了地面和空中部分的集成,包括一系列传感器和对抗能力。通过使用地面雷达和云台摄像机,该系统能够对潜在威胁进行远程探测、分类和定位。同时,空中部分包含一支自主对抗无人机队伍,每架无人机都配备了一个光电传感器和一个用于拦截目的的网部署机制。
通过同步传感器数据、促进资源之间的通信以及利用人工智能,反无人机系统提供了从探测到消除入侵无人机的端到端解决方案。优先考虑通过有人值守的地面控制站维持人工监督,从而使人工操作员处于监控循环中,并在出于安全原因有必要时提供停止机制。停止机制由一个“全部停止”按钮组成,该按钮在从人工智能代理到无人机的任务期间中断命令。停止按钮冻结所有无人机的移动,无论是防御还是入侵,并将控制权交还给人类飞行员来管理局势。
该系统的架构为响应特定后勤和保护区的威胁状况提供了重要的可扩展性和适应性。地面传感器的类型、数量和空间分布可以根据用户需求进行定制,防御无人机的数量和有效载荷也是如此。
一个潜在的进步可能是结合了先进的视觉和自动威胁级别评估能力。这将使运营商全面了解迫在眉睫的威胁,降低主观错误的风险,同时加快响应时间。
我们的系统因其对不断演变的威胁的抵御能力、对需求的适应性以及前沿人工智能技术的集成而得到加强,解决了无人机安全方面的一个关键缺口。通过完善该系统并将其纳入现有基础设施,我们的目标是保护禁飞区,同时降低无法管理的无人机技术的相关风险。
根据北约加强无人机威胁安全措施的愿景,这项与主题专家合作进行的研究和系统开发标志着在实际飞行行动中对抗无人机技术的重大进步。所设想的未来改进和应用有望为北约科技界的技术转让和进一步研究提供新的动力。