网站管理学校官网返回学院首页
科研动态

我室在国际通信权威期刊《IEEE Wireless Communications》上发表最新研究成果

供稿:周福辉 |编辑发布:曾浩威 | 发表日期:2021-07-06 | 点击数: 246

近日,我室研究成果“A Unified Cognitive Learning Framework for Adapting to Dynamic Environment and Tasks”被通信领域国际顶级期刊《IEEE Wireless Communications》(2021年影响因子11.979JCR一区)接收,将于近期刊登。

无线频谱资源是国家战略稀缺资源,电磁频谱空间已成为第六维作战空间。利用机器学习实现频谱智能管控是频谱资源高效利用和电磁致胜的核心途径。尽管该领域已有相关研究,但只是在静态频谱环境和大量频谱数据标签等理想条件下简单应用现有机器学习方法,未从无线频谱特性出发探索无线频谱信号处理与机器学习的交叉点,无法应用于实际动态复杂的电磁频谱环境。为此,美国国防高级研究计划局专门设立了研究无线电频谱机器学习系统项目。

本工作剖析了机器学习方法应用于电磁频谱空间面临的挑战,即电磁频谱环境任务呈现高度动态和突发性、频谱领域知识难以迁移和利用、数据总量多但标记样本数量少且质量无法保证、频谱决策需要极强的实时性。随后指出现有机器学习应用于电磁频谱空间的局限性:依赖稳定的环境和任务,无法适应动态变化;依赖人工选择算法和超参数,缺乏知识的积累和结果的可解释性;依赖大量的高质量标注数据,缺乏对错误标记数据和知识的鲁棒性。因此,亟需突破新的学习框架以很好地适用于电磁频谱环境。

受人类大脑学习机制启发,本文提出了一种基于大脑机理的认知学习框架(如图1)。整个过程分为在线过程和离线自学习过程,在线过程对应脑认知机制中的执行控制过程,离线自学习过程对应脑认知机制中的内省过程。包含四大核心模块,其中,认知特征提取模块对应大脑中的感知皮层,负责提取环境和任务特征;认知控制模块对应大脑中的前额叶皮层,负责选择合适算法与超参,以适应环境和任务的动态变化;记忆模块对应大脑皮层中的记忆中枢,负责存储和更新认知案例、算法和超参数;认知评估模块对应大脑中的前扣带回皮层,负责评估当前结果优劣,实现自学习,以及评估历史认知案例结果优劣,实现良币驱逐劣币



(a)                                                                                 (b)


(c)

1.(a)大脑认知机理;(b)认知学习框架;(c)认知学习框架数学架构


文中还提出并证明了关于认知学习的两大定理:动态匹配定理和最优匹配定理(如图2)。动态匹配定理阐明,若可供选择的算法和超参数空间是有限的,则对于任意环境和任务,总能匹配一组最合适的算法和超参数;不同的环境与任务对应不同的最佳算法和超参。最优匹配定理阐明,当用于选择算法和超参数的知识增加,则待搜索的算法和超参数的空间减小,即增加了选择到最优的算法和超参数的概率增大。


2.(a)动态匹配定理1(b) 动态匹配定理2(c)最优匹配定理


将该框架应用于调制识别的仿真结果(如图3)表明,与现有方法相比,该学习框架具有适应环境和任务动态变化的能力、自学习能力、良币驱逐劣币能力,在算法、超参数选择准确率以及识别准确率方面都优于现有方法。目前,该学习框架也已应用于干扰识别、图像识别,且在本实验室频谱智能管控验证平台得到实际应用。


图3(a)  认知学习适应动态变化环境和任务的能力对比                    (b) 认知学习自学习能力、良币驱逐劣币能力对比


该成果标志着我室在频谱认知智能方向又迈出了坚实的一步。未来,我室将继续聚焦力量,研究适应复杂动态环境的认知强化学习、认知强化学习赋能的频谱智能管控、认知强化学习赋能的大规模无人机智能组网等方向,力争在认知智能领域取得更进一步的突破。

 

文章信息:Qihui Wu, Tianchen Ruan, Fuhui Zhou, Yang Huang, Fan Xu, Shijin Zhao, Ya Liu, Xuyang Huang. A Unified Cognitive Learning Framework for Adapting to Dynamic Environment and Tasks.  Accepted to IEEE Wireless Communications.

文章链接:https://arxiv.org/pdf/2106.00501.pdf