网站管理学校官网返回学院首页
合作交流

认知决策机理与智能科学基础理论高端论坛系列报告-面向开放环境的连续情景化学习

供稿:周福辉 |编辑发布:何艺 | 发表日期:2022-04-11 | 点击数: 513

 202246日下午,天地一体频谱认知实验室组办的认知决策机理与智能科学基础理论高端论坛,邀请了中国科学院自动化所、模式识别国家重点实验室余山研究员为我们做了第二场基础研究的学术报告。该报告主题为“面向开放环境的连续情景化学习”,主要围绕如何利用神经活动重现来帮助我们更高效地学习机理进行深入详细讲解。我校副校长、实验室主任吴启晖教授携周福辉教授、黄洋副教授、董培浩副研究员、贾子晔副研究员以及相关课题组同学参与了交流。

 人类大脑是高环境适应性的典范。人不仅可以在新的环境中不断吸收新的知识,而且可以根据不同的环境灵活调整自己的行为。在此方面,深度神经网络(deep neural networks,DNN)与大脑相比存在着很大的差距。传统DNN一方面会受到“灾难性遗忘”问题的困扰,难以在学习新知识的同时保留旧知识,即缺少连续学习的能力;另一方面,DNN往往只能实现预先训练好的固定操作,不能对实际环境中存在情境信息做出灵活的响应,难以满足复杂多变的需求,即缺少情境依赖学习(contextual-dependent learning)的能力。这两方面能力的缺失是制约当前DNN发展出高水平智能的重要瓶颈。

 在报告中,针对上述的两方面挑战,余山研究员首先提出了解决连续学习困难的正交权重修改(orthogonal weights modification,OWM)算法。OWM算法主要实现了对网络中已有知识的有效保护,克服神经网络中的灾难性遗忘,并与现有梯度反传算法完全兼容,在连续学习测试任务,如手写体汉字识别中表现出了良好的性能。

 另一方面,对于DNN缺少情境依赖学习能力的问题,余山研究员对应的讲解了情境依赖处理(context-dependent processing,CDP)模块。CDP模块的提出主要受到大脑前额叶皮层启发,前额叶是大脑中负责认知控制的核心皮层。其同时接收感官输入和情境信号,并选择与当前任务最相关的感官信号指导输出响应。CDP模块可以有效整合情境信息,调制神经网络的信息处理过程。

 OWM算法与CDP块的有效结合,使人工神经网络具备了强大的连续学习和情境依赖学习的能力,提高了人工智能系统对于复杂多变环境的适应性。

 报告结束后,在座的师生同余山研究员就脑机理中的观察决策控制,神经网络结构的可解释性以及与知识库相结合等问题展开了热烈、深入的讨论,双方均获得了较大的收获。此次学术交流将促进双方今后的进一步合作,促进我室在认知决策、电磁特性等方向上应用类脑机理的研究工作。


余山,博士,中国科学院自动化所研究员,模式识别国家重点实验室副主任,北京市“智源学者”。2005年获中国科学技术大学生物学博士学位。致力于通过脑科学和智能技术的交叉融合,理解脑网络的结构与功能,提出脑启发的人工智能模型与算法,并开发新一代的高带宽闭环脑机接口。迄今在包括 Journal of Neuroscience,eLife等神经科学的重要期刊,以及 Nature Machine Intelligence,Neural Networks,CVPR,AAAI等人工智能领域的重要期刊和会议上发表文章30 余篇。2018年指导学生获得世界大学生类脑计算大赛特等奖。研究得到国家自然科学基金、科技部重点研发计划、中科院先导专项等支持。