简介:清华大学朱军等团队在Nature子刊发表研究,利用贝叶斯方法建模生物学习记忆系统,显著提升深度神经网络的持续学习能力,为智能系统适应动态开放环境提供新范式。
在开放、高动态和演化环境中的学习能力,一直以来都是生物智能的核心要素之一,这种能力使得人类以及大多数动物能够在“适者生存”的自然选择过程中占据优势。然而,传统机器学习范式却在这一方面存在明显的短板。它们往往是在静态和封闭的数据集上学习到一个模型,并假设其应用环境和之前训练数据的属性相同,因此难以适应动态开放环境的挑战。
为了克服这一难题,持续学习应运而生。它模拟生物智能的学习过程和学习能力,旨在发展新型的机器学习理论和方法,通过持续学习的过程,提升智能体对开放、高动态环境的适应能力。但遗憾的是,目前主流的机器学习模型在调整网络参数进行学习时,一旦学习任务的数据分布发生变化,先前学到的网络参数就可能被覆盖,导致对先前知识的灾难性遗忘(catastrophic forgetting)。这一问题,也成为了人工智能尤其是深度学习发展的重要瓶颈。
近年来,大多数持续学习方法都专注于提高对所学知识的记忆稳定性,以克服灾难性遗忘。例如,在学习新任务时固定执行旧任务的网络参数。但这些方法通常只能在特定场景中发挥作用,难以像生物智能那样对现实世界的复杂环境和任务具有普遍的适应能力。因此,如何借鉴生物脑的持续学习机理,发展新型的持续学习方法,一直是人工智能领域普遍关注的问题。
针对这一问题,清华大学计算机系朱军教授TSAIL课题组联合生命学院钟毅教授课题组,在自然机器智能(Nature Machine Intelligence)期刊上发表了题为《融入神经启发适应性的人工智能方法》(Incorporating neuro-inspired adaptability for continual learning in artificial intelligence)的研究论文,并被选作封面文章。该研究利用贝叶斯方法深入分析并建模了生物学习记忆系统的适应性机制,显著提升了深度神经网络的持续学习能力,为智能系统在动态开放环境的自适应发展提供了跨学科的深刻见解。
研究指出,从理论层面来看,持续学习的优化目标可以被进一步细化为记忆稳定性、学习可塑性、泛化兼容性等核心要素。为了适应不断变化的环境和任务,智能系统需要在记忆旧知识和学习新知识之间取得适当的平衡,并具备充分的泛化能力以容纳数据分布之间的差异。而作为天然的模板,人类以及大多数动物天生就是以一种持续不断的方式进行学习的,即使是果蝇等简单的生命体,也进化出了多种适应性机制,以实现有效的持续学习。
在果蝇的学习记忆系统中,动态变化的感觉信息可以在多个并行的持续学习模块中被有选择地保护和遗忘,这为人工智能提供了重要的启示。基于此,研究人员提出了一种生物启发的记忆调控方法,对所学知识进行有选择地保护和遗忘。在学习新任务时,该方法通过优化参数分布中的旧任务信息来促进记忆稳定性,并引入一定程度的遗忘率以促进学习可塑性。
进一步地,研究人员推导出一种突触扩张-再归一化的优化算法,使神经网络能够在新旧任务的最优解之间做出明确的权衡,并依此分析了遗忘率在降低持续学习的泛化误差方面的作用,从功能目标和实现机制两个层面与生物智能相呼应。同时,研究人员还构建了一种类似果蝇学习记忆系统的并行多模块结构,对应于多个持续学习专家。通过在每个模块中实施所提出的记忆调控机制,对记忆进行有选择地保护和遗忘,从而使各个模块都能分化出适当的任务专长,充分适应不同任务的数据分布差异。
此外,研究人员还深入探讨了神经网络的随机性因素与学习规则和遗忘率的相互作用,证明神经系统的适应性机制并非孤立运作,而是高度协同的。在多种持续学习基准中,包括视觉任务和强化任务等,所提出的适应性机制均能够显著提高深度神经网络的持续学习能力。
该研究的成功,不仅为我们理解生物智能的持续学习机理提供了新的视角,同时也为发展新型的持续学习方法、推动人工智能和生物智能的协同发展提供了新的范式。随着研究的深入,我们有理由相信,未来的智能系统将能够更好地适应动态开放的环境,实现更加智能、高效的学习和发展。
值得一提的是,朱军教授作为该领域的领军人物,长期致力于机器学习和人工智能领域的研究,其领导的TSAIL研究小组在机器学习理论、算法及其在科学、工程和计算领域的应用方面取得了诸多重要成果。此次研究成果的发表,再次证明了朱军教授及其团队在持续学习领域的深厚积累和卓越贡献。
在实际应用中,该研究成果可以广泛应用于计算机视觉、自然语言处理、自动驾驶、智能机器人等领域,为这些领域的发展提供新的技术支撑和解决方案。例如,在自动驾驶领域,智能系统需要不断学习和适应各种复杂的道路环境和交通状况,以确保行驶的安全和稳定。借助该研究成果,智能系统可以更加高效地学习和记忆各种路况信息,提高驾驶的智能化水平和安全性。
此外,在曦灵数字人等领域,该研究成果也有着广泛的应用前景。曦灵数字人作为一种新型的人工智能技术,可以实现与人类的自然交互和智能对话。借助该研究成果,曦灵数字人可以更加智能地学习和理解人类的语言和行为习惯,提高交互的智能化水平和用户体验。
综上所述,清华大学朱军等团队的研究成果为我们理解生物智能的持续学习机理、发展新型的持续学习方法提供了新的视角和范式。随着研究的深入和应用的拓展,我们有理由相信,未来的智能系统将能够更加智能、高效地学习和发展,为人类社会的进步和发展做出更大的贡献。