当前位置: 首 页 > 学术聚焦 > 正文

我校计算机科学与技术学院教师在多智能体强化学习领域研究取得进展

来源:计算机科学与技术学院 丁世飞   编辑:李居铭    审核:刘尧    发布时间:2024-04-25浏览数:

基于图信息瓶颈的多智能体通信学习框架

近日,我校计算机科学与技术学院丁世飞教授团队在多智能体强化学习领域研究中取得进展,研究成果以“Robust Multi-agent Communication with Graph Information Bottleneck Optimization”为题发表在人工智能国际顶级期刊《IEEE Transactions on Pattern Analysis and Machine Intelligence》(IEEE TPAMI, IF:23.6)。论文的第一作者为丁世飞教授,第二作者为博士生杜威,其他合作作者为新加坡南洋理工大学安波教授等。

近年来关于多智能体强化学习的研究表明,引入通信学习机制可以显著提高多智能体的动作协调能力。同时,图神经网络为多智能体通信学习提供了一种很有前景的范式。为此,该文对这一问题进行了深入研究,引入了一种基于图信息瓶颈优化的鲁棒通信学习机制,以此实现通信学习的鲁棒性和有效性。该文引入了两个信息正则化器来学习多智能体通信的最小充分信息表示,其目标是最大化信息表示和动作选择之间的互信息,同时最小化智能体特征和信息表示之间的互信息。多种实验平台上的大量实验结果验证了该文所提出方法的有效性和鲁棒性。上述研究工作得到了国家自然科学基金(No.61976216, No. 62276265, No.61672522)的资助。

IEEE TPAMI是国际公认的人工智能、模式识别、图像处理和计算机视觉领域顶级国际期刊,也是中国计算机学会(CCF)认定的CCF A类期刊,在计算机科学与人工智能领域具有权威影响力。近年来,丁世飞教授带领的中国矿业大学-中国科学院智能信息处理联合实验室(Joint Lab of Intelligent Information Processing, CUMT-CAS)致力于人工智能与模式识别领域的研究,在IEEE TPAMI、IEEE TNNLS、IEEE TCSVT、计算机学报、软件学报、计算机研究与发展等顶级期刊取得了一系列标志性高水平成果。

相关链接:https://www.computer.org/csdl/journal/tp/2024/05/10334015/1St7yVkfPTW