近日,第34届人工智能国际联合会议(IJCAI2025)在加拿大蒙特利尔和中国广州同步举行。IJCAI是全球人工智能领域最具权威性和影响力的学术会议之一,也是中国计算机学会(CCF)推荐的A类国际学术会议。在本次大会上,学部3项研究成果获得录用发表,成果内容涵盖联邦语义分割技术、乳腺超声图像病灶分割、不平衡性标记分布学习等前沿方向。
成果一:FedSaaS: Class-Consistency Federated Semantic Segmentation via Global Prototype Supervision and Local Adversarial Harmonization
联邦语义分割技术通过跨客户端协作学习实现图像像素级分类任务。然而,实际应用中客户端数据的异构性往往导致显著的特征分布差异,特别是当同类对象呈现不同表征分布时,会严重削弱模型的泛化能力。
图1:类一致性联邦语义分割框架图
该论文提出了一种基于全局原型监督和局部对抗协调的类一致性联邦语义分割框架,以解决联邦学习客户端数据异构性导致的跨域泛化能力下降问题。该框架创新性地引入类示例作为评判标准,通过融合服务器端原型学习和客户端对抗训练机制,并结合多级对比损失约束,有效协调全局语义引导与局部特征适配,显著提升了模型在复杂异构场景下的分割性能。在自动驾驶、遥感影像分析和医学诊断等多模态数据集上的大量实验验证表明,所提出的联邦语义分割方法显著缓解了跨客户端类别表征失衡问题,为分布式人工智能的安全部署和跨域协同提供了可靠的技术支持。
论文第一作者为学部数据安全与隐私保护团队于小洋博士研究生,通信作者为吴晓明研究员。
成果二:ElaD-Net: An Elastic Semantic Decoupling Network for Lesion Segmentation in Breast Ultrasound Images
乳腺超声图像普遍存在边界模糊、组织重叠与语义干扰等问题,导致病灶分割准确性长期受限。现有方法虽引入边缘建模与注意力机制以增强判别力,但在多尺度病灶结构识别与语义一致性建模上仍存在显著瓶颈。
图2:基于弹性语义解耦的病灶分割框架图
该论文提出了弹性语义解耦网络 ElaD-Net,系统引入“解耦–重构”双模块机制。首先,弹性语义解耦模块(ESD)通过软边界引导与多尺度语义分离,有效缓解语义混叠与结构歧义;其次,弹性语义重构模块(ESR)通过波段感知融合与结构一致性重建,增强边缘连续性与区域完整性。整体架构基于EfficientNet-B2,融合轻量高频建模与动态卷积结构,兼顾精度与效率。在BUSI、DatasetB等多个基准数据集上开展了大量实践,结果表明ElaD-Net显著优于现有方法,尤其在边缘模糊区域具备更强的泛化能力。
论文第一作者为学部复杂系统与网络安全团队徐丽娟副研究员,通信作者为于福强博士和赵大伟研究员。
成果三:Decoupled Imbalanced Label Distribution Learning
标记分布学习通过建立从实例到标记分布的映射关系,能够有效刻画每个标记对实例的描述程度,已在表情识别、年龄估计和视频解析等多个领域取得成功应用。然而,实际标注过程中存在的标注主观性和标注噪声的问题,导致标记分布出现显著不平衡性,使得优势标记过度占据特征学习空间,而非优势标记的语义信息难以被充分学习。
图3:基于解耦的不平衡标记分布学习框架图
该论文深入剖析了现有标记分布学习模型处理不平衡数据时的性能局限,首次揭示优势标记过度表示会导致非优势标记训练时梯度信息衰减这一关键问题。研究提出解耦不平衡性标记分布学习方法(DILDL),通过双重解耦策略创新解决标记不平衡学习难题:先将原始标记分布显式分解为优势与非优势标记分布,实现解耦标记分布(DLD);再设计双分支编码器结构,差异化提取不同标记特征,并通过高斯分布假设与KL散度度量进行表示对齐,形成解耦表示对齐(DRDA)模块,有效缓解分布偏移。理论分析表明,该策略可显著增强非优势标记训练时的梯度传播效率,提升模型对不平衡标记分布的学习能力。在六个标准ILDL数据集上的实验显示,DILDL在Chebyshev距离、Clark距离等多项指标上全面超越现有最优方法,在Movie等多个数据集上性能最佳。消融实验进一步验证了解耦标记分布(DLD)和解耦表示对齐(DRDA)两个核心组件的有效性。
论文第一作者为学部视觉与信息处理团队高永标博士,通讯作者为吕国华副教授。
Copyright 2010 scsc.cn,All rights reserved 山东省计算中心 版权所有 鲁ICP备05015575号
技术支持:山东亿云信息技术有限公司