ADSP实验室参加ICASSP 2026会议
2026年5月4日至8日,第51届国际声学、语音与信号处理会议(International Conference on Acoustics, Speech and Signal Processing, ICASSP 2026)在西班牙巴塞罗那举办。北京大学深圳研究生院现代信号与数据处理实验室(ADSPLAB/ADSP实验室)主任邹月娴教授与博士研究生杨绪升作为实验室代表参加了本次会议,展示实验室在语音编解码、多模态感知、对话系统等方向的最新工作。
ICASSP由电气电子工程师学会(Institute of Electrical and Electronics Engineers, IEEE)信号处理学会主办,是声学、语音及信号处理领域规模最大、影响力最广的学术会议之一。今年会议吸引了来自全球各地的研究机构与科技企业的参与者,议程涵盖了语音大语言模型、深度生成模型、图神经网络、医学图像分析、多模态情感识别、神经音频编码、视觉-语言模型、联邦学习、鲁棒语音识别、扩散模型、集成感知与通信、可解释机器学习、隐私保护AI、强化学习、时间序列预测等数十个研究方向。
本次会议,ADSP实验室共有六项研究成果被接收:
尹永康等人提出基于音频引导的多模态对齐方法,有效提升了主动说话人检测任务中的边界建模精度。林义凯等人构建自迭代蒸馏框架,较好解决了视觉 - 语言模型在无监督场景下的领域适配难题。杨绪升等人研发超低复杂度神经语音编解码系统,内嵌实时变声模块,可支撑个性化实时语音通信场景落地。万子翔等人面向极端低资源场景,设计了高性能轻量化语音编码方案。熊长柱等人一方面通过信号解耦与动态提示机制构建元网络框架,提升任务导向对话系统的稳定性;另一方面依托大语言模型驱动的对比记忆机制,有效改善了对话系统在知识稀缺场景下的交互表现。
会议现场,杨绪升在海报展示环节系统介绍了VChangeCodec编解码器的设计理念。该编解码器通过标量量化将模型参数量控制在百万级别,同时在Token域深度集成实时变声功能,整体算法延迟低至40毫秒。展示期间,来自中国科学院声学所、美国思科系统公司等机构的学者,对模型低复杂度设计与实时性能的平衡方案表现出浓厚兴趣,各方围绕量化策略、量化精度与音质权衡、因果卷积网络优化等技术细节展开深入交流。多位业界技术人员也重点咨询了该算法在移动端部署的落地可行性与功耗性能表现。
博士研究生杨绪升同时在大会上进行了口头报告,该论文提出了一种音频引导的多模态方法,通过精细化对齐与边界建模技术提升主动说话人检测的准确性。该方法利用音频信息引导视觉特征学习,实现了音频-视觉模态间的细粒度对齐,并针对说话人活动的时序边界进行精确建模,有效解决了复杂场景下的说话人定位问题。

实验室博士研究生杨绪升进行Oral Presentation
邹月娴教授在会场与俞凯、俞栋、李宏毅、王文武等知名学者就低资源语言建模、个性化语音合成、未来高校实验室的课题研究方向等议题深入探讨。并与腾讯、华为、英伟达、海天瑞声等企业技术负责人围绕大语言模型在语音任务中的应用、语音数据标注与质量控制等热点问题开展交流。
邹月娴教授与俞栋老师进行学术交流,杨绪升博士研究生与两位老师在会场合影
两人还参加了官方组织的全体会议,包括斯坦福大学Emmanuel Candès教授的"What Statistics and AI Offer Each Other?"以及洛桑联邦理工学院Michael Unser教授的"Variational Splines and Stochastic Processes: From Kernel Methods (and Norbert Wiener) to ReLU Networks"。报告中,Candès教授探讨了统计学与人工智能的互补关系,Unser教授阐述了从核方法到神经网络的理论演进路径。这些内容为实验室后续工作提供了新的理论视角。
会议期间,邹月娴教授还应邀参加了华为组织的技术晚宴。晚宴上,华为技术团队与高校学者共同介绍了URGENT语音增强挑战赛和全双工情感对话语音大模型挑战赛两项技术竞赛的最新进展。报告后,邹老师与来自各高校的研究者及业界专家就语音增强在真实场景中的鲁棒性问题、全双工对话系统的延迟优化等话题展开了深入讨论。
本次参会让实验室全面把握了语音信号处理与多模态学习的前沿动态,也促使团队从数据分布、跨模态对齐等维度重新审视研究范式。六项成果的集中展示拓展了与国际顶尖高校和产业界的合作网络,为后续的技术转化和人才培养奠定了基础。之后,ADSP实验室将继续融合深度学习与信号处理理论,推进神经编解码器的轻量化研究,探索多模态模型在资源受限场景下的适应机制,同时关注对话系统的可靠性与可解释性建模。并在医疗辅助、具身智能等场景推动技术落地,促进产学研深度融合。实验室计划在2027年继续向ICASSP投稿并参会交流,持续在国际学术平台上贡献高水平研究成果。
撰稿人:杨绪升
2026年5月12日






