网站地图| 联系我们 | 收藏本站 | 中国科学院

研究所动态

    当前位置:首页 > 研究所动态

声学所团队在Interspeech 2021 DNS-Challenge中获得冠军

  近期,在由Interspeech举办的2021深度噪声抑制挑战赛(Deep Noise Suppression-Challenge,以下简称DNS-Challenge)中,中国科学院噪声与振动重点实验室IACAS Lab9团队获得冠军,将本年度两次DNS-Challenge的冠军全部收入囊中。 

  DNS-Challenge由微软公司组织,每年开展两次,分别由语音信号处理领域知名会议InterspeechICASSP轮流举办。今年年初,IACAS Lab9团队曾在ICASSP 2021 DNS-Challenge中夺冠。

  本届DNS-Challenge比赛作为Interspeech2021六大挑战赛之一,主要围绕复杂场景下单通道语音增强任务,以平均主观意见分Mean Opinion Score, MOS为主要评价指标。该竞赛已举办至第三届,在业内极具影响力,吸引了亚马逊、快手、字节跳动、英特尔、三星、南京大学、西北工业大学、中国科学技术大学等众多国内外知名企业和科研院所参与。 

  本次竞赛共分为宽带场景实时降噪(Real-Time Denoising track for wideband scenario)和全频带场景实时降噪(Real-Time Denoising track for full-band scenario)两个赛道。其中实时赛道要求参赛模型在满足低延时要求下,对平稳目标、情感音频、英语语音、非英语语音、非英语音调和音乐进行增强。官方提供的测试音频包含仿真语音和各种实际场景下录制的语音,并带有不同程度的混响。相比前两届竞赛,难度大幅度提升,增加了大量的强瞬态噪声,声学环境更为复杂,增强的目标信号更加多样化。

  本次比赛中,IACAS Lab9团队提出了基于深度学习的幅度相位解耦优化的多阶段去噪去混响方案,前两个阶段,只在幅度域实现噪声和混响去除。在上述先验估计的基础上,第三阶段通过残差学习对幅度和相位信息显式修复从而对频谱进行进一步细化。最后使用极低复杂度的后处理模块进一步抑制残留噪声,以提升模型在低信噪比场景下的噪声抑制能力。此外,团队还设计了一种幂律压缩的MSE损失函数有效去除非稳态噪声,显著提升听感,取得宽带场景实时赛道第一名的成绩。同时,基于该方案撰写的论文A Simultaneous Denoising and Dereverberation Framework with Target Decoupling已被Interspeech 2021接收,并在会议上进行分享交流。 

附件: