Opus 1.6编解码器更新:引入机器学习语音增强

开源音频编解码器Opus的核心库libopus发布1.6版本。此次更新在1.5版引入机器学习特性的基础上,进一步扩展了语音增强能力,并改进了编码接口。开发者社区普遍认为,这是在音质优化与可用性方面的重要升级。

新版本增加了一个基于神经网络的语音带宽扩展模块。该模型能够将宽带语音(0–8kHz)推断生成高频段内容(8–20kHz),在解码端重建接近全带宽的效果。模型无需额外的侧信息即可运行,因此不会破坏现有协议兼容性。开发者指出,语音的主要音素信息集中在低频段,高频部分则可通过推断补充,从而提升整体听感。

在网络环境方面,Opus1.6对Deep Redundancy(DRED)机制进行了改进。该机制通过优化冗余编码策略,提升了在抖动和丢包条件下的恢复能力,使语音在复杂网络中保持更稳定的主观体验。

除了语音增强功能,Opus1.6还引入了96kHz音频的实验性支持,即“Opus HD”模式。这一特性面向高解析度音频应用场景,被视为未来发展的方向性尝试。同时,新版本提供了24位编码/解码API,为专业音频处理和高动态范围内容提供更强的技术基础。针对定点实现的优化也提升了在嵌入式设备与资源受限平台上的运行效率。

更多技术细节与下载链接已在Opus官方网站公布,开发者和厂商可据此评估集成与升级方案。