Meta(Facebook)发布了AI驱动的音频压缩算法

上周，Meta推出了名为“EnCodec”的、AI驱动的音频压缩算法。据报道，它可以以 64kbps 的速度把音频文件压缩到MP3格式1/10的大小，同时不降低音质。 Meta 表示，这种技术可以显著提高低带宽网络上的语音质量，例如在服务参差不齐的地区拨打电话。该技术也适用于音乐应用。

Meta 于 10 月 25 日在 Meta AI 研究人员 Alexandre Défossez、Jade Copet、Gabriel Synnaeve 和 Yossi Adi 撰写的题为《高保真神经网络音频压缩》的论文中首次向人们介绍了这项技术。

其方法由三部分组成，经过训练，可以将音频压缩到所需的目标大小。首先，编码器将未压缩的数据转换为较低帧速率的“潜在空间”表示。然后，“量化器”将表示压缩到目标大小，同时跟踪最重要的信息，这些信息稍后将用于重建原始信号。 (此压缩信号通过网络发送或保存到磁盘。)最后，解码器使用单 CPU 上的神经网络将压缩数据实时转换回音频。

“有损压缩的关键是识别人类无法感知的变化，因为在低比特率下完美的重建是不可能的。为此，我们使用鉴别器来提高生成样本的感知质量。犹如一种猫鼠游戏。其中鉴别器的工作是区分真实样本和重建样本。压缩模型试图通过推动重建样本与原始样本在感知上相似度来欺骗鉴别器。”

值得注意的是，使用神经网络进行音频压缩和解压并不是什么新鲜事——尤其是语音压缩——但 Meta 的研究人员声称是他们最先将这项技术应用于 48 kHz 立体声音频(略好于 CD 的 44.1 kHz 采样率，Internet上典型的音乐文件特征)。

至于实际应用，Meta 表示，这种由人工智能驱动的“音频超压缩”可以在恶劣的网络条件下支持“更快、质量更好的通话”。最终可以提供“丰富的元宇宙体验，而无需大幅提升带宽”。

https://arstechnica.com/information-technology/2022/11/metas-ai-powered-audio-codec-promises-10x-compression-over-mp3/

赞一个 (4)

Meta(Facebook)发布了AI驱动的音频压缩算法

← 5个月大的斑尾塍鹬打破鸟类飞行记录：11天零1小时不间断飞行13560公里

Meta(Facebook)发布了AI驱动的音频压缩算法

Recommend

计算就是创造力！阿里云与FIRST影展设立“无影创作奖”

美图公司连续六年入选中国互联网综合实力百强企业-品玩

因午休玩手机音量太大被辞退，员工向公司索赔15万，法院判了

Linux Lite 6.2 正式版发布下载：基于 Ubuntu 22.04.1 LTS 开发，吸引 Windows 用户转...

百度地图适配苹果灵动岛可实现红绿灯倒计时、锁屏导航等功能

折叠屏手机价格战打响：华为新品售价降至6000元左右

Microsoft Edge实现在Windows 11、Mac、Android间共享文件的功能

消息称马斯克指示Twitter削减10亿美元基础设施年度成本

美国在线支付公司Stripe本周将裁员14% 1000多人受影响

阿里平头哥发布RISC-V高能效处理器玄铁C908，打造端云一体生态

About Joyk