比 MP3 小 10 倍,Meta 开源全新音频压缩技术 EnCodec
发表于:2025-11-22 作者:千家信息网编辑
千家信息网最后更新 2025年11月22日,CTOnews.com 11 月 6 日消息,Meta 在一篇博客中公布了全新的开源音频压缩技术 EnCodec,号称压缩文件大小比 MP3 格式小 10 倍。据介绍,Meta 旗下基础人工智能研究
千家信息网最后更新 2025年11月22日比 MP3 小 10 倍,Meta 开源全新音频压缩技术 EnCodec
CTOnews.com 11 月 6 日消息,Meta 在一篇博客中公布了全新的开源音频压缩技术 EnCodec,号称压缩文件大小比 MP3 格式小 10 倍。
据介绍,Meta 旗下基础人工智能研究 (FAIR) 团队在 AI 驱动的音频超压缩领域取得了成功,构建了一个由三部分组成的系统,并对其进行端到端训练,以将音频数据压缩到目标大小,然后可以使用神经网络对这些数据进行解码。
与 64 kbps 的 MP3 相比,Meta 的新技术 EnCodec 实现了大约 10 倍的压缩率,而且没有质量损失。
EnCodec 的三部分包括:
编码器:获取未压缩的数据并将其转换为更高维度和更低帧率的表示(representation)。
量化器:将这个表示压缩到目标大小,通过训练量化器给想要的大小(或大小集),同时保留最重要的信息来重建原始信号。这种压缩表示是存储在磁盘上或通过网络发送的,相当于计算机上的 .mp3 文件。
解码器:将压缩信号转换回与原始信号尽可能相似的波形,有损压缩的关键是识别人类无法感知的变化,因为在低比特率下完美的重建是不可能的。为此,EnCodec 使用鉴别器来提高生成样本的感知质量,创建了一个类似猫捉老鼠的游戏,其中鉴别器的工作是区分真实样本和重建样本。压缩模型试图通过推动重建的样本在感知上与原始样本更加相似来生成样本来欺骗鉴别器。
CTOnews.com了解到,Meta 表示,该技术尚未涵盖视频,但目前已在计划中,其目标是改进视频会议、流媒体电影以及在 VR 中与朋友玩游戏等的音频体验。
论文地址:点此查看
GitHub 开源页面:点此查看
样本
大小
音频
原始
信号
数据
目标
鉴别
技术
相似
文件
网络
视频
质量
部分
生成
训练
音频压缩
为此
人工
数据库的安全要保护哪些东西
数据库安全各自的含义是什么
生产安全数据库录入
数据库的安全性及管理
数据库安全策略包含哪些
海淀数据库安全审计系统
建立农村房屋安全信息数据库
易用的数据库客户端支持安全管理
连接数据库失败ssl安全错误
数据库的锁怎样保障安全
山东网络安全评测机构
品质软件开发答疑解惑
数据库太大影响性能吗
gtpr网络安全
网络安全与执法可以考一建吗
猫王互联网科技有限公司长沙
理光打印机连接不到服务器
hpe服务器配置
mc1.62服务器
绝地求生哪些服务器可以竞技单排
服务器tpm模块是怎么识别的
花漾互联网科技有限公司
软件开发用拯救者
绩溪进口软件开发服务解决方案
软件开发薪酬考核指标
计数型测量系统的数据库设计
社区网络安全普及教育方案
超激斗梦境出现无法连接服务器
北京网络软件开发计划
常德商城分销软件开发费用
数据库系统概论考试大题
管理无线网络的服务器
数据库中表中的列名怎么建立
湖南计算机网络技术专业技校
美国高防御服务器
数据库取合Sql
网络安全职责分离
415网络安全法
肖帥网站建设软件开发
坚版网络安全手抄报图片
相关文章
- 25 周年纪念作,情怀拉满但诚意欠缺:《勇者斗恶龙 怪物仙境 3》
- 联想拯救者 Y700 2023 平板推送 ZUI 15.0.723 系统灰度测试:新增“USB 网络共享”,优化底部小白条
- Streacom 推出 SG10 高端被动散热机箱:可解热 600W,1300 美元
- 3D 角色扮演策略游戏《少女前线 2:追放》公测开启,安卓、iOS、PC 多端互通
- 新能源车市:价格战开局,价值战结束
- 雪天这样拍,照片更为味道
- Cybertruck:未来物种重新定义汽车
- 2022 年我国未成年网民规模突破 1.93 亿,普及率达 97.2%
- 上映 7 天,《名侦探柯南:黑铁的鱼影》内地票房破亿、豆瓣 6.6 分
- 小岛工作室推出《死亡搁浅》联名手机手柄,预计明年发售