当前位置：首页 > 人工智能 > 正文

Meta颠覆音频创作：Audiobox声音生成模型震撼登场

2023-12-05 09:37:09　　

　　Meta公司最新推出的AI声音生成模型，Audiobox，将音频创作推向新的高度。这一创新模型不仅可以接收语音输入，还能同时理解文字描述，为用户提供更灵活、更多样的声音创作可能性。

　　基于Voicebox AI的革新之作

　　Audiobox建立在Meta今年六月发布的Voicebox AI模型基础上，突破性地实现了语音和文字的双重输入，并在音频生成和编辑方面做出了显著的升级。这让用户可以通过语音和文字的双重方式，创造出符合其需求的音频内容。

　　降低声音生成门槛

　　Meta表示，要生成高品质音频需要庞大的音频库和深厚的领域知识，而这些资源对于大多数人来说并不容易获取。Audiobox的推出旨在降低声音生成的门槛，使任何人都能轻松制作视频、游戏等应用场景所需的音效。

　　创新技术实现多层次音频生成

　　Audiobox采用了Voicebox的“引导声音”机制，并结合“流量比对”扩散模型生成方法，实现了“声音填充”功能，从而可以生成多层次、丰富多彩的音频内容。Meta通过测试展示了Audiobox生成带有雷暴声的下雨音频，并通过一系列提示句演示了不同情境下的音频创作。

　　超越同类模型的音质与准确度

　　Meta宣称，Audiobox在音质和“生成内容的准确度”方面明显超越了同类模型，包括AudioLDM2、VoiceLDM和TANGO，成为目前最优秀的音频生成模型之一。

　　开放试用及即将全面公开

　　目前，Audiobox已经向特定研究人员和学术界开放试用，用于测试模型的品质和安全性。Meta表示，计划在未来几周内全面公开Audiobox，让更多人体验这一革命性的声音生成模型。 Meta公司通过Audiobox再次证明了其在人工智能领域的引领地位，为声音创作开启了新的创作时代。Meta Audiobox，开启声音创新的新篇章！

免责声明： IT商业新闻网遵守行业规则，本站所转载的稿件都标注作者和来源。 IT商业新闻网原创文章，请转载时务必注明文章作者和来源“IT商业新闻网”，不尊重本站原创的行为将受到IT商业新闻网的追责，转载稿件或作者投稿可能会经编辑修改或者补充，如有异议可投诉至：post@itxinwen.com

微信公众号：您想你获取IT商业新闻网最新原创内容，请在微信公众号中搜索“IT商业网”或者搜索微信号：itxinwen，或用扫描左侧微信二维码。即可添加关注。

标签：

品牌、内容合作请点这里： 寻求合作 ››

榜单

今日推荐

Meta颠覆音频创作：Audiobox声音生成...

Meta颠覆音频创作：Audiobox声音生成模型震撼登场

相关阅读RELEVANT

榜单

今日推荐

科技互联