IT商业网-解读信息时代的商业变革
当前位置: 首页 > 人工智能 > 正文

Meta颠覆音频创作:Audiobox声音生成模型震撼登场

2023-12-05 09:37:09     

  Meta公司最新推出的AI声音生成模型,Audiobox,将音频创作推向新的高度。这一创新模型不仅可以接收语音输入,还能同时理解文字描述,为用户提供更灵活、更多样的声音创作可能性。

  基于Voicebox AI的革新之作

  Audiobox建立在Meta今年六月发布的Voicebox AI模型基础上,突破性地实现了语音和文字的双重输入,并在音频生成和编辑方面做出了显著的升级。这让用户可以通过语音和文字的双重方式,创造出符合其需求的音频内容。

  降低声音生成门槛

  Meta表示,要生成高品质音频需要庞大的音频库和深厚的领域知识,而这些资源对于大多数人来说并不容易获取。Audiobox的推出旨在降低声音生成的门槛,使任何人都能轻松制作视频、游戏等应用场景所需的音效。

  创新技术实现多层次音频生成

  Audiobox采用了Voicebox的“引导声音”机制,并结合“流量比对”扩散模型生成方法,实现了“声音填充”功能,从而可以生成多层次、丰富多彩的音频内容。Meta通过测试展示了Audiobox生成带有雷暴声的下雨音频,并通过一系列提示句演示了不同情境下的音频创作。

  超越同类模型的音质与准确度

  Meta宣称,Audiobox在音质和“生成内容的准确度”方面明显超越了同类模型,包括AudioLDM2、VoiceLDM和TANGO,成为目前最优秀的音频生成模型之一。

  开放试用及即将全面公开

  目前,Audiobox已经向特定研究人员和学术界开放试用,用于测试模型的品质和安全性。Meta表示,计划在未来几周内全面公开Audiobox,让更多人体验这一革命性的声音生成模型。 Meta公司通过Audiobox再次证明了其在人工智能领域的引领地位,为声音创作开启了新的创作时代。Meta Audiobox,开启声音创新的新篇章!

免责声明: IT商业新闻网遵守行业规则,本站所转载的稿件都标注作者和来源。 IT商业新闻网原创文章,请转载时务必注明文章作者和来源“IT商业新闻网”, 不尊重本站原创的行为将受到IT商业新闻网的追责,转载稿件或作者投稿可能会经编辑修改或者补充, 如有异议可投诉至:post@itxinwen.com
微信公众号:您想你获取IT商业新闻网最新原创内容, 请在微信公众号中搜索“IT商业网”或者搜索微信号:itxinwen,或用扫描左侧微信二维码。 即可添加关注。
标签:

品牌、内容合作请点这里: 寻求合作 ››

相关阅读RELEVANT