Stability AI发布开源AI音频模型Stable Audio Open：引领文本生成音效新潮流

AI每日新闻2年前 (2024)发布 shen

1,612 0 0

今日，人工智能领域的领军企业Stability AI在音频创作领域迈出了重要一步，发布了全新的开源AI音频模型——Stable Audio Open 1.0。这一革命性的文本转音频模型，以其出色的音频生成能力，再次证明了Stability AI在人工智能领域的领先地位。

Stable Audio Open 1.0是Stability AI在音频领域推出的新一款生成AI模型，旨在通过文本生成鼓点、乐器等音效，为用户提供前所未有的创作体验。这一模型的发布，标志着Stability AI在音频创作领域取得了新的突破。

“Stable Audio Open的推出，是Stability AI在音频创作领域持续创新的体现。”AI旋风认为，Stable Audio Open以其独特的优势，将为用户带来更加便捷、高效的音频创作方式。 Stability AI发布开源AI音频模型Stable Audio Open：引领文本生成音效新潮流

据了解，Stable Audio Open专注于音乐制作和声音设计，优化了鼓点、乐器乐段、环境声音等音频样本的生成。与商业版Stable Audio相比，Stable Audio Open生成的音频长度虽然限制在47秒，但其质量却达到了较高的水平。这一限制确保了模型在生成音效时的稳定性和可靠性，同时也为用户提供了更多的创作可能性。

Stable Audio Open的发布，不仅为音频研究人员和制作人提供了亲身体验生成音频模型的机会，更重要的是，它加速了这些令人难以置信的新工具的研究、采用和实际创造性使用。Stability AI音频研究主管Zach Evans表示：“我们希望通过Stable Audio Open，让更多的音频创作者能够体验到AI技术在音频创作领域的巨大潜力。”

值得一提的是，Stable Audio Open采用了负责任的训练方式，确保模型的训练和使用不会侵犯任何版权或专有材料。Stability AI使用了来自FreeSound和免费音乐档案的音频数据进行训练，确保了模型的合规性和可靠性。 Stability AI发布开源AI音频模型Stable Audio Open：引领文本生成音效新潮流

此外，Stable Audio Open还具备用户微调的功能。用户可以根据自己的需求，使用自定义音频数据对模型进行微调，生成符合自己风格的独特音效。这一功能的引入，将极大地提升音频创作的个性化和定制化水平。

Stable Audio Open的微调是通过稳定音频工具库实现的，该库是根据实际开源许可证授权的。用户可以在Hugging Face上轻松获取Stable Audio Open的模型权重，并开始自己的音频创作之旅。

Evans表示：“音频研究团队一直在努力提高生成音频模型的质量和可控性。Stable Audio Open的发布只是我们研究进展的一个缩影，未来我们将继续发布更多商业和开放模型，以满足不同用户的需求。”

AI旋风认为，Stable Audio Open的发布将为音频创作领域带来革命性的变革。它将极大地简化音频创作的流程，提高创作效率，同时也为音频创作者提供了更多的创作灵感和可能性。随着Stable Audio Open的不断完善和推广，相信它将成为音频创作领域不可或缺的一部分。