站长之家 - 业界 2024-06-06 09:40

Stability AI发布AI音频模型Stable Audio Open：支持文本生成鼓点、乐器等音效

划重点:
Stable Audio Open 是一个开源的文本转音频模型，可生成长达47秒的样本和音效。
用户可以创建鼓点、乐器重复乐段、环境声音、拟音和制作元素。
该模型支持音频样本的音频变化和风格转换。

站长之家（ChinaZ.com）6月6日消息:Stability AI 今天发布了 Stable Audio Open1.0，这是其音频领域的新一款生成 AI 模型。Stability AI 以稳定扩散文本到图像生成 AI 技术而闻名，但这只是该公司产品组合的一部分。该公司在2023年首次推出了 Stable Audio，这是一种文本到音频的生成 AI 工具。最近发布的 Stable Audio2.0提高了生成音频的清晰度和长度。

Stable Audio Open产品入口:https://top.aibase.com/tool/stable-audio-open-1-0

与完整版 Stable Audio 可用于一般商业用途并生成长达3分钟的音频不同，Stable Audio Open 的应用场景更为局限。Stable Audio Open 的目标是生成短音效片段，而非完整的歌曲。

正如其名称所示，Stable Audio Open 是一种开放模型，尽管它并非开源。Stable Audio Open 根据 Stability AI 的非商业研究社区协议许可证向用户提供，该许可证允许开放访问模型，但对使用该模型执行的操作有限制。

Stability AI 音频研究主管 Zach Evans 表示:“我们推出 Stable Audio Open 的目标是让音频研究人员和制作人能够亲身体验我们的生成音频模型之一，以加速这些令人难以置信的新工具的研究、采用和实际创造性使用。”

Stable Audio Open是什么?

Stable Audio Open 是一种专门针对音乐制作和声音设计的模型，优化了鼓点、乐器乐段、环境声音等音频样本的生成。与商业版 Stable Audio 相比，Stable Audio Open 的生成音频长度为47秒，质量较高。

Stability AI 对模型的训练采取了负责任的态度，使用了来自 FreeSound 和免费音乐档案的音频数据进行训练，以确保未使用受版权保护或专有材料。

用户可对Stable Audio Open 微调

Stable Audio Open 的另一个主要优势是用户可以根据自己的自定义音频数据对模型进行微调。例如，鼓手可以根据自己的鼓声录音样本微调模型，生成全新、独特的节拍。

Stable Audio Open 的微调是通过稳定音频工具库实现的，该库是根据实际开源许可证授权的。Stable Audio Open 的模型权重现已在 Hugging Face 上可用。

Evans 表示:“音频研究团队一直在努力提高生成音频模型的质量和可控性。我们期待进一步发布商业和开放模型，以反映我们研究的进展。”

官方博客：https://stability.ai/news/introducing-stable-audio-open

24小时热搜

热
4.53万次阅读
1 沙特申博宣传片真是中国拍的网友：这风格意境是中国的手笔
70991次阅读
2 南方人东北购物被店主语气“凶哭”：文化差异导致误解
58002次阅读
3 女子下班回家发现家门口被贴U盘：新型诈骗手段？
39073次阅读
4 爸爸送娃撂下就走结果学校没开门：交警协助联系安全返家
37434次阅读
热
3.23万次阅读
5 宗庆后在黄金地段为员工建廉租房：从不裁45岁以上员工我算有钱
30095次阅读
荐 2020年高通骁龙CPU排名高通骁龙888排名领先
35420次阅读

查看更多内容

首页

IT业界

热点视频

站长资讯

好物榜

更多分类

更多主题

Stability AI发布AI音频模型Stable Audio Open：支持文本生成鼓点、乐器等音效

推荐关键词

24小时热搜

大家正在看

AILISTIN 麦颜悦：开启肌肤年轻态新征程

HALI越向未来 – BUTTONS以大胆AI战略与愿景重塑智能奢品未来

专注Robotaxi，才是真正的Robotaxi第一股

Apple Silicon 才是苹果在AI上的“一盘大棋”

AI日报：AutoGLM智能体可自动帮点外卖；敏神重磅更新Flux版ic-light模型；字节跳动PersonaTalk让AI精准配音

摸着Meta过河，百度再战AI眼镜

所有AI应用的尽头，是MBTI？

AI让妙笔生花三星Galaxy Tab S10系列年末热销中

双11开门红买AI平板就选三星Galaxy Tab S10系列！

GPTBots：释放LiveChat潜能，大幅降低客服成本并提升效率

AI日报：媲美o1！DeepSeek推理模型R1-Lite-Preview；可灵AI用户超500万；AI版《黑客帝国》The Matrix问世

思必驰AI办公本Turbo：职场与学习的智能伙伴

苹果发布iOS 18.2 Beta 2：Siri可付费升级ChatGPT Plus

AI Agent再迎一巨头！谷歌重磅发力AI Agent ，商用大爆发！

苹果发布iOS 18.2 Beta 2：Siri支持付费升级ChatGPT Plus

STT在元宇宙网络平台Statter Network的若干种应用场景

巴黎初创公司 Filigran 融资 3500 万美元

AI Agent大爆发！微软刚刚发布大量商用AI Agent，全民智能体！

huiPPT AI PPT：杜绝加班赶PPT， 10 秒搞定PPT

AI日报：阿里云逆天大模型Qwen2.5-Turbo；ElevenLabs支持打造对话AI智能体；Mistral推最强开源多模态模型Pixtral Large

首页

IT业界

热点视频

站长资讯

好物榜

更多分类

更多主题

​Stability AI发布AI音频模型Stable Audio Open：支持文本生成鼓点、乐器等音效

推荐关键词

24小时热搜

大家正在看

AILISTIN 麦颜悦：开启肌肤年轻态新征程

HALI越向未来 – BUTTONS以大胆AI战略与愿景重塑智能奢品未来

专注Robotaxi，才是真正的Robotaxi第一股

Apple Silicon 才是苹果在AI上的“一盘大棋”

AI日报：AutoGLM智能体可自动帮点外卖；敏神重磅更新Flux版ic-light模型；字节跳动PersonaTalk让AI精准配音

摸着Meta过河，百度再战AI眼镜

所有AI应用的尽头，是MBTI？

AI让妙笔生花 三星Galaxy Tab S10系列年末热销中

双11开门红 买AI平板就选三星Galaxy Tab S10系列！

GPTBots：释放LiveChat潜能，大幅降低客服成本并提升效率

AI日报：媲美o1！DeepSeek推理模型R1-Lite-Preview；可灵AI用户超500万；AI版《黑客帝国》The Matrix问世

思必驰AI办公本Turbo：职场与学习的智能伙伴

苹果发布iOS 18.2 Beta 2：Siri可付费升级ChatGPT Plus

AI Agent再迎一巨头！谷歌重磅发力AI Agent ，商用大爆发！

苹果发布iOS 18.2 Beta 2：Siri支持付费升级ChatGPT Plus

STT在元宇宙网络平台Statter Network的若干种应用场景

巴黎初创公司 Filigran 融资 3500 万美元

AI Agent大爆发！微软刚刚发布大量商用AI Agent，全民智能体！

huiPPT AI PPT：杜绝加班赶PPT， 10 秒搞定PPT

AI日报：阿里云逆天大模型Qwen2.5-Turbo；ElevenLabs支持打造对话AI智能体；Mistral推最强开源多模态模型Pixtral Large

Stability AI发布AI音频模型Stable Audio Open：支持文本生成鼓点、乐器等音效

AI让妙笔生花三星Galaxy Tab S10系列年末热销中

双11开门红买AI平板就选三星Galaxy Tab S10系列！