OpenVoice V2版本发布能对声音风格进行精细控制

站长之家（ChinaZ.com）4月26日消息:MyShell TTS 开发的 OpenVoice 是一项创新的声音克隆技术，它能够通过仅使用一小段参考发言者的音频片段来复制其声音，并生成多种语言的语音。

QQ截图20240426094050.png

目前，MyShell TTS 已经推出了全新的OpenVoice V2版本。这个版本能够直接支持英语、西班牙语、法语、中文、日语以及韩语，并且显著提高了音频输出的质量。OpenVoice V2拥有复制任意声音的能力，能以多种语言进行语音输出，并具备情感和口音的控制功能。它不但可以准确模仿特定的声音色彩，还允许对声音的风格，包括情感、口音、节奏、停顿及语调等进行细致调整。

主要功能:

准确的音色克隆: OpenVoice 能够精确地克隆参考音色，并在多种语言和口音中生成语音。
灵活的声音风格控制: 用户可以对声音的情绪、口音、节奏、停顿和语调进行详细调整，实现个性化的声音输出。
零样本跨语言声音克隆: 即使某些语言未在训练集中出现，OpenVoice 也能实现声音复制。
高效的计算性能: 相比于市场上现有的商业API，OpenVoice 在保持高性能的同时，计算成本大大降低。

OpenVoice V2新特性:

更好的音频质量: 采用新的训练策略提升音频质量。
原生多语言支持: 原生支持英语、西班牙语、法语、中文、日语和韩语。
集成 MeloTTS: V2版本引入了 MeloTTS 技术，增强了声音的自然度和表现力。
免费商业使用: 自2024年4月起，V1和V2版本均以 MIT 许可证发布，支持商业和研究用途的免费使用。

技术方法:

声音样式和语言的解耦设计: OpenVoice 的设计哲学是将声音的不同特性进行解耦，使得可以独立控制各个参数，提高操作的灵活性和推断速度。

基础发音者 TTS 模型与音色转换器: 包括允许对风格参数进行控制的基础发音者 TTS 模型，以及采用编码器-解码器结构的音色转换器。

训练策略和数据处理: 在训练过程中，使用了大量的多语种、多风格的音频样本，并采用特定的损失函数确保在保留风格的同时去除或转换音色。

官网：https://research.myshell.ai/open-voice

项目地址：https://top.aibase.com/tool/openvoice

创建自己的语音机器人：https://myshell.ai/

ChatGPT，取代工作or生产力神器？清华校友联手发文：AI时代怎么选工作

2025-01-132.9万阅读

首页

IT业界

热点视频

站长资讯

好物榜

更多分类

更多主题

OpenVoice V2版本发布能对声音风格进行精细控制

推荐关键词

24小时热搜

大家正在看

AI工具营销，现在是时候布局PC端了

Nvidia 的 AI 帝国：看看它投资的顶级初创企业

还能再涨23%！AI宠儿NVIDIA成大摩明年首选

联发科与NVIDIA合作为NVIDIA 个人AI超级计算机设计NVIDIA GB10超级芯片

这届C4-AI 太会整活，大学生创意小学生pick

中国AI硬件，正在占领CES

AI日报：理想汽车AI大模型APP将上线；小米搭建GPU万卡集群投入AI；Deepseek V3开源；ChatGPT搜索有被操纵风险

AI日报：可灵AI V1.6模型API开放；公众号上线 “AI配图” 功能;嫌犯用ChatGPT策划酒店爆炸案；阿里云上线AI程序员

ChatGPT卷入爆炸案刷屏，AI安全正在成为最贵的学费

AI日报：可灵AI上线AI模特功能；字节今年AI投入近BAT总和；ChatGPT本月第二次大规模宕机；抖音引入音频审核大模型

伊利、恰恰、娃哈哈......今天头条留给它们

仅迷你机大小！NVIDIA发布全球最小AI超级计算机：联发科参与

AI眼镜的火势，蔓延到CES了

AI日报：字节豆包全新上线AI编程功能；腾讯大模型检测工具打假AI；FLUX Pro微调API可定制AI模型

OpenAI前CTO最隐秘AI创业：没名字没方向，挖走OpenAI高管，10位顶尖人才投奔

Apple Intelligence占用空间暴涨，AI功能让存储和电池成负担

一台搞定所有需求！ThinkPad X1 Carbon Aura AI元启版开启AI办公新时代

AI日报：AI假冒名人直播带货违法；OpenAI o3 模型能耗惊人；AI技术将助推iPhone销量

AI日报：零一万物否认被阿里收购；ChatGPT Pro订阅仍亏钱；英伟达首个世界基础模型Cosmos

ChatGPT，取代工作or生产力神器？清华校友联手发文：AI时代怎么选工作

首页

IT业界

热点视频

站长资讯

好物榜

更多分类

更多主题

OpenVoice V2版本发布 能对声音风格进行精细控制

推荐关键词

24小时热搜

大家正在看

AI工具营销，现在是时候布局PC端了

Nvidia 的 AI 帝国：看看它投资的顶级初创企业

还能再涨23%！AI宠儿NVIDIA成大摩明年首选

联发科与NVIDIA合作 为NVIDIA 个人AI超级计算机设计NVIDIA GB10超级芯片

这届C4-AI 太会整活，大学生创意小学生pick

中国AI硬件，正在占领CES

AI日报：理想汽车AI大模型APP将上线；小米搭建GPU万卡集群投入AI；Deepseek V3开源；ChatGPT搜索有被操纵风险

AI日报：可灵AI V1.6模型API开放；公众号上线 “AI配图” 功能;嫌犯用ChatGPT策划酒店爆炸案；阿里云上线AI程序员

ChatGPT卷入爆炸案刷屏，AI安全正在成为最贵的学费

AI日报：可灵AI上线AI模特功能；字节今年AI投入近BAT总和；ChatGPT本月第二次大规模宕机；抖音引入音频审核大模型

伊利、恰恰、娃哈哈......今天头条留给它们

仅迷你机大小！NVIDIA发布全球最小AI超级计算机：联发科参与

AI眼镜的火势，蔓延到CES了

AI日报：字节豆包全新上线AI编程功能；腾讯大模型检测工具打假AI；FLUX Pro微调API可定制AI模型

OpenAI前CTO最隐秘AI创业：没名字没方向，挖走OpenAI高管，10位顶尖人才投奔

Apple Intelligence占用空间暴涨，AI功能让存储和电池成负担

一台搞定所有需求！ThinkPad X1 Carbon Aura AI元启版开启AI办公新时代

AI日报：AI假冒名人直播带货违法；OpenAI o3 模型能耗惊人；AI技术将助推iPhone销量

AI日报：零一万物否认被阿里收购；ChatGPT Pro订阅仍亏钱；英伟达首个世界基础模型Cosmos

ChatGPT，取代工作or生产力神器？清华校友联手发文：AI时代怎么选工作

OpenVoice V2版本发布能对声音风格进行精细控制

联发科与NVIDIA合作为NVIDIA 个人AI超级计算机设计NVIDIA GB10超级芯片