小米推出新一代语音合成系统 支持多方言与歌唱合成
3月19日,小米公司正式发布了其自主研发的新一代语音合成系统MiMo-V2-TTS。该系统在语音表达的自然度、风格控制及多功能应用方面实现了显著突破。
据悉,该系统采用了创新的音频编码与联合建模架构,通过海量语音数据的训练,实现了对语音风格的精细控制。技术团队介绍,系统能够根据文本内容自动识别语气转折与情感变化,在保持语音自然流畅的同时,精准还原人类说话时的韵律特征。
在歌唱合成方面,该系统同样表现出色,能够准确处理音高与节奏,生成富有表现力的歌声。此外,系统还具备智能文本解析能力,可自动识别标点、语气词等文本特征,并将其转化为相应的语音表达,无需人工干预。
值得关注的是,该系统支持包括东北话、四川话、河南话、粤语在内的多种方言发音,并可进行角色化风格演绎,拓展了其在多样化场景中的应用潜力。
小米新一代语音合成系统技术示意图
小米技术负责人表示,MiMo-V2-TTS是公司语音技术发展的重要阶段性成果。未来,公司计划进一步扩展系统对多语种的支持,并探索其与多模态技术的协同应用,推动智能语音交互体验的持续升级。
推荐关键词
24小时热搜
-
热
- 1 沙特申博宣传片真是中国拍的 网友:这风格意境是中国的手笔
- 2 南方人东北购物被店主语气“凶哭”:文化差异导致误解
- 3 女子下班回家发现家门口被贴U盘:新型诈骗手段?
- 4 爸爸送娃撂下就走结果学校没开门:交警协助联系 安全返家
-
热
- 5 宗庆后在黄金地段为员工建廉租房:从不裁45岁以上员工 我算有钱
- 荐 2020年高通骁龙CPU排名 高通骁龙888排名领先