小米自研MiMo-V2-TTS语言合成大模型发布：能说会唱河南话、粤语等样样精通

小米推出新一代语音合成系统支持多方言与歌唱合成

3月19日，小米公司正式发布了其自主研发的新一代语音合成系统MiMo-V2-TTS。该系统在语音表达的自然度、风格控制及多功能应用方面实现了显著突破。

据悉，该系统采用了创新的音频编码与联合建模架构，通过海量语音数据的训练，实现了对语音风格的精细控制。技术团队介绍，系统能够根据文本内容自动识别语气转折与情感变化，在保持语音自然流畅的同时，精准还原人类说话时的韵律特征。

在歌唱合成方面，该系统同样表现出色，能够准确处理音高与节奏，生成富有表现力的歌声。此外，系统还具备智能文本解析能力，可自动识别标点、语气词等文本特征，并将其转化为相应的语音表达，无需人工干预。

值得关注的是，该系统支持包括东北话、四川话、河南话、粤语在内的多种方言发音，并可进行角色化风格演绎，拓展了其在多样化场景中的应用潜力。

小米新一代语音合成系统技术示意图

小米技术负责人表示，MiMo-V2-TTS是公司语音技术发展的重要阶段性成果。未来，公司计划进一步扩展系统对多语种的支持，并探索其与多模态技术的协同应用，推动智能语音交互体验的持续升级。

24小时热搜

查看更多内容

大家正在看

腾讯QQ宠物官宣回归：内置Hy3大模型！保留喂食、洗澡等经典玩法

2026-07-272.1万阅读

首页

IT业界

热点视频

站长资讯

好物榜

更多分类

更多主题

小米自研MiMo-V2-TTS语言合成大模型发布：能说会唱河南话、粤语等样样精通

小米推出新一代语音合成系统支持多方言与歌唱合成

推荐关键词

24小时热搜

大家正在看

阿里发布 Qwen-Audio-3.0-ASR-Flash 语音识别大模型

小米9款音箱完成AI语音大升级内置超级小爱

单词也能合成？近千万月流水新品效应下，国内厂商迅速跟进

当大模型公司开始造手机

小米强烈推荐升级！小米手表S5喜提OTA更新：支持微信语音转文字、优化百度地图

大模型上手机，三星为何选中面壁智能？

苹果研发AI模型压缩技术：把270亿参数大模型装进iPhone

百度智能云完成64B世界模型512卡训练验证支撑大模型高效Scale

芯位学科大模型V2.0：让教育AI从“通用回答”走向“专业解答”

手机新物种！阶跃推出全球首款大模型原生智能体手机

AI日报：Kimi K3登顶全球最大开源模型；小度AI手表Fit开售；我国启动大模型 IPv6 专项行动

小米发布并开源Xiaomi-Robotics-U0：380亿参数具身生成大模型！生成效率提升83倍

腾讯QQ宠物官宣回归：内置Hy3大模型！保留喂食、洗澡等经典玩法

上线仅仅一周！腾讯混元大模型Hy3总调用量增长超68倍

小米宣布MiMo端侧模型通过备案：未来3年AI投入不低于600亿元

特斯拉车机系统更新：首次接入豆包大模型

全球最大2.8万亿参数大模型 Kimi K3今晚正式开源：性能坐稳前三

Testin XAgent实战解析：大模型+视觉自愈如何重构自动化测试工程

豆包输入法iOS版大升级：语音、手写输入更好用了

“首发，前沿大模型突破渗透测试新范式”——绿盟智能渗透测试系统2.0正式发布

首页

IT业界

热点视频

站长资讯

好物榜

更多分类

更多主题

小米自研MiMo-V2-TTS语言合成大模型发布：能说会唱 河南话、粤语等样样精通

小米推出新一代语音合成系统 支持多方言与歌唱合成

推荐关键词

24小时热搜

大家正在看

阿里发布 Qwen-Audio-3.0-ASR-Flash 语音识别大模型

小米9款音箱完成AI语音大升级 内置超级小爱

单词也能合成？近千万月流水新品效应下，国内厂商迅速跟进

当大模型公司开始造手机

小米强烈推荐升级！小米手表S5喜提OTA更新：支持微信语音转文字、优化百度地图

大模型上手机，三星为何选中面壁智能？

苹果研发AI模型压缩技术：把270亿参数大模型装进iPhone

百度智能云完成64B世界模型512卡训练验证 支撑大模型高效Scale

芯位学科大模型V2.0：让教育AI从“通用回答”走向“专业解答”

手机新物种！阶跃推出全球首款大模型原生智能体手机

AI日报：Kimi K3登顶全球最大开源模型；小度AI手表Fit开售；我国启动大模型 IPv6 专项行动

小米发布并开源Xiaomi-Robotics-U0：380亿参数具身生成大模型！生成效率提升83倍

腾讯QQ宠物官宣回归：内置Hy3大模型！保留喂食、洗澡等经典玩法

上线仅仅一周！腾讯混元大模型Hy3总调用量增长超68倍

小米宣布MiMo端侧模型通过备案：未来3年AI投入不低于600亿元

特斯拉车机系统更新：首次接入豆包大模型

全球最大2.8万亿参数大模型 Kimi K3今晚正式开源：性能坐稳前三

Testin XAgent实战解析：大模型+视觉自愈如何重构自动化测试工程

豆包输入法iOS版大升级：语音、手写输入更好用了

“首发，前沿大模型突破渗透测试新范式”——绿盟智能渗透测试系统2.0正式发布

小米自研MiMo-V2-TTS语言合成大模型发布：能说会唱河南话、粤语等样样精通

小米推出新一代语音合成系统支持多方言与歌唱合成

小米9款音箱完成AI语音大升级内置超级小爱

百度智能云完成64B世界模型512卡训练验证支撑大模型高效Scale