豆包实时语音大模型正式上线！端到端语音对话情商智商双高

豆包实时语音大模型震撼上线，全方位提升语音交互体验！

今日，字节跳动豆包大模型团队隆重推出豆包实时语音大模型，现已在豆包App全量开放。升级至7.2.0版本即可亲身体验这一语音交互领域的重大突破。

豆包实时语音大模型集语音理解和生成于一体，打造端到端语音对话。与传统的级联模式相比，其在语音表现力、控制力、情绪承接方面展现出卓越性能，且具备低时延和随时打断对话等特性。

该模型专为中文语境和场景设计，采用语音和语义联合建模，赋予其丰富的表现力，呈现出接近真人水准的语音表达。通过学习角色语音和情感特点，模型具备强大的讲故事能力，可生动切换不同角色/状态，配合不同情绪表达，提升交互趣味性和沉浸感。

联合建模后，模型涌现出非凡的指令理解、声音扮演和声音控制能力。目前，模型部分方言和口音的识别源自Pretrain阶段数据泛化，而非针对性训练。

豆包实时语音大模型输出的语音高度逼近真人，包括类人的副语言特征（如语气词、停顿思考等）。同时，实时联网功能赋予模型获取最新信息的强大能力，对时效问题可精准、及时地回应。

技术展示表明，该模型语音语气自然度和情绪饱满度逼近真人，对话风格更加拟人，情感理解更加深刻，对用户的情绪做到较好承接。不过，现阶段模型仅支持中文，其他语种和方言的支持仍在探索中。

字节跳动豆包团队开源MoE架构优化技术：可将大模型训练效率提升1.7倍

2025-03-102.2万阅读

首页

IT业界

热点视频

站长资讯

好物榜

更多分类

更多主题

豆包实时语音大模型正式上线！端到端语音对话情商智商双高

推荐关键词

24小时热搜

大家正在看

AI说书媲美真人！豆包语音大模型升级长上下文理解

响应小于1秒、唤醒识别超98%！岚图自研AI语音对话系统即将发布

字节跳动豆包团队开源MoE架构优化技术：可将大模型训练效率提升1.7倍

AI日报：抖音测试接入豆包AI；即梦接入DeepSeek支持智能提示词生成；Grok语音模式全面开放

独家｜抖音接入豆包，字节发起反击

谷歌AI大牛吴永辉加盟字节跳动负责AI基础研究探索工作

男孩走丢后借助ATM机求救：成功触发语音提醒

豆包拿不出干粮

深受AI语音恶搞困扰雷军呼吁加强“AI换脸拟声”侵权治理

AI日报：腾讯深度思考模型“混元T1”全面开放；字节跳动全新视频生成工具Phantom；苹果智能将于4月初支持简体中文

苹果 AI 智能语音助手 Siri 重大更新可能会延迟

字节跳动火山引擎AI一号位离职：已加盟一清华系公司担任CEO

马斯克宣布Grok语音模式正式上线：早期测试版本可能有一些问题

普渡机器人接入DeepSeek，“满血版”语音交互即将上线！

拼多多AI大模型暗战

全品牌覆盖！比亚迪“AI 智能语音”正式接入DeepSeek满血版

国产大模型再上一分！有道大模型翻译质量实测达全球之首

微软CEO谈为何不自研大模型：全栈系统与产品落地才是核心

百度有史以来最强大模型！李彦宏：文心大模型4.5系列将开源

DeepSeek活成了豆包想要的样子

首页

IT业界

热点视频

站长资讯

好物榜

更多分类

更多主题

豆包实时语音大模型正式上线！端到端语音对话 情商智商双高

推荐关键词

24小时热搜

大家正在看

AI说书媲美真人！豆包语音大模型升级长上下文理解

响应小于1秒、唤醒识别超98%！岚图自研AI语音对话系统即将发布

字节跳动豆包团队开源MoE架构优化技术：可将大模型训练效率提升1.7倍

AI日报：抖音测试接入豆包AI；即梦接入DeepSeek支持智能提示词生成；Grok语音模式全面开放

独家｜抖音接入豆包，字节发起反击

谷歌AI大牛吴永辉加盟字节跳动 负责AI基础研究探索工作

男孩走丢后借助ATM机求救：成功触发语音提醒

豆包拿不出干粮

深受AI语音恶搞困扰 雷军呼吁加强“AI换脸拟声”侵权治理

AI日报：腾讯深度思考模型“混元T1”全面开放；字节跳动全新视频生成工具Phantom；苹果智能将于4月初支持简体中文

苹果 AI 智能语音助手 Siri 重大更新可能会延迟

字节跳动火山引擎AI一号位离职：已加盟一清华系公司担任CEO

马斯克宣布Grok语音模式正式上线：早期测试版本 可能有一些问题

普渡机器人接入DeepSeek，“满血版”语音交互即将上线！

拼多多AI大模型暗战

全品牌覆盖！比亚迪“AI 智能语音”正式接入DeepSeek满血版

国产大模型再上一分！有道大模型翻译质量实测达全球之首

微软CEO谈为何不自研大模型：全栈系统与产品落地才是核心

百度有史以来最强大模型！李彦宏：文心大模型4.5系列将开源

DeepSeek活成了豆包想要的样子

豆包实时语音大模型正式上线！端到端语音对话情商智商双高

谷歌AI大牛吴永辉加盟字节跳动负责AI基础研究探索工作

深受AI语音恶搞困扰雷军呼吁加强“AI换脸拟声”侵权治理

马斯克宣布Grok语音模式正式上线：早期测试版本可能有一些问题