思必驰：语音交互迈入“拟人化”阶段

消费者在交互过程中并非孤立地依据声音、表情及动作中的单项进行沟通与交流，而是综合视觉、听觉、触觉甚至嗅觉来进行有效的沟通。同理，要使机器做到更加逼真的“拟人化”，就需要通过语音、视觉、文本等信息结合的方式来推动人机交互的优化与升级。

例如，在复杂声学环境尤其是多人同时说话的时候，语音识别性能会显著下降，此时若引入视觉信息对讲话者进行唇语识别，综合语音和视频信息则可以大幅提升说话人跟踪和语音识别准确率；又例如，在人机交互过程中，机器通过采集用户的表情、说话语气，甚至脚步的频率和急缓程度，可以分析用户的情绪状态，以采用不同的方式推进交互，提高人机交互的交互效率与质量。

不难看出，应对人机交互场景化应用不断拓展的市场需求，多模态、智能化的完整解决方案可以更好地应对不同场景的复杂变化，多模态交互成为行业发展的必然趋势。

深耕行业多年，思必驰早年便对多模态交互领域进行布局，已经成功自主研发出多模态对话交互技术。

具体来看，思必驰多模态对话交互技术联合语音、语言、视觉等多个模态的信息，能够在高噪声环境（比如地铁、家居、车载环境），大幅提升语音识别率和对话交互成功率。此外，思必驰研发打造出多模态对话交互软硬件一体的解决方案，包括高噪声环境下的多模态唤醒、说话人跟踪、语音活动检测等技术，增加了语音交互对噪声的鲁棒性，显著提升了用户体验。

目前，思必驰上述方案已应用政务民生场景中的轨道交通、智能自助设备等需要近场语音交互且环境嘈杂的场景和产品。

随着技术的不断进步，多模态交互的应用场景将会越来越广泛。可以预见的是，AI语音的发展在思必驰等技术领先企业的持续推动下，将会为人们带来更加自然、智能的交互体验。

相关话题

人机交互优化拟人化技术语音识别准确率人机交互场景化应用

特别声明：以上内容(如有图片或视频亦包括在内)均为站长传媒平台用户上传并发布，本平台仅提供信息存储服务，对本页面内容所引致的错误、不确或遗漏，相关信息仅供参考。任何单位或个人认为本页面内容可能涉嫌侵犯其知识产权或存在不实内容时，可及时向站长之家提出书面权利通知或不实情况说明，并提供身份证明、权属证明及详细侵权或不实情况证明（点击查看反馈联系地址）。本网站在收到上述法律文件后，将会依法依规核实信息，沟通删除相关内容或断开相关链接。

美国莱斯大学终身教授钮凤林已回国：专注于地震成像技术开发与应用

2025-02-172.8万阅读

首页

IT业界

热点视频

站长资讯

好物榜

更多分类

更多主题

思必驰：语音交互迈入“拟人化”阶段

推荐关键词

24小时热搜

大家正在看

三星Galaxy S25系列多模态感知树立人机交互新范式

无人机上岗：空中巡逻破解“幽灵”堵车！

破解孤岛—IQAX eBL跨平台交互附录获得国际保赔协会官方批准

无人机VS机器狗：烟花大战谁更胜一筹

一图一3D世界，视频还可交互，昆仑万维「空间智能」开年首秀来了

首个DeepSeek AI电视！海信百吋大屏实现AI画质、智能交互双引领

革新你的移动交互方式三星Galaxy S25系列抢鲜预定中

握手、比心、大合唱！无人机和机器狗花样打开了开学第一天

《模拟人生》和《模拟人生2》将迎来官方重制！包含所有扩展包

帮村里接通AI就靠它！34个地域超拟人AI智能体上线，背后技术也被我们扒出来了

Galaxy 全球新品发布会在即三星以全息影像秀展示手机交互新方式

微星MEG VISION X AI幻影主机震撼上市：RTX 5080 AI交互革新体验

京东物流发布JDX20“京鹊”物流无人机：最大载重10公斤速度98km/h

Meta 正在大力投资 AI 驱动的类人机器人：希望成为机器人的 Android

技术支持需求激增，企业应该如何应对

Chiplet技术迈向标准化！Arm发布芯粒系统架构公开规范

豆包实时语音大模型正式上线！端到端语音对话情商智商双高

蓝凌低代码应用，助力央国企、金融、制造、医院、高校等数智化

积极响应首发经济撬动新增长，雅迪华宇钠电技术荣登央视《中国首发》

美国莱斯大学终身教授钮凤林已回国：专注于地震成像技术开发与应用

首页

IT业界

热点视频

站长资讯

好物榜

更多分类

更多主题

思必驰：语音交互迈入“拟人化”阶段

推荐关键词

24小时热搜

大家正在看

三星Galaxy S25系列多模态感知 树立人机交互新范式

无人机上岗：空中巡逻破解“幽灵”堵车！

破解孤岛—IQAX eBL跨平台交互附录获得国际保赔协会官方批准

无人机VS机器狗：烟花大战谁更胜一筹

一图一3D世界，视频还可交互，昆仑万维「空间智能」开年首秀来了

首个DeepSeek AI电视！海信百吋大屏实现AI画质、智能交互双引领

革新你的移动交互方式 三星Galaxy S25系列抢鲜预定中

握手、比心、大合唱！无人机和机器狗花样打开了开学第一天

《模拟人生》和《模拟人生2》将迎来官方重制！包含所有扩展包

帮村里接通AI就靠它！34个地域超拟人AI智能体上线，背后技术也被我们扒出来了

Galaxy 全球新品发布会在即 三星以全息影像秀展示手机交互新方式

微星MEG VISION X AI幻影主机震撼上市：RTX 5080 AI交互革新体验

京东物流发布JDX20“京鹊”物流无人机：最大载重10公斤 速度98km/h

Meta 正在大力投资 AI 驱动的类人机器人：希望成为机器人的 Android

技术支持需求激增，企业应该如何应对

Chiplet技术迈向标准化！Arm发布芯粒系统架构公开规范

豆包实时语音大模型正式上线！端到端语音对话 情商智商双高

蓝凌低代码应用，助力央国企、金融、制造、医院、高校等数智化

积极响应首发经济撬动新增长，雅迪华宇钠电技术荣登央视《中国首发》

美国莱斯大学终身教授钮凤林已回国：专注于地震成像技术开发与应用

三星Galaxy S25系列多模态感知树立人机交互新范式

革新你的移动交互方式三星Galaxy S25系列抢鲜预定中

Galaxy 全球新品发布会在即三星以全息影像秀展示手机交互新方式

京东物流发布JDX20“京鹊”物流无人机：最大载重10公斤速度98km/h

豆包实时语音大模型正式上线！端到端语音对话情商智商双高