站长之家用户 - 传媒 2023-02-28 10:47

思必驰:人工智能发展进入“多元化”时代

就在《太空歌剧院》引领AI绘画异军突起,人们几乎淡忘AI写作之时,仅仅相隔两个月,ChatGPT横空出世了。不难看出,当前人工智能已迅速席卷到生产、生活等各个领域,并在全世界燃起燎原之火。

AI语音作为近几年发展最为成熟的人工智能技术方向,也逐渐成为行业数字化不可或缺的“增长基石”。有着先发优势的AI语音行业,对比其他AI赛道无疑更为成熟,但同时也意味着,行业发展将会走向细分化,业内竞争亦将愈趋激烈。

专业人士预测,纵观过往AI语音发展历程,下阶段,行业或将往以下四方面纵深发展。

一、更加自然的语音合成:AI语音将更加自然地模仿人类语音,具备更多的情感色彩和语调变化;二、多模态输入:AI语音将更多地结合其他感官输入,例如图像、视频和手势,实现更加智能化的交互体验;三、跨语言交互:AI语音将支持更多语言的交互,为全球用户提供更为普及的服务;四、个性化服务:AI语音将更好地理解用户需求,提供更加个性化的服务和推荐。

作为人工智能应用落地代表性的厂商之一,思必驰依托前瞻性的发展眼光, 早已在上述领域作有布局。

例如在语音合成方面,基于深度学习技术和定制情感录音,思必驰打造出发音人音色定制平台,不仅能快速定制音色,更能合成高音质、多情感的音色,可呈现“高兴、抱歉、撒娇、中性”等多种情感声音,在韵律表现、声音层次感、情感表达等方面做到更加接近真人情感化表达的语音效果。

在多模态输入方面,思必驰在业界率先发布了全双工对话架构,形成了独特的闭环人机对话系统构建的底层综合技术优势,与国际主流先进技术相比,取得声纹验证、语音分离等指标的显著提升。

在跨语言交互方面,对于有多语言混合需求的集成商,思必驰运用多混合识别模型,在完成识别特定方言的同时,还可识别普通话,最多支持十多种方言的识别。例如,中川混读模型可以同时识别四川话和普通话。目前,思必驰提供基于云+端混合引擎的连续语音识别,支持四川话、粤语、上海话、闽南语、陕西话、山东话等十几种方言识别。

在个性化服务方面,早前,思必驰便推出了个性化语音合成复刻技术、标注训练一体化模型自学习工具、本地唤醒识别自助定制系统、端云解耦的柔性对话系统组合更新框架等多项基础技术和工具,运用快速定制化能力赋能企业实现智能化升级。

例如思必驰智云译芯(CUI)平台,通过界面化的方式快速编译SDK,助力家居、家电厂商快速打造离线低功耗语音芯片,让产品更智能。在该平台,家居及家电厂商可通过平台的自动化编译功能,短时间内即可输出配套的SDK和固件,将固件烧录至芯片,赋予产品语音交互能力。

思必驰表示,现阶段想要从AI语音领域突围,在聚焦上述领域的同时,要同时优化用户体验:针对用户需求,提供更为智能化、便捷化的产品和服务;拓展应用场景:AI语音技术将在各个领域得到应用,企业可以积极探索新的应用场景,拓展业务领域。

ChatGPT源码推荐:小狐狸ChatGPT付费创作系统完全开源源码

相关话题

特别声明:以上内容(如有图片或视频亦包括在内)均为站长传媒平台用户上传并发布,本平台仅提供信息存储服务,对本页面内容所引致的错误、不确或遗漏,相关信息仅供参考。任何单位或个人认为本页面内容可能涉嫌侵犯其知识产权或存在不实内容时,可及时向站长之家提出书面权利通知或不实情况说明,并提供身份证明、权属证明及详细侵权或不实情况证明(点击查看反馈联系地址)。本网站在收到上述法律文件后,将会依法依规核实信息,沟通删除相关内容或断开相关链接。

推荐关键词

24小时热搜

查看更多内容

大家正在看