站长之家用户 - 传媒 2022-05-20 15:57

四大功能上线!标贝科技语音识别服务硬核升级!

近两年,云计算、5G、大数据等核心技术的成熟,推动了人工智能实现跨越式发展。从智能家居,到智能客服,再到智慧教育和智慧医疗,“人工智能+”应用遍地开花。

人工智能的广泛应用,也带动中国智能语音产业迎来广阔的发展空间。据统计, 2020 年我国语音市场规模达到113. 96 亿元,在疫情催动下,同比增长19.2%。作为人机语音交互的重要入口,语音识别技术也变得越来越重要。

什么是语音识别技术?

语音识别技术,也被称为自动语音识别Automatic Speech Recognition(ASR),是将语音内容转换为文本的技术。在生活里,无论是智能音箱、手机语音助手、智能客服、车载语音助手等场景下,都会广泛用到语音识别技术。

而衡量一款语音识别产品是否优秀,关键是看识别的速度够不够快,以及识别的准确率够不够高。

作为国内领先的智能语音交互与AI数据服务商,标贝科技深耕语音交互领域多年,持续优化和打磨自身语音技术能力,提升用户体验。目前,标贝科技语音识别能力可以支持一句话识别、长语音识别、录音文件识别,支持中文、粤语、英文三种语言,不仅能保证毫秒级低延时识别速度,在安静环境下通用领域中文普通话识别率达97% 以上,英文识别率超过95%。

为了更好地满足企业开发者对语音识别在个性化场景的需求,推动AI语音交互应用落地。近日,标贝科技语音识别技术适应市场需求,全新上线时间戳、语速、音量及置信度功能。

功能01/ 时间戳

标贝语音识别时间戳功能是指,在将音频流转化为文字的同时,可以支持输出每个词组在音频中的时间位置,方便使用者在一段长音频中,快速精确的找到目标词组的位置。

应用场景

时间戳在流媒体和音视频领域应用较多,不仅影响音视频播放的画音同步,也能控制音视频播放,如快进、随机点播放等。通过标贝科技语音识别的时间戳功能,就可以快速生成电影或短视频实时字幕。

功能02/ 语速

标贝科技语音识别语速识别功能,即实现语音识别服务在将音频流转化为文字时,同步输出说话人的平均语速。

应用场景

在朗读竞赛的测试练习中,用户可以通过标贝科技语音识别的语速识别功能,针对自己阅读的语速进行检测,分析是否过快或者过慢,然后在标准读音的指导下进行对应的反复练习。

功能03/ 音量

标贝科技语音识别音量识别功能,即语音识别服务在将音频流转化为文字时,同步输出音频的平均音量。

应用场景

对于客服通话录音或者视频配音的音频文件进行质检,人工处理不仅速度慢,标准也很难统一,基于标贝科技语音识别的音量识别功能,即可快速有效的校验音频音量是否满足当前场景的质量要求。

功能04/ 置信度

标贝科技语音识别置信度功能是指,语音识别服务在将音频流转化为文字时,可以输出当前词组的置信度,语音识别模型会在所有候选结果中,选取置信度高的词组作为输出结果。

应用场景

在人机对话系统中,如果机器没有听清或没有听懂用户的某句话,可能会给出无关回答或请求用户重新输入。通过标贝科技语音识别置信度功能,可以计算用户输入语音的置信度值,当置信度值低于某个阈值时,机器才会开启输入重复验证,这样既可以避免机器某些无用的验证要求,又可以更为准确地对用户输入做出回答,有效地缩短对话时间,提升用户体验。

随着智能语音技术与语音助手、智能终端设备等电子产品的深入融合发展,人机交互体验得到大幅提升,加之用户的认知和习惯得以培养,对智能设备的需求持续增加。标贝科技将继续深挖智能语音交互领域,用更前沿的技术创造更好的产品体验,帮助企业创造新的竞争力。

相关话题

特别声明:以上内容(如有图片或视频亦包括在内)均为站长传媒平台用户上传并发布,文章为企业广告宣传内容,本平台仅提供信息存储服务,对本页面内容所引致的错误、不确或遗漏,概不负任何法律责任,相关信息仅供参考。任何单位或个人认为本页面内容可能涉嫌侵犯其知识产权或存在不实内容时,可及时向站长之家提出书面权利通知或不实情况说明,并提供身份证明、权属证明及详细侵权或不实情况证明(点击查看反馈联系地址)。本网站在收到上述法律文件后,将会依法依规核实信息,沟通删除相关内容或断开相关链接。

推荐关键词

24小时热搜

查看更多内容

大家正在看