站长之家- 见闻 2020-10-23T16:28:38 +08:00

刘聪:科大讯飞直播场景下识别准确率已达85%

站长之家(ChinaZ.com)10月23日 消息:今天下午,科大讯飞AI研究院常务副院长刘聪发表了关于“构筑AI科技树,焕新美好新生活”的主题演讲。在演讲中,刘聪提到了如何保持AI技术不断突破以及如何实现应用落地的问题。

刘聪认为,在人工智能的应用场景中,最重要的一个就是语音交互。他称语音识别是讯飞的传统强项。近年来,科大讯飞陆续推出了方言识别、远场交互、多麦克风阵列等相关的功能,将语音听写从简单场景的可用做到了通用。

下一步,科大讯飞将持续深耕语音识别,去挑战更加复杂的场景,去实现从语音到声音,从单纯的文字内容的识别,到音频的全场景解析。例如直播场景这样有游戏、音乐以及笑声、掌声等各种音效嘈杂的背景下,如何有针对性地提取想要的声音。

面对这种复杂的环境,科大讯飞已经有一套全场景音频解析的整体方案。目前,可达讯飞在直播场景下的识别准确率已经从从60%提到了85%。未来,这些相关技术会在科大讯飞的开放平台、讯飞听见等上线。

推荐关键词

24小时热搜

查看更多内容

大家正在看

科大讯飞新一代语音识别系统揭秘

科大讯飞

索尼 科大讯飞-《讯飞听见》语音转写神器组合

科大讯飞发布会告诉你 原来直播还可以这么玩儿

当技术不再成为卖点 科大讯飞靠什么存活?

喜马拉雅与科大讯飞共推语音开放平台

科大讯飞刘庆峰:语音应用会三分天下

腾讯携手科大讯飞制胜语音互联网 支持方言

千亿市值后科大讯飞会走向何方