站长之家- 动态 2019-11-28T17:27:05 +08:00

百度大脑发布语音交互的新技术

PingWest品玩 11 月 28 日讯,百度大脑今天发布了基于复数CNN的语音增强和声学建模一体化的端到端识别技术。这项技术无需任何数字信号处理和语音识别学科的先验假设,复数CNN网络内存占用少于200K,可以内置到百度鸿鹄芯片内部。利用进场数据和纯粹依靠仿真数据,就可以获得足量的远场训练数据,整个过程是从原始多麦克信号到识别文字的一个端到端训练,整个优化过程只有字错误率两集一个优化准则。

百度语音首席架构师贾磊告诉PingWest品玩,“这项技术完成了数字信号处理和语音识别这两个领域的技术革命,用端到端一个声学模型,不需要任何领域行业的支持,解决两个跨领域的语音识别问题。”

“我们获得了比目前百度音箱现有产品,超过30%以上错误率的下降,即语音识别性能提升30%,这也是目前我们在国际业内同行看到的提升最大的,利用深度学习来完成语音交互的系统。”

会上,百度还发布基于百度鸿鹄语音芯片的硬件模组及开发板。其中,百度鸿鹄芯片模组以及百度鸿鹄芯片+RK3399 Android开发板将于 2020 年 1 月推出,百度鸿鹄芯片+ESP32 RTOS系统开发板&模组将于 2020 年 3 月推出。

推荐关键词

24小时热搜

查看更多内容

大家正在看