近日,标贝科技语音合成音色库又有新进展。针对智能客服场景,上新两个温和风格音色,适用于服务回访、业务咨询、产品介绍等细分业务场景。加上前不久的两款严肃客服音色,标贝科技已累计上线20多个风格迥异的男女客服发音人,全力加速企业客服中心的智能化转型。
此外,本次也同步上线两个泰语女声音色和法语女声音色,以满足更多细分场景的应用需求。
大模型驱动语音合成更“拟人”
传统的语音合成,因为技术上的限制,通常是采集标准的播音风格录音,以保证数据的稳定性。但是用它合成出来的声音也会过于标准、刻板,程序化,不接地气,容易让用户产生听觉疲劳。
在大模型爆发的背景下,作为生成式AI的重要课题,语音合成也取得了飞速发展。从引人入胜的有声小说,到准确无误的语音导航,再到丰富多彩的视频内容配音、问答流畅的虚拟数字人。人机语音交互场景越来越深入,声音体验的价值也被持续不断挖掘出来,富有情感表现力的拟人化语音合成成为当下的语音交互新态势。
超自然的大模型合成音色定制
结合当前智能语音产业需求现状,标贝科技持续在多风格、多情感语音合成能力上不断深耕细作,打造全链路语音定制方案。凭借其强大的语言理解和生成能力,为企业客户服务、陪伴式语音交互、沉浸式听书等场景,提供更自然、更准确的语音输出。
相较于传统语音合成效果,标贝科技语音合成音色定制方案依托语音大模型迁移学习和深度神经网络技术,具备更多的多样化和高延展优势。它能够比较准确捕捉到数千种音色的语调、情感等特征,让模型更好地复刻出真人说话时的犹豫停顿、变速等副语言习惯,在不同的应用场景下,轻松创造出无限的声音变化、情感和风格。
据评测,通过标贝科技语音合成音色定制方案输出的合成音色,在韵律表现、音色层次感、情感拟人化方面均有了大幅提升,MOS评分达到4.5以上,充满“人情味”。
此外,标贝科技语音合成音色定制方案可以支持客户自选声音及提供语料定制,并提供包括录音棚、录音师、韵律标注、MOS 评测任务等定制音色所需的全链路服务。有效降低音视频内容生产成本,让音频内容的生产和分发更为有效。
据中商情报网发布的《2023年全球及中国智能语音市场规模预测分析》,预计2023年我国智能语音市场规模将达到382亿元,同比增长34%。随着智能语音助手、自动语音响应系统等应用的广泛推广,智能语音市场前景广阔。
标贝科技语音合成音色定制方案已经在医疗、金融、数字人、泛娱乐等领域得到应用,助力中国银行、人民日报、湖南电信、恒生电子、清博智能等多家行业头部企业实现AI语音能力的应用与拓展。未来,标贝科技将继续依托语大模型底座支撑,通过不断的技术创新和产品迭代,推动AI语音技术落地至更多应用场景,为用户带来更加便捷、智能、人性化的语音交互体验。