站长之家 - 业界 2023-11-28 10:54

AWS语音转文本服务推出生成式AI技术 支持100种语言

要点:

  • 亚马逊的 AWS 公司宣布其语音转文本服务 Amazon Transcribe 现在由生成式人工智能(Generative AI)技术驱动,能够识别并转录来自100种语言的语音。
  • Amazon Transcribe 使用自监督算法通过数百种语言的数百万小时未标记音频数据进行训练,确保不同语言和口音的准确性。AWS强调在训练数据中平衡使用频率较低的语言,以确保它们与常用语言一样准确。
  • 提升语言识别技术不仅改进了Amazon Transcribe的准确性,还扩展到了其Call Analytics平台,该平台通过生成式人工智能模型对客户与代理之间的交互进行摘要,减少了报告创建的后续工作。

亚马逊的 AWS 公司宣布,其语音转文本服务 Amazon Transcribe 现在采用生成式人工智能技术,能够识别并转录来自100种语言的语音,相较于2022年底的79种语言有了显著的提升。据AWS称,Transcribe通过对超过100种语言的数百万小时未标记音频数据进行自监督训练,使用算法学习不同语言和口音的语音模式,且在训练中确保了频率较低的语言得到适当的平衡。此举不仅提高了Transcribe在多语种上的准确性,还推动了其Call Analytics平台的进步,该平台通过生成式AI模型总结了代理和客户之间的互动,降低了后续报告创建的工作量。

音频 人工智能

图源备注:图片由AI生成,图片授权服务商Midjourney

与此同时,AWS还宣布了对其Amazon Personalization产品的额外功能,该产品允许客户根据先前的活动向用户推荐产品或显示推荐列表。新功能Content Generation能够撰写与推荐列表主题相关的标题或电子邮件主题行。这进一步展示了AWS在利用AI技术提升其云服务产品功能方面的努力。

虽然Amazon Transcribe是AI驱动的语音转文本服务中的一员,但市场上也有其他竞争对手,例如Otter,该公司一直向消费者和企业提供AI转录服务,并于六月推出了摘要工具。同时,Meta也宣布正在开发一个生成式AI驱动的翻译模型,能够识别近100种语言。这表明了在AI技术领域的竞争激烈,各家公司都在努力提供更智能、准确的语音处理和转录服务。

总体而言,AWS通过利用生成式AI技术不断优化其产品,不仅提升了多语种语音识别的能力,还使其在联系中心领域的解决方案更加智能和高效。这反映了云服务领域的竞争趋势,即通过整合先进的AI技术,不断提升产品性能,以满足用户对更高水平服务的需求。

相关话题

推荐关键词

24小时热搜

查看更多内容

大家正在看