划重点:
🚀 Cohere推出Embed V3,升级嵌入模型,旨在为企业构建LLM应用。
🔎 Embed V3提供更精确的语义信息匹配,降低企业LLM应用的运营成本。
🌐 该模型支持多语言、高级检索、重排等功能,优化大型语言模型应用。
站长之家(ChinaZ.com)11月3日 消息:加拿大多伦多的人工智能初创公司Cohere已经发布了Embed V3,这是其嵌入模型的最新版本,旨在为语义搜索和大型语言模型(LLM)应用提供支持。嵌入模型将数据转换为数字表示,通常称为“嵌入”,由于大型语言模型的崛起以及它们在企业应用中的潜在用途,嵌入模型备受关注。
Embed V3与OpenAI的Ada以及各种开源选项竞争,承诺提供卓越的性能和增强的数据压缩功能。这一进展旨在降低企业LLM应用的运营成本。
嵌入模型在各种任务中起着关键作用,包括检索增强生成(RAG),这是企业领域大型语言模型的一个关键应用。RAG使开发人员能够在运行时为LLM提供上下文,通过从用户手册、电子邮件和聊天记录、文章或其他不属于模型原始训练数据的来源中检索信息。为了执行RAG,公司必须首先创建其文件的嵌入,并将其存储在矢量数据库中。每当用户查询模型时,AI系统计算提示的嵌入并将其与存储在矢量数据库中的嵌入进行比较。然后,它检索与提示最相似的文档,并将这些文档的内容添加到用户的提示语言中,为LLM提供必要的上下文。
RAG可以帮助解决LLM的一些挑战,包括获取最新信息的困难和生成虚假信息,有时被称为“幻觉”。然而,与其他搜索系统一样,RAG的一个重要挑战是找到与用户查询最相关的文档。先前的嵌入模型在嘈杂的数据集上遇到了困难,其中一些文档可能没有正确抓取或不包含有用信息。
Cohere的Embed V3通过提供更准确的语义信息匹配,展现出在将文档与查询匹配方面的卓越性能。Embed V3在标准用于评估嵌入模型性能的基准测试中胜过了其他模型,包括OpenAI的ada-002。
Embed V3提供不同嵌入大小的版本,还包括一个多语言版本,可以将查询与不同语言的文档匹配。此外,Embed V3可以配置为各种应用,例如搜索、分类和聚类。
Embed V3还在高级RAG查询等高级用例中展现出卓越性能。当用户的提示包含多个查询时,模型必须单独识别这些查询,并检索与每个查询相关的文档。这通常需要多个解析和检索步骤。Embed V3的能力在其前10个检索文档中提供更高质量的结果,减少了向矢量数据库发出多个查询的需求。
Embed V3还改进了重新排名,这是Cohere几个月前添加到其API中的一个功能。重新排名允许搜索应用程序根据语义相似性对现有搜索结果进行排序。Embed V3特别适用于处理涉及多个方面的查询和文档,这是由于其设计而让其他嵌入模型面临困难的问题。Embed V3还有助于降低运行矢量数据库的成本。该模型经历了一个包括特殊的压缩感知训练方法的三阶段培训过程。这种兼容性显著降低了矢量数据库的成本,同时保持高达99.99%的搜索质量。
Cohere的Embed V3提供了一种强大的工具,用于帮助企业构建LLM应用,提高性能并降低运营成本,为语义搜索和大型语言模型的应用带来了新的可能性。
Cohere网址:https://top.aibase.com/tool/cohere