3月23日-24日,聚焦全球开发者精英,由上海市人工智能行业协会(SAIA)主办的2024全球开发者先锋大会(2024GDC)在上海举办。Zilliz 作为向量数据库赛道的领军者,受邀参与了此次活动,不仅在不同形式的活动中进行了3场主题分享,还与百川智能、Dify.AI、Moonshot AI 等公司一同在「大模型展示及研讨专区」的产品互动展台,与来自各地的开发者进行互动。
据悉,本次大会由世界人工智能大会组委会、上海市经济和信息化委员会、上海市徐汇区人民政府、中国(上海)自由贸易试验区临港新片区管理委员会共同指导,上海市人工智能行业协会联合上海人工智能实验室、上海临港经济发展(集团)有限公司、开放原子开源基金会共同主办。
全球开发者先锋大会(GDC)缘起总.理在达沃斯世界经济论坛打 CALL 的世界人工智能大会(WAIC),作为 WAIC 聚焦科技和人才力量的重要板块,GDC 已发展成为全球开发者的盛大节日、顶 尖技术趋势的风向标。向量数据库赛道正是 AIGC 时代的重要技术风向标,Zilliz 在现场向全球的开发者展示了其在顶 尖向量数据库技术的多重探索。
Zilliz 资 深解决方案架构师沈亮以《百亿级向量数据库架构创新与优化之路》的主题进行了分享。他表示,向量数据库最早诞生于2019年,由 Zilliz 公司推出并开源了全球首 款向量数据库 Milvus。在那个时期,向量数据库的功能相对比较简单,主要是基于向量检索库 Faiss 的基础上,封装了远程过程调用(RPC)接口,并支持了基于 Write-Ahead Logging(WAL)的持久化能力。相比于传统的向量检索方法,Milvus1.0的最 大意义在于解耦了业务逻辑、模型和数据存储这三者之间的紧密关联。这意味着应用开发者不再需要关注底层基础设施的维护工作,这些工作包括但不限于集群的部署、数据的持久化和数据的迁移等。因此,Milvus1.0为许多用户提供了从传统烟囱式的人工智能开发模式向大模型时代。
随着大模型技术的蓬勃发展,向量数据库开始进入2.0时代,更多的个人开发者涌入赛道,对向量数据库的关注也逐渐迁移到开发效率、部署简单以及面向大模型加强场景的功能需求。向量数据库绝不仅仅是用来进行简单的向量检索,要想真正提升开发者的开发效率和使用成本,需要系统开发者深入理解硬件、存储、数据库、AI、高性能计算、分布式系统、编译原理、云原生等,以确保其稳定性、性能和易用性。在此基础上,Zilliz 推出了Zilliz Cloud,可提供全托管的 SaaS 及 BYOC 向量数据库服务,具备深度优化、开箱即用的 Milvus 体验。使用 Zilliz Cloud 可以轻松构建百亿级向量数据库,分钟级部署和扩展向量搜索服务,并由全球最专业的向量数据库团队提供运维、优化、及综合支持。
Zilliz 开发者生态及市场运营负责人 Jerry 首先进行了主题为《走进向量数据库和 RAG ——让 LLMs 停止幻觉》的分享。Jerry 表示,过去一年,RAG 在技术层面发展迅速,为向量数据库赛道添了一把火。RAG 和向量数据库的结合,能够有效解决幻觉、时效性差、专业领域知识不足等阻碍大模型应用的核心问题。
具体来看,大模型的局限性包括:其一,缺乏领域特定信息:LLM 仅基于公开数据集训练;缺乏领域特定信息或专有信息等非公开数据。其二,容易产生幻觉:LLM 只能根据其现有数据提供信息和答案;如果超过该范围,LLM 会提供错误或捏造的信息。其三,无法获取最 新信息:LLM 训练成本十分高昂,无法及时更新其知识库。其四,不变的预训练数据:LLM 使用的预训练数据可能包含过时或不正确的信息,且这些数据无法更正或删除。
向量数据库可有效针对解决上述问题,例如针对缺乏领域特定信息的问题,可利用向量数据库建立知识库,拓展认知边界;针对无法获取最 新信息的问题,可以利用向量数据库为大模型建立记忆、及时更新。
在此基础上,RAG 技术栈应运而生,通过 LLM、向量数据库和提示词的相互配合,让 LLM 停止幻觉。此外,Jerry 还介绍了向量数据库的其他应用场景,包括图片搜索、视频搜索、文本搜索、数据去重、跨模态搜索、推荐系统、问答系统、版权保护、网络安全、AI 制药等。
在《2024年,重新再来说说关于向量数据库的那些事儿》主题分享中,Jerry 回顾了向量数据库从小众赛道到爆火的全过程,并提及了外界对于向量数据库和 RAG 的疑问。他表示,大模型技术正在改变世界,但无法改变世界的运行规律。对于大模型而言,长期记忆的重要性也将持续存在。AI 应用的开发者一直在追求查询质量和成本之间的美好平衡。当大型企业将生成式人工智能投入生产时,需要在控制成本的同时保持最 佳的响应质量。在此情况下,RAG 技术和向量数据库依然是实现这一目标的重要工具。
最后,Jerry 提到,Zilliz 最近面向 AI 初创企业推出了一项扶持计划,预计提供总计1000万元的 Zilliz Cloud 抵扣金,致力于帮助 AI 开发者构建有效的非结构化数据管理系统,助力打造高质量 AI 服务与运用,加速产业落地。届时将为全球的 AI 初创团队提供资源、技术、市场推广、销售等全方位的支持,符合要求的团队可获得独 家资源与支持。欢迎各位开发者访问 Zilliz 中文官网首页点击 Zilliz AI 初创计划,与 Zilliz 一起共建 AI 生态!