向量数据库再迎新变化!头部公司产品更新引热议,开启大模型落地新范式


被大模型带火的向量数据库赛道再迎新变化! 

近期,素有“大模型记忆体”“大模型知识库”之称的向量数据库引起开发者热议,起因是向量数据库公司 Zilliz 发布了其数据库云服务 Zilliz Cloud 的重大产品更新。 

不过是一家公司的产品更新,能在赛道掀起多大的浪花?别说,在向量数据库这个赛道,Zilliz 还真就有四两拨千斤的能力。跟大家科普一下,Zilliz 是一家专注于研发面向 AI 应用的向量数据库系统的公司,早在 2019 年便推出了全球首个向量数据库产品 Milvus。它是 GitHub 上最流行的开源向量数据库,在 GitHub 上获得了超过 2 万颗 star,在全球拥有超过 1000 家企业用户。而其商业化产品 Zilliz Cloud 则在 Milvus 的基础上提供开箱即用的向量数据库服务。 

业界纷纷好奇,在大模型和云原生技术的加持下,向量数据库究竟可以快到何种程度?应用到何种程度? 

带着这些疑问,我们和 Zilliz 的创始人兼首席执行官星爵聊了聊,从向量数据库之于大模型的意义谈到云原生向量数据库 Zilliz Cloud 的能力圈,再到向量数据库赛道未来的发展趋势…… 

我们发现,对于 Zilliz 而言,此次更新意味着云原生向量数据库的性能升级;对向量数据库赛道而言,它标志着 Zilliz Cloud 在普及先进的向量数据库解决方案方面迈出了重要的一步,是 AI 技术民主化的真实写照。 

同时,星爵表示,大模型的出现给人工智能带来了新的计算范式 —— the CVP Stack。其中,“C”代表大模型( ChatGPT 等 ),负责向量计算;“V”代表向量数据库( Vector Database ),负责向量存储;“P”代表 Prompt 工程,负责向量交互。 

星爵相信,随着大模型技术的发展,向量数据库将在 AI 时代扮演极为重要的角色。它可以最大限度地发挥大模型威力的同时保护数据隐私,实现更丰富的智能应用。因此,Zilliz 将继续致力于通过 Milvus 和 Zilliz Cloud 为开发者提供易于使用且极具性价比的向量数据库服务,持续推出创新产品,满足开发者的多样需求。

以下是星爵的访谈全文:

向量数据库是 LLM 的数据基础设施

Q:最近向量数据库很火,星爵能不能简单科普一下? 

星爵:向量数据库是一种为了高效存储和索引由 AI 模型产生的向量嵌入 (embedding) 数据而专门设计的数据库。在传统的关系型数据库中,数据通常以表格的形式存储,而在向量数据库中,数据以向量的形式存储。向量( embedding )是一组数值,可以表示一个点在多维空间中的位置。向量数据库非常擅长处理大量的高维 embedding 数据,这种数据在机器学习和深度学习应用中很常见。 

Q:在最近半年里,向量数据库被广泛应用于大模型领域。向量数据库在大模型领域具体有哪些应用? 

星爵:诸如 GPT、Bard、Claude 和 LLaMA 这样的大模型可以产生海量向量嵌入数据来表达复杂的语义关系,但模型本身的存储空间有限,无法持久保存这些数据。向量数据库就像一块外置的记忆块,可以长期存储这些数据,供模型随时调用。 

向量数据库在 LLM 领域的应用主要可以分为以下六类:

1. 管理私有数据和知识库。开发者可以方便高效地将自己的领域数据集或者私有数据集转换成向量格式,让大模型直接操作,而无需将这些数据暴露给模型训练方,有效保护了数据隐私和产权;

2. 为大模型提供实时数据更新。通过向量数据库可以为大模型提供实时的数据更新,解决大模型“胡言乱语”的问题,而无需频繁重训模型。这比直接 finetune 模型的成本低很多;

3. 实现大模型的个性化和增强。开发者可以在向量数据库中添加上下文和自己的数据来扩展大模型的感知能力,实现个性化应用;

4. 提供智能体的记忆。智能体是大模型的一个新兴应用场景,用于构建具有独立智能的虚拟人物、虚拟代理甚至人形机器人。向量数据库不仅可以帮助智能体记忆其感知的历史数据和上下文,帮其做出智能决策,还能使其根据长期记忆来实现自我演进;

5. 保存大模型的处理结果。向量数据库可以持久保存大模型处理过的数据,进行离线分析和挖掘。而不像大模型那样,用过即弃。比如说,开源项目 GPTCache 可以将大模型的查询结果缓存至向量数据库,避免重复计算,提高查询效率,这有点像 CDN 和 Redis 对网站数据的作用;

6. 构建更复杂的 AI 系统。在很多场景下,我们需要将多个大模型和向量数据库串联,实现更强大的功能。其中,多个大模型甚至是多模态模型共同负责处理语义,向量数据库负责数据流转。 

对于大模型应用开发者来说,向量数据库是一个非常重要的基础设施,可以在最大限度发挥大模型威力的同时保护数据隐私,实现更丰富的功能。LLM 和向量数据库共同推动 AIGC 的发展,二者缺一不可。

全面拥抱大模型

Q:我们了解到,Zilliz Cloud 在两周前于硅谷发布了全面的产品更新和升级。这次产品升级背后的动机是什么? 

星爵:我们的出发点是 all-in 大模型应用开发

在过去的几年里,我们的开源产品 Milvus 和商业产品 Zilliz Cloud 被广泛应用于计算机视觉、NLP、推荐系统、搜索引擎、自动驾驶和生物制药等领域。在过去的半年里,向量数据库经历了它的 iPhone 时刻,数百万 LLM 应用开发者涌入,LLM 应用开发成为了向量数据库的杀手级应用场景。众多的 LLM 应用开发者给我们带来了大量新兴的需求,我们决定拥抱这些变化,为 LLM 应用开发提供更全面、更便利的支撑。 

Q:能不能具体介绍下 Zilliz Cloud 做了哪些更新和升级? 

星爵:首先,引入了对 RESTful API 的全面支持。我们看到新进的 LLM 开发者大多具有丰厚的 Web 应用和移动应用开发背景,他们熟悉基于 RESTful API 将多个服务的能力串起来打造强大的应用。有了 RESTful API,开发者可以便捷地将 「LLM + 向量数据库 + 提示词」 三者连接起来,打造 LLM 应用程序。我们将这种新开发范式称为 CVP Stack,能极大提高开发效率。举个例子说,明道云的一位工程师使用 RESTful API 一天就完成了 Zilliz Cloud 和对方平台的整合。 

其次,提供了动态 schema。此前向量数据库采用静态 schema 的方式,需要开发者在建表时根据业务定义数据的 schema,这对于大型企业的成熟业务而言是一种常见的处理方式。然而,当下 AIGC 应用多处于早期快速迭代阶段,面向业务效果,需要频繁调整向量数据库内的字段,对于这类需求,反复重建 schema 结构以及频繁的数据重导入会严重影响产品的迭代速度。为此我们引入了动态 schema,支持用户根据开发需要动态灵活地进行数据处理。 

再者,新增了对 JSON 数据类型的支持。JSON 是目前最流行且最灵活的数据表示方式之一,被广泛地应用于应用程序开发中。我们将 MongoDB 的基础能力搬进了向量数据库,用户在 Zilliz Cloud 上可以将 JSON 与 embedding 这两种超强能力相结合,实现基于 JSON 与 embedding 向量的混合数据表示和处理。 

另外,我们还引入了 Partition Key ,支持基于 Partition Key 的高效数据过滤;增加了组织和角色的概念,支持基于 Role-Based Access Control (RBAC) 的多粒度访问控制;增加了全面的 LLM 生态支持,深度整合了 OpenAI、Claude、Cohere、LLaMA、Bard、Dolly、LangChain、LlamaIndex 和 Semantic Kernel 等热门项目。 

Q:我们看到 Zilliz Cloud 之前只提供专有集群一种产品,此次新增了 Serverless 和云上私有部署两种产品。这背后的原因是什么? 

星爵:Zilliz Cloud 面向不同阶段的用户提供多种用户计划。

基于 Serverless 的入门计划为每位用户提供一个免费的 Serverless 实例,开箱即用,可支持百万条数据规模的向量检索,适合个人开发者和小型开发团队使用。 

专有集群产品面向大型开发团队和企业,专注高性能、高可用、高可扩展性、智能运维和优化、数据安全以及敏捷技术支持等企业级特性,并提供性能型、容量型、经济型三类实例类型,满足企业不同维度的业务需求。 

自托管计划允许用户在其虚拟私有云( VPC )上部署我们的向量数据库服务,提供完全控制,它是注重隐私、数据安全和合规的大型企业的理想选择。 

通过提供不同形态的产品,我们希望满足 LLM 开发者在不同发展阶段的需要,让每一个开发者、每一个开发团队、每一个企业都能方便地使用向量数据库服务,加速实现 AI 数据基础软件的民主化。

向量数据库市场的竞争和趋势

Q:今年以来,多家向量数据库初创公司获得了大额融资,一些大厂也纷纷把向量数据库的研发列入日程。你怎么看待日益升温的竞争? 

星爵:竞争意味着市场确认和机会。竞争的加剧说明向量数据库的价值得到了市场的广泛认可,其市场机会和潜力得以证实。与此同时,激烈的竞争也在一定程度上推动了技术的进步,这对消费者和整个行业而言都大有裨益,是一件实打实的好事。 

当然,这种竞争环境迫使公司更加关注客户的需求。这意味着我们必须密切关注市场趋势,并适应这些变化,以提供客户真正需要的解决方案。我们必须不断创新和优化我们的产品和服务。这对 LLM 开发者和整个行业来说都是有益的。我相信在一个健康的生态系统中,有多个玩家是至关重要的。这为开发者和客户提供了选择,也为行业设置了标准。 

在 Zilliz,我们作为向量数据库行业的先行者和开拓者,尤其欢迎这种竞争。我们将继续致力于推动向量数据库技术的发展,并与其他参与者一起,为用户提供最先进的工具和服务。 

Q:刚才你提到了行业标准,在关系型数据库领域有 TPC-C 和 TPC-H 这样的 benchmark,向量数据库领域有类似的 benchmark 么? 

星爵:目前还没有标准的 benchmark,这给开发者和企业在向量数据库产品对比和选择时造成了很多的疑惑和困难。 

为此,我们近期开放了一套开源的向量数据库评测工具 VectorDBBench (https://github.com/zilliztech/VectorDBBench)。该工具包含一套标准化数据集,结合多个典型场景,覆盖数据插入与索引构建、向量查询、混合查询、数据容量等多个能力维度,同时支持用户自定义的数据集与测试场景。我们欢迎开发者们参与到这个开源 benchmark 的开发和迭代中来,希望 VectorDBBench 能发展成为像 ClickBench 这样的行业标准。 

Q:你认为向量数据库赛道未来竞争的核心是什么? 

星爵:向量数据库作为一款数据库产品,“更大更快更便宜”是未来发展的核心趋势。更大是指能处理更大的数据量,这意味着支持百亿条数据甚至更高的可扩展性;更快是指更高的性能,包括毫秒级的响应时间和高达数万的 QPS;更便宜是指更少的资源消耗更高的性价比,在相同资源消耗的情况下提供更强大的性能。 

我们的 Zilliz Cloud 基于 Milvus 开源项目,这是全球现在唯一一款真正分布式的向量数据库系统,能提供数百亿条向量数据的毫秒级查询。得益于 Milvus 的云原生架构,Zilliz Cloud 高效地实现了多租户能力,在相同的实例配置下,性能远超其他竞品。举个例子说,在基于 VectorDBBench 的评测中,Zilliz Cloud 性能是 Pinecone 的两倍以上,综合性价比超过 Pinecone 三倍以上。

国内云产品计划

Q:Zilliz Cloud 现在已经支持了 AWS 和 GCP,有没有计划支持国内云平台? 

星爵:我们计划在今年 7 月上旬推出国内的云服务产品,首期预计会支持阿里云、百度云、腾讯云和金山云,并将逐步覆盖国内更多的云厂商。Zilliz Cloud 国内云产品定价相比海外产品将会有较大幅度的下调,致力于为国内用户提供最高性价比的全托管向量数据库服务。

Zilliz Cloud:  

https://zilliz.com/cloud 

Milvus: 

https://milvus.io 

https://github.com/milvus-io/milvus 

VectorDBBench: 

https://github.com/zilliztech/VectorDBBench 

GPTcache:

https://github.com/zilliztech/GPTCache

更多阅读

#投 稿 通 道#

 让你的文字被更多人看到 

如何才能让更多的优质内容以更短路径到达读者群体,缩短读者寻找优质内容的成本呢?答案就是:你不认识的人。

总有一些你不认识的人,知道你想知道的东西。PaperWeekly 或许可以成为一座桥梁,促使不同背景、不同方向的学者和学术灵感相互碰撞,迸发出更多的可能性。 

PaperWeekly 鼓励高校实验室或个人,在我们的平台上分享各类优质内容,可以是最新论文解读,也可以是学术热点剖析科研心得竞赛经验讲解等。我们的目的只有一个,让知识真正流动起来。

📝 稿件基本要求:

• 文章确系个人原创作品,未曾在公开渠道发表,如为其他平台已发表或待发表的文章,请明确标注 

• 稿件建议以 markdown 格式撰写,文中配图以附件形式发送,要求图片清晰,无版权问题

• PaperWeekly 尊重原作者署名权,并将为每篇被采纳的原创首发稿件,提供业内具有竞争力稿酬,具体依据文章阅读量和文章质量阶梯制结算

📬 投稿通道:

• 投稿邮箱:hr@paperweekly.site 

• 来稿请备注即时联系方式(微信),以便我们在稿件选用的第一时间联系作者

• 您也可以直接添加小编微信(pwbot02)快速投稿,备注:姓名-投稿

△长按添加PaperWeekly小编

🔍

现在,在「知乎」也能找到我们了

进入知乎首页搜索「PaperWeekly」

点击「关注」订阅我们的专栏吧

·

·

本文链接:https://my.lmcjl.com/post/18721.html

展开阅读全文

4 评论

留下您的评论.