给大模型持久记忆!GitHub 2 万星向量数据库云服务升级,国内云产品 7 月上线
2023-06-27 16:13:04来源:ZAKER科技
一个在 GitHub 上标星超 2 万的数据库,究竟是什么来头?
(资料图片)
原来,这正是最近大火的向量数据库之一、首个在这一赛道开源产品Milvus。
自大模型爆火以来,它的关注度也一路飙升,官方显示,目前 Milvus 已经拥有超过 1000+ 企业用户。
而就是这么一个 GitHub 上最流行的向量数据库,背后公司 Zilliz 已经完成了1.13 亿美元融资。Zilliz 专注于研发面向 AI 应用的向量数据库系统,旗下有 Milvus、Zilliz Cloud 等产品,目的是为开发者提供易用性强、性价比高的向量数据库服务。
这两天,Zilliz Cloud发布 2.0 重磅更新,更是带起一波业界对向量数据库的讨论热潮。
大模型技术进展日新月异,向量数据在风口浪尖上也起起伏伏,不少人说它是给 AI 提供长期记忆的必备基建,也有人认为提高大模型上下文长度才是未来方向。
这不,还有谷歌工程师专门为此摆摊舌战群儒。
众说纷纭之下,情况究竟如何?不如来听听向量数据库一线从业者怎么说。我们联系到了 Zilliz 创始人兼 CEO星爵,希望和他聊一聊向量数据库对于这一轮 AI 浪潮的意义,以及它背后变革的方式。
星爵认为,大模型的出现给 AI 带来了新的计算范式CVP Stack,向量数据库是不可或缺的关键:
其中,"C" 代表大模型(ChatGPT)负责向量计算;"V" 代表向量数据库(vector database),负责向量存储;"P" 代表 Prompt 工程,负责向量交互。
不仅如此,他还系统解答了在大模型发展过程中,向量数据库具体起到的作用,以及作为向量数据库头部公司的 Zilliz,又要如何应对这一轮 AI 变革浪潮。在不更改原意的基础上,量子位对与星爵的交流内容进行了整理,希望能为大家带来一些思考与启发。
大模型的数据基础设施
提问:最近向量数据库很火,能不能先简单科普一下?
星爵:向量数据库是一种为了高效存储和索引 AI 模型产生的向量嵌入(embedding)数据而专门设计的数据库。
在传统的关系型数据库中,数据通常以表格的形式存储,而在向量数据库中,数据以向量的形式存储。向量(embedding)是一组数值,可以表示一个点在多维空间中的位置。向量数据库非常擅长处理大量的高维 embedding 数据,这种数据在机器学习和深度学习应用中很常见。
提问:在最近半年里,向量数据库被广泛应用于大模型领域。向量数据库在大模型领域具体有哪些应用?
星爵:诸如 GPT、Bard、Claude 和 LLaMA 这样的大模型可以产生海量向量嵌入数据来表达复杂的语义关系,但模型本身的存储空间有限,无法持久保存这些数据。
向量数据库就像一块外置的记忆块,可以长期存储这些数据,供模型随时调用。向量数据库在 LLM 领域的应用主要可以分为以下几类 :
1、管理私有数据和知识库
开发者可以方便高效地将自己的领域数据集或者私有数据集转换成向量格式,让大模型直接操作,而无需将这些数据暴露给模型训练方,有效保护了数据隐私和产权。
2、为大模型提供实时数据更新。
通过向量数据库可以为大模型提供实时的数据更新,解决大模型 " 胡言乱语 " 的问题,而无需频繁重训模型。这比直接 fine-tune 模型的成本低很多。
3、实现大模型的个性化和增强。
开发者可以在向量数据库中添加上下文和自己的数据来扩展大模型的感知能力,实现个性化应用。
4、提供智能体的记忆。
智能体是大模型的一个新兴应用场景,用于构建具有独立智能的虚拟人物、虚拟代理甚至人形机器人。向量数据库不仅可以帮助智能体记忆其感知的历史数据和上下文,帮其做出智能决策,还能使其根据长期记忆来实现自我演进。
5、保存大模型的处理结果。
向量数据库可以持久保存大模型处理过的数据,进行离线分析和挖掘。而不像大模型那样,用过即弃。比如说,开源项目 GPTCache 可以将大模型的查询结果缓存至向量数据库,避免重复计算,提高查询效率,这有点像 CDN 和 Redis 对网站数据的作用。
6、构建更复杂的 AI 系统。
在很多场景下,我们需要将多个大模型和向量数据库串联,实现更强大的功能。其中,多个大模型甚至是多模态模型共同负责处理语义,向量数据库负责数据流转。
对于大模型应用开发者来说,向量数据库是一个非常重要的基础设施,可以在最大限度发挥大模型威力的同时保护数据隐私,实现更丰富的功能。LLM 和向量数据库共同推动 AIGC 的发展,二者缺一不可。
全面拥抱大模型
提问:我们了解到,Zilliz Cloud 在两周前于硅谷发布了全面的产品更新和升级。这次产品升级背后的动机是什么?
星爵:我们的出发点是all-in 大模型应用开发。
在过去的几年里,我们的开源产品 Milvus 和商业产品 Zilliz Cloud 被广泛应用于计算机视觉、NLP、推荐系统、搜索引擎、自动驾驶和生物制药等领域。在过去的半年里,向量数据库经历了它的 iPhone 时刻,数百万 LLM 应用开发者涌入,LLM 应用开发成为了向量数据库的杀手级应用场景。众多的 LLM 应用开发者给我们带来了大量新兴的需求,我们决定拥抱这些变化,为 LLM 应用开发提供更全面、更便利的支撑。
提问:能不能具体介绍下 Zilliz Cloud 做了哪些更新和升级?
星爵:首先,引入了对 RESTful API 的全面支持。我们看到新进的 LLM 开发者大多具有丰厚的 Web 应用和移动应用开发背景,他们熟悉基于 RESTful API 将多个服务的能力串起来打造强大的应用。有了 RESTful API,开发者可以便捷地将「LLM+ 向量数据库 + 提示词」三者连接起来,打造 LLM 应用程序。我们将这种新开发范式称为 CVP Stack,能极大提高开发效率。举个例子说,明道云的一位工程师使用 RESTful API 一天就完成了 Zilliz Cloud 和对方平台的整合。
其次,提供了动态 schema。此前向量数据库采用静态 schema 的方式,需要开发者在建表时根据业务定义数据的 schema,这对于大型企业的成熟业务而言是一种常见的处理方式。然而,当下 AIGC 应用多处于早期快速迭代阶段,面向业务效果,需要频繁调整向量数据库内的字段,对于这类需求,反复重建 schema 结构以及频繁的数据重导入会严重影响产品的迭代速度。为此我们引入了动态 schema,支持用户根据开发需要动态灵活地进行数据处理。
再者,新增了 JSON 数据类型的支持。JSON 是目前最流行且最灵活的数据表示方式之一,被广泛地应用于应用程序开发中。我们将 MongoDB 的基础能力搬进了向量数据库,用户在 Zilliz Cloud 上可以将 JSON 与 embedding 这两种超强能力相结合,实现基于 JSON 与 embedding 向量的混合数据表示和处理。
另外,我们还引入了 Partition Key,支持基于 Partition Key 的高效数据过滤;增加了组织和角色的概念,支持基于 Role-Based Access Control(RBAC)的多粒度访问控制;增加了全面的 LLM 生态支持,深度整合了 OpenAI、Claude、Cohere、LLaMA、Bard、Dolly、LangChain、LlamaIndex 和 Semantic Kernel 等热门项目。
提问:我们看到 Zilliz Cloud 之前只提供专有集群一种产品,此次新增了 Serverless 和云上私有部署两种产品。这背后的原因是什么?
星爵:Zilliz Cloud 面向不同阶段的用户提供多种用户计划。
基于 Serverless 的入门计划为每位用户提供一个免费的 Serverless 实例,开箱即用,可支持百万条数据规模的向量检索,适合个人开发者和小型开发团队使用。
专有集群产品
面向大型开发团队和企业,专注高性能、高可用、高可扩展性、智能运维和优化、数据安全以及敏捷技术支持等企业级特性,并提供性能型、容量型、经济型三类实例类型,满足企业不同维度的业务需求。
自托管计划
允许用户在其虚拟私有云(VPC)上部署我们的向量数据库服务,提供完全控制,它是注重隐私、数据安全和合规的大型企业的理想选择。
通过提供不同形态的产品,我们希望满足 LLM 开发者在不同发展阶段的需要,让每一个开发者、每一个开发团队、每一个企业都能方便地使用向量数据库服务,加速实现 AI 数据基础软件的普及化。
向量数据库市场的竞争和趋势
提问:今年以来,多家向量数据库初创公司获得了大额融资,一些大厂也纷纷把向量数据库的研发列入日程。你怎么看待日益升温的竞争?
星爵:竞争意味着市场确认和机会。竞争的加剧说明向量数据库的价值得到了市场的广泛认可,其市场机会和潜力得以证实。与此同时,激烈的竞争也在一定程度上推动了技术的进步,这对消费者和整个行业而言都大有裨益,是一件实打实的好事。
当然,这种竞争环境迫使公司更加关注客户的需求。这意味着我们必须密切关注市场趋势,并适应这些变化,以提供客户真正需要的解决方案。我们必须不断创新和优化我们的产品和服务。这对 LLM 开发者和整个行业来说都是有益的。我相信在一个健康的生态系统中,有多个玩家是至关重要的。这为开发者和客户提供了选择,也为行业设置了标准。
在 Zilliz,我们作为向量数据库行业的先行者和开拓者,尤其欢迎这种竞争。我们将继续致力于推动向量数据库技术的发展,并与其他参与者一起,为用户提供最先进的工具和服务。
提问:刚才你提到了行业标准,在关系型数据库领域有 TPC-C 和 TPC-H 这样的 benchmark,向量数据库领域有类似的 benchmark 么?
星爵:目前还没有标准的 benchmark,这给开发者和企业在向量数据库产品对比和选择时造成了很多的疑惑和困难。
为此,我们近期开放了一套开源的向量数据库评测工具 VectorDBBench(https://github.com/zilliztech/VectorDBBench)。
该工具包含一套标准化数据集,结合多个典型场景,覆盖数据插入与索引构建、向量查询、混合查询、数据容量等多个能力维度,同时支持用户自定义的数据集与测试场景。
我们欢迎开发者们参与到这个开源 benchmark 的开发和迭代中来,希望 VectorDBBench 能发展成为像 ClickBench 这样的行业标准。
提问:你认为向量数据库赛道未来竞争的核心是什么?
星爵:向量数据库作为一款数据库产品," 更大更快更便宜 " 是未来发展的核心趋势。更大是指能处理更大的数据量,这意味着支持百亿条数据甚至更高的可扩展性;更快是指更高的性能,包括毫秒级的响应时间和高达数万的 QPS;更便宜是指更少的资源消耗更高的性价比,在相同资源消耗的情况下提供更强大的性能。
我们的 Zilliz Cloud 基于 Milvus 开源项目,这是全球现在唯一一款真正分布式的向量数据库系统,能提供数百亿条向量数据的毫秒级查询。得益于 Milvus 的云原生架构,Zilliz Cloud 高效地实现了多租户能力,在相同的实例配置下,性能远超其他竞品。举个例子说,在基于 VectorDBBench 的评测中,Zilliz Cloud 性能是 Pinecone 的两倍以上,综合性价比超过 Pinecone 三倍以上。
国内云产品即将推出
提问:Zilliz Cloud 现在已经支持了 AWS 和 GCP,有没有计划支持国内云平台?
星爵:我们计划在今年 7 月上旬推出国内的云服务产品,首期预计会支持阿里云、百度云、腾讯云和金山云,并将逐步覆盖国内更多的云厂商。Zilliz Cloud 国内云产品定价相比海外产品将会有较大幅度的下调,致力于为国内用户提供最高性价比的全托管向量数据库服务。
Zilliz Cloud:
https://zilliz.com/cloud
Milvus:
https://milvus.io
https://github.com/milvus-io/milvus
VectorDBBench:
https://github.com/zilliztech/VectorDBBench
GPTcache:
https://github.com/zilliztech/GPTCache
— 完—
点这里关注我,记得标星哦~
一键三连「分享」、「点赞」和「在看」
科技前沿进展日日相见 ~
责任编辑:hnmd003
相关阅读
相关阅读
-
给大模型持久记忆!GitHub 2 万星向量数据库云服务升级,国内云产品 7 月上线
一个在GitHub上标星超2万的数据库,究竟是什么来头?原来,这正是最近
-
环球短讯!惠普 战 66 兼容性测试:挑战 100 款充电设备
前言此前充电头网就给大家带来了惠普战66的充电兼容性视频,现在再以文
-
全球看热讯:微软雄心勃勃:2030 财年营收倍增至 5000 亿美元 微软云是主引擎
财联社6月27日讯(编辑卞纯)在今年的AI热潮中,微软无疑是最大的赢家
-
csgo开箱子能赚钱吗?csgo200个箱子加钥匙多少钱?
在CSGO游戏中,很多玩家喜欢开箱。市面上有很多开箱平台,但质量还是比较差的。那么,csgo开箱子能赚钱...
-
观速讯丨住建部部长:提高住房品质 探索建立房屋养老金制度
财联社6月27日电,住房和城乡建设部部长倪虹指出,要鼓励引导金融机构
-
世界视点!佳宇物业管理有限公司_佳宇 全球热讯
1、四川省佳宇建设集团有限公司成立于1999年。2、企业资产总额8亿元,
-
csgo搬砖什么意思?csgo搬砖真的赚钱吗?
很多喜欢玩csgo的小伙伴都知道开箱是一个非常随机的玩法,你可能开出非常贵的饰品,也有可能开出没什么...
-
精彩看点:暴走漫画表情包原图_暴走漫画表情包
1、返山人已将资源发到您邮箱!如您满意,请点击本回答下方“选为满意答
-
每日资讯:如意随行两全保险是什么?可靠吗?
如意随行两全保险是由中国人寿保险公司推出的一种综合性保险产品,可以
-
胆结石百万医疗能报销吗?多少钱?
根据我国的相关医保政策,胆结石的治疗费用是可以通过医保进行报销的。
-
环球观热点:员工百万医疗险怎么买?有必要买吗?
购买员工百万医疗险通常需要经过以下几个步骤:选择保险公司、确定保障
-
太平洋百万医疗哪个好?有什么区别?_世界热议
太平洋百万医疗险主要有:1、医享无忧长期医疗险;2、易享百万医疗险;
-
悦享两全保险的缺点有哪些?优点有哪些?|焦点热闻
悦享两全保险的缺点主要包括四个方面:灵活度较低、费用较高、投资回报
-
世界快报:陈睿打破了B站的共识却没有建立共识
B站要重塑生态,打破共识后却没有建立共识。图片来源@视觉中国昨天
-
蔚来手机新专利公布,可调前置摄像头光圈
蔚来手机新专利公布,可调前置摄像头光圈6月27日,据企查查,蔚来移动
-
当前观点:又一家电动车企申请破产!
又一家电动车企申请破产!盖世汽车讯据外媒报道,6月27日,美国电动卡
-
云南白药和华为就人工智能药物研发达成合作协议 当前速讯
云南白药和华为近日宣布正式宣布达成一项重要合作协议。双方将在人工智
-
内部文件显示微软曾考虑收购世嘉和 Bungie,以支持 Xbox Game Pass
近年来,微软收购了众多游戏开发商,包括了Bethesda及仍在进行中的动视
-
谷歌 Pixel Fold 折叠屏手机被曝到手四天后屏幕就坏了
IT之家6月27日消息,谷歌的首款折叠屏手机PixelFold今日(6月27日)正
-
荣耀手机发布“再见”主题广告片,致敬苹果首支 iPhone 广告片
IT之家6月27日消息,日前,荣耀手机官方发布了一则广告片,配文称是时
-
卫星通信实现卓越离网连接,高通全新调制解调器赋能物联网终端
高通技术公司与非地面网络服务提供商Skylo合作推出全新调制解调器,为
-
焦点消息!索泰发布 3 款 GeForce RTX 4060 显卡,包括蜘蛛侠捆绑包和单风扇 ITX 产品
索泰宣布,推出三款基于基于AdaLovelace架构的新一代主流GeForceRTX406
-
频频卷入争议背后,“考研名嘴”张雪峰商业版图过亿-天天热议
图片来源@视觉中国文|雷达财经,作者|莫恩盟,编辑|深海继此前因是
-
《消失的她》大爆,今年暑期档将是四年以来最热 世界时快讯
图片来源@视觉中国文|文化产业评论,作者|逍遥客,编辑|时光、半岛连
-
今日快讯:永安桥、陟山门桥、淾祥桥,北海公园这些桥故事多
北京晚报·五色土|作者京根儿提起北海,大家习惯性地加上“公园”俩字
-
全球快消息!汉嘉设计(300746)6月27日主力资金净卖出265.26万元
截至2023年6月27日收盘,汉嘉设计(300746)报收于10 39元,上涨5 27%,
-
快资讯丨吃货作家除了汪曾祺,原来还有梁实秋!谈吃的散文,佩服这本书
他在《文学的纪律》一书中说:“伟大的文学乃是基于固定的普遍的人性,
-
勇敢牛牛不怕困难是什么梗_勇敢牛牛不怕困难的含义
1、勇敢的妞妞,不怕困难最初源于TikTok。它起源于网上的一个表情包。
-
半导体激光器有哪些?半导体激光器的优点
半导体激光器有哪些?1 激光二极管(LD): 是一种小型、高效的激光器。它的工作原理是在有源区域中注入电...
-
水滴百万医疗保险是真的吗?有什么用? 快报
是真的。水滴百万医疗保险是由水滴保险推出的医疗险产品,具备一定的可
精彩推荐
阅读排行
精彩推送
- 世界今日报丨建信人寿百万身价两...
- 大公司增额寿险可靠吗?哪一家公...
- 环球聚焦:百万医疗保险有垫付吗...
- 天天最新:百万医疗确诊后可以续...
- 享年95岁,诺奖得主马科维茨去世...
- 业绩跳水,沦为被执行人,昔日千...
- 世界微动态丨微信否认文件传输助...
- 蓝牙驱动器是什么?蓝牙驱动器怎...
- 高压母线是什么意思?母线槽是高...
- 数字签名的作用有哪些?数字签名...
- 无源触点是什么意思?无源触点和...
- 声波时差是什么?声波时差越大说...
- 今年三伏依旧是40天!2023年三伏...
- 互感器起什么作用?互感器型号有...
- 全球播报:廊坊发展(600149)6月...
- 港股游戏股走强 花旗预测年内超...
- 影视传媒板块震荡走低,慈文传媒...
- 世界今头条!麒麟推出免疫保健运...
- 掌趣科技与悠米达成战略合作,将...
- 抓住夏日那一抹「青」,详解 39...
- OPPO Reno10 Pro 星籁版开启...
- 23 年二季度全球电视厂商销量排...
- 巨头头显大战“分道扬镳”:Meta...
- 什么是透水率?灌浆透水率高好还...
- 3000 元的高档面霜,空瓶能卖 ...
- 香港科技大学表观基因组学研究中...
- 小米汽车续航 800km,14.99 万...
- 中石化重大勘探突破,盘活页岩气...
- 年轻人挤爆旅拍:摄影师月入 6...
- 全国会计资格评价网中级报名入口...