全球快看:一家 380 亿美元的数据巨头,要掀起企业「AI 化」革命
2023-06-30 09:27:01来源:ZAKER科技
作者 | 宛辰、Li Yuan
(资料图片)
编辑 | 靖宇
当地时间 6 月 28 日,美国知名数据平台 Databricks 举办了自己的年度大会——数据与人工智能峰会。会上,Databricks 公布了 LakehouseIQ、Lakehouse AI、Databricks Marketplace 、 Lakehouse Apps 等一系列重要新品。
无论是从峰会的名称,还是新产品的命名,都能看出这家知名数据平台,正在趁着大语言模型的东风,加速向 AI 转变的脚步。
Databricks 公司 CEO Ali Ghodsi 所说的数据和 AI 普惠化|Databricks「Databricks 要实现的是『数据普惠』和 AI 普惠,前者让数据通向每一个雇员,后者让 AI 进入每一个产品。」Databricks 公司 CEO Ali Ghodsi 在台上说出了团队的使命。
就在大会开始之前,Databricks 刚刚宣布以 13 亿美元收购 AI 领域的新生力量 MosaicML,创下了当前 AI 领域收购纪录,可见公司在 AI 转型上的力度和决心。
正在前方参会的 PingCAP 创始人兼 CEO 刘奇告诉极客公园,Databricks 平台刚刚上线 AI 的企业级应用,就已经有超过 1500 家公司在上面进行模型训练,「数字超出预期」。同时,他认为 Databricks 由于之前在数据 + AI 方面的积累,让公司能在 AI 大火之际,迅速在之前平台基础上加入新产品,就能快速给出和大模型相关的服务。
「最关键的就是速度。」刘奇说道,在大模型时代,如何用更快的速度让大模型和现有产品整合,解决用户的痛点,可能是当下所有数据公司最大的挑战,同时也是最大的机会。
Talking points
通过交互界面的升级,不是数据分析师的普通人,也可以直接使用自然语言查询和分析数据。
企业将大模型部署到云端数据库将越来越容易,直接使用成品大模型工具分析数据,也将变得更加简单。
随着 AI 的进展,数据的价值还将越来越高,数据潜力将被进一步释放。
01
数据库迎来自然语言交互
在会上,Databricks 推出了全新的「神器」LakehouseIQ。LakehouseIQ 承载着 Databricks 近期最大的发力方向之一——数据分析普惠化,即不掌握 Python 和 SQL 的普通人也能轻轻松松接入公司数据,用自然语言就能进行数据分析。
为达到这个目的,LakehouseIQ 被设计为一个功能合集,既可以被普通终端用户使用,也可以被开发者使用,针对不同的用户设计了不同的功能。
LakehouseIQ 产品图|Databricks对于开发者方面,发布了 LakehouseIQ in Notebooks,这项功能中,LakehouseIQ 可以利用大语言模型帮助开发人员完成、生成和解释代码,以及进行代码修复、调试和报告生成。
而对于普通的非程序员群体,Databricks 则提供了可以直接用自然语言交互的界面,背后由大语言模型驱动,可以直接用自然语言来搜索和查询数据。同时,该功能与 Unity Catalog 集成,让公司可以对数据的搜索和查询进行访问权限控制,只返回提问者被授权查看的数据。
自大模型推出以来,用自然语言对数据进行查询和分析,其实一直是一个数据分析方向的热点,许多公司在此方向都有所布局。包括 Databricks 的老对手 Snowflake,刚刚宣布的 Document AI 功能也是主打这个方向。
LakehouseIQ 自然语言查询界面|Databricks不过 Databricks 宣称,LakehouseIQ 做到了更好的功能。它提到,通用大语言模型在理解特定客户数据、内部术语和使用模式方面拥有局限性。而 Databricks 的技术,能够利用客户自己的模式(schema)、文档、查询、受欢迎程度、线程、笔记本和商业智能仪表盘来获取智能,回答更多查询。
Databricks 的功能与 Snowflake 的功能还有一个差别,Snowflake 平台的 Document AI 功能,仅限于对文档中的非结构化数据进行查询,而 LakehouseIQ 适用于结构化的 Lakehouse 数据和代码。
02
从机器学习到 AI
Databricks 与 Snowflake 在发布会上的相似之处还不局限于此。
此次发布会中,Databricks 发布了 Databricks Marketplace 和 Lakehouse AI,这与 Snowflake 这两天大会的重点也完全吻合,二者都主打将大语言模型部署到数据库环境中。
在 Databricks 的设想中,Databricks 未来既可以协助客户部署大模型,也提供成品的大模型工具。
Databricks 过去就有 Databricks Machine Learning 的品牌,在此次发布会上,Databricks 对其进行品牌全面的重新定位,升级为 Lakehouse AI,主打协助客户部署大模型。
Databricks 上线了 Databricks Marketplace。在 Databricks Marketplace 中,用户可以接入经过筛选的开源大语言模型集合,包括 MPT-7B、Falcon-7B 和 Stable Diffusion,还可以发现和获取数据集、数据资产。Lakehouse AI 还包括一些大语言模型操作能力(LLMOps)。
Lakehouse AI 架构图|DatabricksSnowflake 也在对此进行积极部署,其相似功能由 Nvidia NeMo、Nvidia AI Enterprise、Dataiku 和 John Snow Labs 提供(与英伟达的合作正是 Snowflake 大会的重点之一,见极客公园的报道)。
在协助客户部署大模型方向,Snowflake 与 Databricks 显现出了分歧。Snowflake 选择积极地与合作伙伴进行合作,而 Databricks 则试图将该功能作为其核心平台的本地特性添加进去。
而在提供成品工具方面,Databricks 宣布 Databricks Marketplace 未来还将可以提供 Lakehouse Apps。Lakehouse Apps 将直接在客户的 Databricks 实例上运行,它们可以与客户的数据集成,使用和扩展 Databricks 服务,并使用户能够通过单点登录体验进行互动。数据永远不需要离开客户的实例,没有数据移动和安全 / 访问问题。
这点则与 Snowflake 公司的产品从命名到功能上都直接撞车。Snowflake 公司与之相似的 Snowflake Marketplace 和 Snowflake Native App 已经上线,是其发布会的重点之一。彭博社就在 Snowflake 的大会上宣布了一个由彭博社提供的 Data License Plus ( DL+ ) APP,允许客户在云端用几分钟时间就能配置一个随时可用的环境,内部设有完全建模的彭博订阅数据和来自多供应商的 ESG 内容。
03
数据平台迎来新变革
开幕式主旨演讲上,Databricks 公布了一个数字:过去 30 天,已经在 Databricks 平台上训练 Transformer 模型的客户超过 1500 家。
在谈及这个令人印象深刻的数字时,PingCAP 刘奇认为,这说明企业应用 AI 的速度比预期的要快得多,「应用模型不一定要去训练模型,所以如果训练的都有 1500 家,那应用的肯定要比这个(数字)大的多得多。」
另一方面,这也表明 Databricks 在 AI 这个领域的布局相对完整。「它现在不仅仅是一个 Data Warehouse(数据仓库),一个 Datalake(数据湖)。现在它还提供:AI 的 training(训练)、AI 的 serving(服务),模型的管理等一整套。」
Ali Ghodsi 以计算和互联网的革命,类比大模型之于机器学习的变革|Databricks也就是说,底层模型可以通过 Databricks 的平台去训练,「最底层的模型改改参数就能训练」。在这个模型之上所需要的 AI 服务,Databricks 也布局了相应的基础设施——今天发布了 vector search(向量搜索)和 feature store(特征库)。
Databricks 全面向大模型升级。
过去,Databricks 在 AI 方面有很多积累,比如在建索引、查数据、预测工作负载等方面,用小模型来提高效率、降低时延。但是,以如此快的速度补上大模型的能力,还是让不少人意外。
在今天峰会全面展示的 AI 布局之前,Databricks 收购了 Okera(AI 数据治理),推出了自家的开源大模型 Dolly 2.0,又以 13 亿美元并购了 MosaicML,一连串的动作一气呵成。
对此,硅谷徐老师 Howie 认为,Databricks 和 Snowflake 这两个大会都可以比较明确地看出:两家公司的创始人认为,基于数据库、数据湖他们所做的行动、接下来会面临根本性的改变。按照一年前他们在做的思路,在未来几年行不通。
相应地,快速补齐大模型的能力,也意味着可以获得由于大模型带来的增量市场。
刘奇认为,没有大模型之前,很多的需求可能都不存在,但有了大模型之后,有了很多新增需求。「因为只有模型没有数据,干不了什么事情,特别是没有办法做出差异化。如果大家都是一个大模型,那你跟别人可能也没有差别。」
但比起大模型,峰会现场的观众似乎更关注小模型,因为小模型的几个优势:速度、成本、安全性。刘奇表示,基于自己独有的数据,做出差异化的模型,模型要足够小才能满足这三条:足够便宜、足够快、足够安全。
值得注意的是,Databricks 和 Snowflake 在日前都公布了它的营收数据,平台年营收增长在 60% 以上。相比整个市场软件支出放缓的大背景,这样的增长速度反映了数据越来越被关注。这次 Databricks 峰会的主题也是数据加 AI,但有了大模型,数据的价值还将越来越高。
大模型的到来,让数据自动生成成为可能,可以预见,数据量将指数级增长。怎么轻松地访问数据、怎么支持不同的数据格式、挖掘数据背后的价值,会成为越来越频繁的需求。
另一方面,今天很多企业还在还在探索观望将大模型接入企业软件,但考虑到安全、隐私、成本,敢直接用的,还很少。一旦通过将大模型直接部署到企业数据上,无需移动数据,部署大模型的门槛将被进一步降低,数据被消费的数量和速度都将被进一步释放。
责任编辑:hnmd003
相关阅读
-
Canalys:预估苹果 Vision Pro 头显上市后五年累计销量会超 2000 万台_头条焦点
钛媒体App6月30日消息,据市场调查机构Canalys发布的最新报告,苹果拓
2023-06-30
相关阅读
-
全球快看:一家 380 亿美元的数据巨头,要掀起企业「AI 化」革命
作者|宛辰、LiYuan编辑|靖宇当地时间6月28日,美国知名数据平台Databri
-
环球快资讯:微软收购惊动索尼,两大巨头明争暗斗多年!
微软收购惊动索尼一场全球瞩目的反垄断监管诉讼,一个改变行业格局的天
-
Canalys:预估苹果 Vision Pro 头显上市后五年累计销量会超 2000 万台_头条焦点
钛媒体App6月30日消息,据市场调查机构Canalys发布的最新报告,苹果拓
-
小米、腾讯、吉利等巨头持股 黑芝麻智能冲刺港股 IPO
【CNMO新闻】6月30日,CNMO从媒体获悉,汽车AI芯片开发商黑芝麻智能近
-
全球今日讯!给 AI 打下手,我被抢了“饭碗”
Tech星球(微信ID:tech618)文|陈桥辉封面来源|图虫创意任何一项新技
-
单位存款有哪些?如何存款可以获得更高的利息?
不少的小伙伴在选择银行存款时,大部分都会选择活期存款,最大的原因之一就在于它没有固定期限,可以随...
-
公章莫名消失!业内人士:从未遇过 天天观天下
作者丨唐韶葵编辑丨张伟贤图源丨图虫6月的厦门集美新城,天清气爽,不
-
背靠能源第一省,光伏强市的电不够用了?
图片来源:包头发布最近,一则传闻把包头送上舆论风口。据上海有色网消
-
法人贷款需要什么条件?法人贷款无力偿还后果
法人贷款需要什么条件?1、客户群体:年龄在24-65周岁,成立6个月以上且三证俱全的有限公司或独资企业法...
-
京东养车在西藏拉萨开业
京东集团旗下的汽车养护连锁品牌——京东养车拉萨门店近日在拉萨市城关
-
信息:西藏改则县生态文明建设扫描:守护羌塘腹地 打造动物天堂
这世上总有一些人,在常人难以注目的地方默默奉献着。
-
西藏自治区市场监管局召开行政指导和政策解读座谈会 全球时快讯
近日,西藏自治区市场监管局网监处组织西藏美团和饿了么平台相关负责人
-
速看:拉林铁路开通运营两周年
2023年6月25日,是拉林铁路开通运营两周年,记者从拉萨火车站获悉,两
-
三无食品怎么处罚?三无食品的处罚标准是什么?
一、三无食品是指什么三无食品中有可能含有色素和防腐剂的食品,甚至是地下工厂生产的食品。食用了这一...
-
网购收货付款有什么注意事项?网购交易规则都有哪些?
1、多了解宝贝细节,了解卖家在出价前,您可以通过各种方式了解有关交易的信息。比如物品的具体细节,对...
-
到期还款日是什么意思?到期还款日和最后还款日区别
到期还款日是什么意思?信用卡到期还款日是指信用卡最后的还款日期。每张信用卡都有一次修改还款日期的机...
-
7月起一批新规将施行 涉铁路出行、消费者权益、低保标准等
①全国性新规:国六b排放标准将全面实施、全国铁路实行新的列车运行图
-
企业所得税季报是什么?企业所得税应该怎么缴纳呢?
大家都知道,企业是需要缴纳企业的一个所得税的,那么,对于企业所得税来说,企业所得税应该怎么缴纳呢?...
-
刑法有泄露公民个人隐私罪吗?中华人民共和国刑法第二百五十三条的内容是什么?
一、个人隐私信息包括什么私人隐私就是私人生活秘密,是指私人生活安宁不受他人非法干扰,私人信息保密...
-
进球网:卡斯特罗接受利雅得胜利邀请,将担任球队主教练_观速讯
进球网:卡斯特罗接受利雅得胜利邀请,将担任球队主教练,卡斯特罗,利雅
-
公司可以抵押贷款吗?公司抵押贷款的特点是什么?
的条件才恶意。下面小编为大家详细介绍一下相关知识,希望对大家有所帮助。一、公司可以抵押贷款吗公司...
-
避免个人债务纠纷要注意以下几个方面?下列哪种情况下是允许债权人扣押财产?
一、所谓的清债公司是合法的吗我国现行的法律法规并不允许成立讨债或清债公司之类的组织,发生债务纠纷...
-
档案管理方法有哪些?档案管理的内容是什么?
一、档案管理方法有哪些1、抽屉式直立档案。所谓抽屉式就是立在地面上的分层的抽屉,这种方式能够将种类...
-
股票交易佣金是多少?股票交易要交哪些费用?
股票交易佣金是多少?1、不同的营业部的佣金比例不同,极个别的营业部还要每笔收1-5元的委托(通讯)费。2...
-
世界实时:果粉网传新iphone 大迟到11月底_果粉网创始人
想必现在有很多小伙伴对于果粉网创始人方面的知识都比较想要了解,那么
-
建设银行信用卡好办吗?建设银行信用卡办理需要什么条件?
建设银行信用卡好办吗?建设银行是比较好申请的,只要用户符合建设银行的申请条件,想要成功下卡还是很容...
-
环境污染防治原则都有哪些?完善环境管理体制都有什么?
一、环境污染有哪些1、空气污染:包括企业废气排放污染、机动车尾气排放污染、饮食业油烟排放污染、建筑...
-
沪深300股指期货怎么开户?沪深300股指期货一手多少钱?
沪深300股指期货怎么开户?个人携带本人身份证、银行卡复印件或者扫描件1份、身份证扫描件(电子版)、个人...
-
房地产业务都包括哪些?房地产经营是指什么内容?
房地产经营是指房地产开发企业的中介组织进行房地产项口转让、商品房预售、销售以及租赁等商业活动。具...
-
天天观天下!国际油价29日上涨
南方财经6月30日电,。截至当天收盘,纽约商品交易所8月交货的轻质原油
精彩推荐
阅读排行
精彩推送
- 风险可控、理性发展、长期回报…...
- 建筑面积和使用面积的区别是什么...
- 去台湾要签证吗?怎么办理签证呢?
- 生产者能够证明有哪些情形不承担...
- 进口车销量暴跌!雷克萨斯、宝马...
- 长城汽车荆门工厂新增三款车型-...
- 股权激励是什么意思?公司股权激...
- 法律意见书格式都有什么内容?法...
- 文明实践在行动|营造清朗社会文...
- 护航未成年人成长|筑牢校园“防...
- 三证齐发 跑出审批“加速度”
- 每日关注!“法税协作”出新招 ...
- 什么是社保卡?社保卡可以当银行...
- 文明实践在行动|稀土高新区:精...
- 营业税劳务范围是什么?什么是营...
- 汇票和本票的区别是什么?汇票和...
- 公司增资的主要方式都有哪些?申...
- 移仓是什么意思?期货主力移仓会...
- 规章制度的作用都有什么?规章制...
- 股票涨停可以买吗?股票涨停为什...
- 工业总产值的计算原则是什么?目...
- 白银期货保证金是什么意思?白银...
- 游客开车压草场牧民损失数万!牧...
- 敞口是什么意思?风险敞口怎么计...
- 焦点快报!外媒:苹果更重视 iOS...
- AI 公司 Inflection 融资 13...
- 世界百事通!钛媒体科股早知道:...
- 售价 4 万美元、限量 24 台...
- 罕见 4GB 未拆封初代 iPhone...
- 全球聚焦:美国驻北约大使:成员...