字节的野心:做大模型时代的「军火商」
2023-06-29 10:32:48来源:Bianews鞭牛士
字节跳动谨慎迈出了跨入大模型赛道的第一步。
(资料图片)
6 月 28 日下午,字节旗下的火山引擎召开发布会,首次正式公布在大模型领域的研发布局和合作进展,并发布大模型服务平台火山方舟,提供模型训练、推理、评测、精调等全方位功能与服务。
此前,百度、阿里、腾讯、商汤、360 等国内大厂已经相继宣布入局,大部分的做法都是发布一个通用大模型或者数个行业大模型底座,行业客户可以基于这些基础模型和自身拥有的行业数据精调,打造一个服务自身业务的 AI 应用。
但字节的切入方式与其他大厂有明显的不同。火山没有发布自己的通用大模型或者行业大模型,火山方舟聚合了一批第三方生产商开发的大模型底座。
火山引擎向大模型生产商提供构建、训练大模型基座所必须的算力和工具体系,并将这些生产商的大模型聚集到自己的 MaaS 平台,供应给企业使用。这与微软投资算力供给 OpenAI,并基于后者开发的 GPT 模型向企业提供 Azure AI 云服务,有相似之处。
因此,火山引擎介绍的合作案例也与其他大厂有所差异。这场发布会上登台的合作伙伴,包括英伟达这样的上游显卡供应商,以及智谱 AI、百川智能、IDEA 等当下国内第一梯队的大模型开发商。而其他大厂的发布会,介绍的往往主要是金融、文旅、企服等各行各业的合作伙伴。
火山引擎总裁 谭待
截至今年 5 月,国内已公开披露的大模型数量达到 79 个。按照火山引擎总裁谭待的说法,未来大模型市场一定不会是一家或者几个寡头垄断,而是一个百花齐放的多模型市场,会有少数几个超级大模型,多个通用大模型,和更多行业/垂直大模型。 企业使用大模型,未来也会呈现「1+N」的模式,除了通过自研或深度合作,形成 1 个主力模型;由于成本和场景复杂多元等原因,在这个主力模型之外,还会有 N 个模型同时应用。 大模型开启了新一轮行业变革,在这个淘金时代,OpenAI、谷歌、MiniMax、百川智能等大模型生产商是时代浪尖的淘金者。而火山引擎要做的,就是要在大模型时代「卖铲子」。
01 火山引擎大模型 服务平台——火山方舟
会上,火山引擎发布了自己的 MaaS 平台——火山方舟。 火山引擎总裁谭待在会后接受媒体采访时强调:火山方舟最终服务的是模型的应用方;火山引擎是跟大模型的生产方合作,一部分被精选的大模型厂商在火山方舟上部署,然后对外提供服务。
想让企业用户和大模型生产商加入到火山方舟的生态体系,首先要解决的是数据安全的问题。 火山引擎总裁谭待认为,企业使用大模型,最担心的是数据泄露;如果将大模型私有化部署,企业将承担更高的成本,模型生产方也会担心知识资产安全。「火山方舟」的首要任务,就是做好大模型使用者、提供者和云平台可以互相信任的安全保障。 据火山引擎智能算法负责人吴迪介绍,「火山方舟」已上线了基于安全沙箱的大模型安全互信计算方案,利用计算隔离、存储隔离、网络隔离、流量审计等方式,实现了模型的机密性、完整性和可用性保证,适用于对训练和推理延时要求较低的客户。
安全沙箱示意图
此外,「火山方舟」还在探索基于 NVIDIA 新一代硬件支持的可信计算环境、基于联邦学习的数据资产分离等多种方式的安全互信计算方案,更全面地满足大模型在不同业务场景的数据安全要求。 第二,想要让企业可以更高效地打造 AI 大模型应用。一方面要降低企业用户使用大模型打造应用的门槛,另一方面也要降低用户使用大模型服务的成本。
上文提到,火山引擎认为未来企业使用大模型会呈现「1+N」的模式,也就是 1 个自研主力模型+N 个小模型同时应用。比如一个对话式的 AI 服务产品,对话功能的基础是源自企业自研的大模型,但提供文生图、文生视频、特定语种翻译,或者回答医疗、金融等专业领域的问题时,却可以调用其他的小模型。 这样做最大的好处是降低模型的推理成本。吴迪称,训练大模型很昂贵,但是从长期来看,模型的推理开销会超过训练开销。效果和成本的矛盾永远存在,降低推理成本会是大模型应用落地的重要因素,「一个经过良好精调的中小规格模型,在特定工作上的表现可能不亚于通用的、巨大的基座模型,而推理成本可以降低到原来的十分之一。」 举例来说,微软以医学文章数据精调了生物领域的 BioGPT-Large 模型,仅有 15 亿参数,其在 PubMedQA 基准测试中的准确率却优于有着上千亿乃至数千亿参数的大型通用语言模型。 但对企业来说,「1+N」模式的一大痛点就在于开发应用的过程中,需要调用各种不同的大模型。而火山方舟提供的第一个功能就是模型广场,不仅集成了大量的第三方大模型,企业自身开发的大模型也可以通过这个平台进行管理。 吴迪介绍,企业可以用统一的工作流对接多家大模型,对于复杂需求可设置高级参数、验证集、测试集等功能,再通过自动化和人工评估直观对比模型精调效果,在不同业务场景里还可灵活切换不同的模型,实现最具性价比的模型组合。这些自定义指标和评估数据的积累,将成为企业在大模型时代宝贵的数据资产。
火山方舟负责人 吴迪
02 火山引擎的 大模型「朋友圈」
火山引擎畅想的前景非常理想,但要做到有一个前提,就是大大小小的大模型开发商需要聚集到火山引擎。数据安全是他们愿意接入火山引擎的必要条件,但显然不会是充分条件。火山引擎吸引大模型开发商合作的基础,在于其掌握的算力资源,也就是过去囤积的大量 GPU。 去年 ChatGPT 发布后,国内 AI 算力紧张已经算是行业半公开的秘密,而字节跳动拥有国内最丰富的算力资源。 据《晚点 LatePost》报道,字节今年向英伟达订购了超过 10 亿美元的 GPU(约合 70 亿元人民币),到货和没到货的 A100 与 H800 总计有 10 万块。而 2022 年全年,英伟达数据中心 GPU 在中国的销售总额大约为 100 亿元,也就是说,仅字节一家公司今年的订单可能已接近英伟达去年在中国销售的商用 GPU 总和。 大部分团队没有条件购买大量 GPU 训练大模型,从火山引擎采购算力也就不足为奇。而对火山引擎来说,大模型生产商发展越好,业务量越大,反过来就需要购买更多的算力。所以在这方面,大模型生产商和火山引擎有着相同的诉求。 今年 4 月,火山引擎宣布与国内 70% 的大模型生产商达成合作,原因也在于此。
「火山方舟」首批大模型合作伙伴
会上,火山引擎重点介绍了第一批加入火山方舟的大模型,包括百川智能、出门问问、复旦大学 MOSS、IDEA 研究院、澜舟科技、MiniMax、智谱等多家 AI 科技公司及科研院所的大模型,并已启动邀测。 而首批邀测的企业,则包括金融、汽车、消费等众多行业的客户。北京银行 CIO 龚伟华表示,大模型与客户营销、办公协同、数据智能的结合,在金融应用场景有巨大潜力。北京银行将与「火山方舟」合作,在算力优化、模型精调等方面展开研究,共同推动金融风控、营销等模型应用落地。 除了第三方的客户,吴迪介绍,在火山方舟平台推向市场之前,已经利用众多的内部产品打磨和改进平台。字节跳动有 10 余个业务线正在探索接入和试用,在代码纠错等研发提效场景,文本分类、总结摘要等知识管理场景,以及数据标注、归因分析等方面探索,利用大模型能力促进降本增效。 但是,对于这些内部尝试何时面向用户,吴迪向极客公园表示:还需要一些时间,把大模型应用好是一个需要长周期打磨的事。 火山引擎总裁谭待进一步补充:有一些应用对用户是无感知的,因为它是在已有的环境中去提升效率,而不是像 ChatGPT 这种大模型原生应用,用户能明显感知到是一个大模型来做这个事情。比如客服这个场景,回答时需要检索知识库,但现在通过大模型去给它一些提示,但跟你对话的还是那个对应的客服,只是它的效率高了。
03 字节跳动的下一步
目前来看,字节/火山布局大模型第一阶段的思路已经非常清晰。 从商业上看,火山引擎就是卖水卖铲子的思路。凭借火山引擎的技术体系,加上此前算力资源的积累,做管道和前期的底层服务应该是没有任何问题,所以在这个阶段把基础工具开放出来,帮助大家做好大模型,或者更直接说,从收益上的考量,这个阶段发布技术体系工具比发布大模型的收益值更高。 但有一个很重要的问题是:今天卖铲子的字节,未来会不会下场淘金? 答案是肯定的。谭待告诉极客公园,其内部也有团队在研发大模型。如果做好了,也会上到方舟平台对外提供。此前字节副总裁杨震原也曾向财新回应:字节跳动对大模型也在做一些学习和研究,现在还没有什么结果,也没有大模型产品落地时间表。 但这存在一个问题,就是如何平衡自家大模型和其他第三方的关系。对此,谭待表示,自家的模型只会是众多模型中的一个,其余的是客户自己的选择,不需要火山来平衡,一个企业未来一定会在多个场景用多个模型,因为每个模型在不同场景的性价比是不一样的,这会是一个开放的市场。 正式入局后,不少行业人士看好火山引擎在大模型领域的市场份额会在接下来一段时间快速飙升,原因主要有三个: 第一是因为基础需求。字节本身在云服务这个层面是国内用量排在前三的公司,就算火山引擎,最终只是为了服务字节这一个生意而建,它的收益和投入产出比都是相当可观的。 第二是产品能力。字节这套体系迭代出来的产品工具向外传递,在云服务里的积累和产品化的能力会非常的强,从这个维度来说,对于很多中小开发者,甚至有体系的开发者是很有吸引力的。 第三是因为生态系统成熟。字节本身在云服务这套体系并不是只做了火山引擎,字节在上下游的广告分发、基础设施建设,开发工具等维度都有完善和成熟的生态链,甚至早几年还收购了开发者社区。有着可靠的基础体系,完整的工作链条和生态社区。
过去字节布局国内云服务市场的痛点,在于起步较晚,飞书要挑战已经成熟的钉钉、企业微信,而云服务的特点就是前期获客难,但获客后由于用户迁移成本太高,所以轻易不会更换。 今天的大模型是一条全新的赛道,所有云服务厂商又回到了同一起跑线,对于想要打开云服务市场的字节和火山而言,这也是十年难得一遇的机遇。
责任编辑:hnmd003
相关阅读
相关阅读
-
字节的野心:做大模型时代的「军火商」
字节跳动谨慎迈出了跨入大模型赛道的第一步。6 月 28 日下午,字
-
奔驰和吉利退出?smart品牌:不实! 全球头条
奔驰和吉利退出?smart品牌:不实!据国家企业信用信息公示系统显示,
-
Stellantis将停止在维也纳生产变速箱
Stellantis将停止在维也纳生产变速箱Stellantis表示:“目前公司尚未确
-
【全球速看料】在宜宾!宁德时代联合长安汽车等共设动力电池公司
在宜宾!宁德时代联合长安汽车等共设动力电池公司6月29日,盖世汽车获
-
医院物业管理包括哪些内容?医院物业管理要求都有什么?
一、医院物业管理包括哪些内容(一)房屋及附属设备设施的维修养护与运行管理主要包括对房屋建筑、中央空...
-
b股怎么开户?b股开户需要什么条件?
b股怎么开户?1、携带个人有效身份证件去当地的外汇存款银行办理转款手续,将现汇存款和外币现钞存款转入...
-
建筑安全事故分为几类?工地出了安全事故由谁来承担?
一、建筑安全事故分为几类(1)按事故的原因及性质分类:从建筑活动的特点及事故的原因和性质来看,建筑安...
-
股票现量是什么含义?股票现量紫色是买还是卖?
股票现量是什么含义?股票现量指的是现在的,也就是当前刚成交的这一笔订单的成交量而不是股票现在的存量...
-
暴力行为打架要判刑吗?治安管理处罚法第十二条的内容是什么?
一、暴力行为以殴打等暴力手段或唆使他人以殴打等暴力手段造成公民身体伤害或死亡,是严重的侵犯公民人...
-
好太太童瑶同款智能锁:一款真正的3D人脸识别智能锁
智能门锁,风头正盛,无论是公司、小区、校园,你都能频频看见它的
-
我国的最高权力机关是什么?中华人民共和国宪法第五十七条的内容是什么?
我国国家最高权力机关为全国人民代表大会,在闭会期间,由人民代表大会常务委员会代行其职权。根据我国...
-
基金申购的法律依据是什么?中华人民共和国证券投资基金法第六十一条的内容是什么?
一、基金申购和认购的区别主要在哪基金申购和认购的主要区别在于购买时间不同、购买价格不同、赎回条件...
-
打假维权的途径是几种方式?中华人民共和国民法典第一千一百九十五条内容是什么?
打假维权的途径有如下几种方式:1、消费者向网络购物平台进行投诉;2、拨打消费者协会12315电话进行投诉;...
-
劳动教养最长期限是多长时间?公安机关办理劳动教养案件规定第四十四条内容是什么?
一、劳动教养制度是什么劳动教养就是劳动、教育和培养,简称劳教。劳动教养并非依据法律条例,从法律形...
-
美股期指是什么意思?美股期指几点开盘几点收盘?
美股期指是什么意思?美股期指是指美国股票期货指数,也被称为美国股指期货或标普500期货。它是一种以标普...
-
公司公章怎么挂失?公章挂失的流程是什么?
一、公司公章怎么挂失1、法人要带身份证原件及复印件;工商营业执照副本原件及复印件到丢失地点所辖的派...
-
电网调度是指什么意思?电网运行实行统一调度的原则吗?
第一章 总 则第一条 为了加强电网调度管理,保障电网安全,保护用户利益,适应经济建设和人民生活的...
-
金融服务费一般收多少?金融服务费可以不交吗?
金融服务费一般收多少?金融服务费普遍的收费标准是贷款金额的2%左右,但是不同的商家收取的金额多少不同,...
-
延期还款怎么协商?延期还款和停息挂账的区别
延期还款怎么协商?1、主动致电银行信用卡中心,申请协商还款一般客服人员和刻意回避这个问题,或者直接...
-
什么是工程造价?工程造价是什么意思?
一、工程造价是什么意思工程造价是指构成项目在建设期预计或实际支出的建设费用。综合运用管理学、经济...
-
奥迪前CEO施泰德被判刑_世界微头条
近日,奥迪前CEO施泰德因涉嫌在大众“排放门”丑闻中犯有过失欺诈罪,
-
【天天热闻】学什么、怎么学、咋发展——今年新增本科专业全解读
教育部日前发布最新《普通高等学校本科专业目录》,列入目录的新专业共
-
百明信康完成逾11亿元C轮融资
6月29日,专注于提供突破性免疫治疗方案的生物制药公司百明信康宣布完
-
5月份工业企业利润继续改善
5月份,随着消费需求不断恢复,消费品制造业利润改善,其中,纺织服装
-
企业保险怎么买?企业保险每月交多少钱?
企业保险怎么买?公司给在职员工会投保五险,即养老保险、医疗保险、失业保险、工伤保险、生育保险,参保...
-
听证会的组织程序是怎么样的?如何组织一次听证会?
一、听证会制度是什么听证会起源于英美国家,是一种把司法审判的模式引入行政和立法程序的制度。听证会...
-
美国券商 Wedbush 表示:支出可能达到 8000 亿美元 人工_全球看点
【友财网讯】-美国券商Wedbush表示,科技公司可能会在人工智能淘金热中
-
FTC 听证会文件透露,《最后生还者 2》《西之绝境》制作成本超过 2 亿美元|今日热讯
近日微软与FTC的法庭辩论中,周三索尼向美国联邦贸易委员会(FTC)提交的
-
树大招风的 ChatGPT 又遭起诉 用以训练的数据究竟值多少钱? 全球消息
财联社6月29日讯(编辑马兰)人工智能虽然是今年最大的趋势之一,但事
-
弥补全球认知鸿沟,微软开始提供生成式 AI 职业培训项目 世界热门
品玩6月29日讯,据财联社报道,当地时间周三,全球AI大厂微软宣布,正
精彩推荐
阅读排行
精彩推送
- Airpods Max 平替要来!苹果 ...
- 让老年人乐享晚年_精选
- 西藏拉萨市公安局交警支队上半年...
- 西藏税务部门丰富立体式税费服务...
- 日播时尚回应高管减持和重组失败...
- 工商银行房贷申请流程是什么?工...
- 工商银行购买基金手续费多少?基...
- 购买什么基金好?购买基金要注意...
- 公务员停薪留职的规定内容是什么...
- 卓越·和悦丨尚学 新品实力当“燃”
- 美国缩表是什么意思?美国缩表对...
- 什么是期货交易系统?期货交易系...
- 交强险保险条款内容有什么?机动...
- 华达科技:6月28日融资买入324.6...
- 银行头寸是什么意思?银行头寸调...
- 资讯推荐:了不起的意思是什么
- 作品转载的规定内容是什么?著作...
- 医保卡丢了怎么办?医保卡丢失别...
- 按照房产性质将房屋所有权分为哪...
- 股票加dr是什么意思?股票dr之后...
- 股票经纪人是干什么的?股票经纪...
- 全球快讯:四房企获准股权融资 ...
- 炒股在哪里开户?炒股开户需要什...
- 当前关注:众安百万医疗险真实吗...
- 今日快看!大众点评的到店生意:1...
- 安邦畅盈两全保险(万能型)b款怎...
- 科技思变,2023广汽科技日描绘移...
- 支付宝平安百万医疗险可靠吗?怎...
- 三六零:6月28日融资买入1.79亿...
- 阳光保险融合c百万医疗保证续保...