行业大模型,开卷!
2023-07-05 10:16:48来源:ZAKER科技
" 文心一言看起来是匆忙上马,我认为这个东西根本就不是为了赚钱,就是为了能赶 ChatGPT 热潮,行业大模型才是真正能产生商业价值的东西。"
百度文心一言发布后不久,一位前百度员工对钛媒体表示," 去年 OpenAI 没这么火的时候,王老师(百度 CTO 王海峰)带队搞了 10 个大模型,就包括行业大模型,当时行业外关注不多,但如果现在看百度的布局,行业大模型其实是前瞻性布局,比 OpenAI 和微软还早。"
如今,通用大模型喧嚣过后,行业模型正在逐渐占据声量,也正印证这一现实:类似 ChatGPT 等基础大模型赚的是 " 吆喝 ",很大程度上是起到教育市场、塑造认知的作用,人工智能真正要落地、要赚到现在的钱,还要看行业大模型。
(资料图片仅供参考)
即便是海外市场,ChatGPT 作为 C 端产品的部分属性,热度也已经逐渐减弱——根据 SimilarWeb 数据,前期 ChatGPT 的访问量增长率惊人,1 月份的环比增长率为 131.6%,2 月份为 62.5%,3 月份为 55.8%,在 4 月份明显放缓,环比增长率为 12.6%,到了 5 月,这个数字已经变为了 2.8%,并预计 6 月的环比增长率有可能为负数。
" 相信我们当中的很多人都试用过了 ChatGPT,也相信很多人试用过之后,已经将它放置一边了,因为目前它和我们的工作基本上还是割裂的,所以用用就放下了。但我依然希望大家不要‘起个大早,赶了晚集’,因为这是一个会带来颠覆性变革的范式革命。" 微软(中国)公司首席技术官(CTO)韦青此前表示。
而基于 ChatGPT 或者大模型,打造的 B 端解决方案,正是解决大模型与场景割裂的良方。
国际上,微软、亚马逊等大厂也开始向企业级服务寻求商业化路径,开始进行多个行业的探索;国内,诸如百度、阿里、腾讯、华为都在快马加鞭加速行业大模型投入。
此外,很多全球范围内的行业龙头和创业公司也正在探索行业大模型的前景,近日,北京市科委、中关村管委会也发布了北京市首批 10 个人工智能行业大模型应用案例。此外,相关技术路线的企业并购金额也屡攀新高……
但大模型赛道还远远称不上拥挤——伴随技术迭代迎来飞跃式发展,各行各业正重新积累技术认知、塑造业务模式,一切才刚刚开始。升级:千模大战
如果说基础模型是 " 百模大战 ",行业大模型就是 " 千模大战 ",就像树干长出树枝,每个基础大模型厂商都可以孵化数个行业大模型,大厂们的行动默契而一致。
" 虽然大家对通用大模型期待很高,但它不一定是满足行业场景需求的最优解。"6 月 19 日,在腾讯云行业大模型发布会上,腾讯集团高级执行副总裁、云与智慧产业事业群 CEO 汤道生表示。
在混元助手没有对外发布的情况下,腾讯率先发布了行业大模型,依托腾讯云 TI 平台打造的行业大模型精选商店,为客户提供 MaaS 一站式服务,帮助企业客户构建专属大模型及智能应用。从腾讯处获悉,有关 C 端的通用大模型,腾讯将在后续发布官方消息。
这一系列举措或许可以理解为,暂且不论混元基础大模型的效果和进展如何,优先发布行业大模型,是在客户急需的情况下,腾讯确保自身声量、抢占市场客户的必要之举。
更早之前,华为云人工智能领域首席科学家田奇提到,华为把大模型分成三个层级,L0、L1、L2,L0 就是大家所说的基础通用模型,像 GPT-3,在基础模型 L0 的基础上,加上行业数据,混合训练得到的行业大模型是 L1。
然后再把 L1 针对具体下游千行百业的细分场景进行一些部署,得到细分场景的任务模型 L2,为了尽快降低生产成本、提高效率,如何从行业大模型 L1 中快速生产 L2 模型,还有部署 L2 模型到端侧、边侧和云侧,这是非常重要的问题。
在 7 月即将举办的华为开发者大会的议程上可以看到,华为云将对盘古大模型如何从基础大模型炼成行业大模型进行一系列的解读和发布。
在今年的阿里云峰会上,阿里云 CTO 周靖人也表示," 今天不是所有的企业都需要从头开始训练,也不需要大家从头开始去做多种语料,包括大量的算力资源,从头开始做大模型的一系列定制,我们希望今天通义千问模型之上,结合企业的场景、企业的知识体系、企业的行业特殊需求,产生一个个企业专属模型。"
微软也在做自己的行业大模型。4 月份,在国内,针对本土出海企业用户,微软 Azure OpenAI Service 国际版发布了首批三套面向零售电商、制造业和数字原生领域的 Azure 全球创新行业场景,集成 GPT-3、GPT-4、Codex、DALL-E 和企业级 ChatGPT 等五种大模型服务,帮助中国出海企业客户加速拓展全球市场。
" 千模大战 " 一触即发,但真正进入大浪淘沙的阶段还为时尚早——整体来说,大模型还处于比较早期的发展阶段,尽管行业大模型集中涌现,但这条赛道显然有更大空间。
以金融行业大模型为例,其分成券商、保险、银行、新金融等不同领域,每个领域的下游任务又分成几十上百种的子任务。
" 更重要的时刻,是接下来基于基础模型,通过 SFT 等机制和构建出能够高效适配下游任务,并且在金融行业或者其他行业模型的下游任务产生规模效应化的时候。" 在阿里巴巴达摩院创新业务中心负责人陈海青看来,只是通过一些普适的非结构化数据做继续训练的行业大模型和场景,才算刚刚开始。
理智且现实的选择
如果企业要做一个千亿级参数的基础大模型,需要单机群万卡以上的算力,不仅要有 GPU 卡,还要把 GPU 的集群资源利用起来,大部分公司都无法做到。
而行业大模型显然更容易实现,同时也兼具更广阔的应用前景。
" 大模型赋能千行百业,但是对千行百业的场景要非常理解,不能指望训练出千亿或者万亿大模型,企业用户拿去就好用 ",澜舟科技创始人周明说。" 从通用模型到行业模型,要针对用户的场景做最后一公里的事情。"
在评估基础大模型所需要的投入,权衡利弊与得失之后,企业客户迅速转向行业大模型,厂商的精力也更多投入于此。
汤道生坦言,目前通用大模型一般都是基于广泛的公开文献与网络信息来训练的,网上的信息可能有错误、有谣言、有偏见,许多专业知识与行业数据积累不足,导致模型的行业针对性与精准度不够,数据 " 噪音 " 过大。
但是,在很多产业场景中,用户对企业提供的专业服务要求高,容错性低。企业一旦提供了错误信息,可能引起巨大的法律责任或公关危机。因此,企业使用的大模型必须可控、可追溯、可修正,而且必须反复与充分测试才能上线。
" 我们认为,客户更需要有行业针对性的行业大模型,再加上企业自己的数据做训练或精调,才能打造出实用性高的智能服务。企业所需要的是在实际场景中真正解决了某个问题,而不是在 100 个场景中解决了 70%-80% 的问题。" 汤道生表示。
百度智能云副总裁朱勇也表示," 从国内和国外的情况可以看到,真正做通用模型的并没有那么多,市面上有一些厂商做的实际上是比较小型的模型。相反,领域模型特别重要,因为通用模型只具备通识能力,领域模型可以跟特定行业、领域的任务预期对齐,解决业务的实际问题,这个过程非常重要,但这个过程所需要的代价和资源远远小于从零开始做底层通用模型。"
同时他还判断,未来基础模型(底层通用模型)可能就几家,但是结合专业领域的数据、行业 know how,上面会长出很多不同类型的领域模型,这些领域模型将来会非常繁荣,支撑上层繁荣的领域应用。
以百度智能云和国网打造的能源行业大模型 " 国网 - 百度 · 文心 " 为例,百度智能云与国网专家们一起,在通用大模型行中引入国网在电力业务积累的样本数据和特有知识,并且在训练中,结合双方在预训练算法和电力领域业务与算法的经验,设计电力领域实体判别、电力领域文档判别等算法作为预训练任务,让文心大模型深入学习电力专业知识,从而真正解决能源领域的实际业务问题,达到降本增效的目的。
朱勇表示,通用模型跟领域模型的区别,可以把通用模型比作上了大学知识面很广的人,他也许知道一些医学的知识,但不能给病人做诊断,不是专业的医生。而领域模型就是在通用能力很强的基础上,深入学习医学知识,成为了一名专业医生,可以在医学领域贡献价值。
从具备很广知识面的通用模型往专业的医学模型,这中间所需要的资源代价,要远远少于从零到一开始建立通用大模型,但它强调的是有专业的数据,要有专业领域的任务来驱动,来激发它产生这样的能力。
行业大模型怎么做
大模型本身就是一个新生事物,它改变了以往的软件开发范式,厂商们更需要一套新的工具链和平台,帮助客户更早更快打磨行业大模型。
随着大模型时代的到来,最后一公里的效率会大幅度提升。周明提到,新一代软件开发范式正在形成,主要是基于企业 prompt 提供很多功能引擎,用户现在是助手可以提高效率,在这个基础上把自己的用户体验想清楚、设计好,就很容易地构造一种新的应用。
以文心千帆大模型平台为例,是面向企业开发者的一站式大模型开发及服务运行平台。不仅提供了包括文心一言底层模型(ERNIE-Bot)和第三方开源大模型,还提供了各种 AI 开发工具和整套开发环境,方便客户轻松使用和开发大模型应用。
诸如数据管理、自动化模型 SFT 以及推理服务云端部署,厂商希望能够实现一站式大模型定制服务。不同厂商的大模型构建平台能力基本相似,不同的是易用性、效果好坏、支持的软硬件等方面。
" 做大模型确实不便宜,但最终能够让大模型服务推广开来的原因只有两个:第一个是模型效果要好,模型效果不好,其他都不用讲,第二个就是成本。" 百度智能云 AI 与大数据平台总经理忻舟表示。
在效果上,行业模型要依托于通用大模型。比如通识教育,如果没有比较好的通用模型就没法谈在具体一个行业的应用效果。Bloomberg 和约翰霍普金斯一起推出的 Bloomberg GPT 就是例子,在它的数据分布中,通用基础模型数据占一半,金融行业公开数据占一半,还有 Bloomberg 自己的数据占 0.6%。
" 任何一个模型要能达到较好的智能水平或者基础能力,一定得在比较好的参数量训练基础模型,在基础模型上再融入一些行业专业数据做行业模型。" 忻舟说。
百度的思路是先推出一个 " 大家伙 "(文心一言),一个非常完整的工具平台(文心千帆),然后根据客户实际需求提供差异化的模型服务,帮助客户做性价比最高的选择,他们认为,价格不会成为企业拥抱大模型的瓶颈。
除了模型调用成本、训练成本,百度还在帮助企业做进一步的成本下降,如果企业只是聚焦在自己相对比较狭窄的领域上,百度也有相对低参数的版本,这样在保证模型效果的同时,使用或者训练模型的成本将会大幅下降。
事实上,打造行业大模型的成本没有通用标准。
首先,不同的基础大模型有不同的参数规格,软硬件投入要根据模型的基础参数和能力动态变化。如果是百亿参数,一台 A100 卡也能跑起来,就能开始下游任务。
当前比较集中的应用场景需求就属于这类,比如知识管理类中智能问答、智能写作、智能创作,还有泛互联网营销场景和代码生成的需求。
其次,成本跟数据量和应用方向有关。当前全球大模型定价都是以 1000 Token 为基础单位计费。如果企业的下游任务很简单,只需要几万 token 就能做好,那它的成本就非常低,需要的 GPU 卡就非常少。而构建一个行业大模型所需的数据量通常以 G 甚至以 T 为单位,那它的离线训练成本就会非常高。
谁在抢跑?
大模型赛道玩家蜂拥而至,这次不仅仅是一线互联网大厂,还有更多行业龙头和创业公司加入。
哪些行业能率先突围?或许从合作案例所处行业可以窥见一斑,如文章开头的表格所示,金融、医疗、教育、自动驾驶等领域应用频繁。
例如,阿里云在四月份发布通义大模型时宣布已和多家企业已经展开了合作探索,首批合作的企业有 OPPO 安第斯智能云、吉利汽车、智己汽车、奇瑞新能源、毫末智行、太古可口可乐、波司登、掌悦科技等。据介绍,金融行业、零售行业,以及一些面向大型 C 端的场景和行业已经积累了比较多的公开数据、场景数据,便于构建企业或者行业专属模型。
据公开资料显示,百度文心行业大模型的数量已经达到 11 个,覆盖能源电力、金融、航天、传媒、影视、汽车、城市管理、燃气、保险、电子制造和社科多个领域。
6 月 27 日发布的北京市首批十个人工智能行业大模型应用案例涉及能源电力、医疗健康、金融、自动驾驶、建筑、科研、生活、问答等领域。
据悉,6 月 27 日至 7 月 30 日期间,北京市科委、中关村管委会还将聚焦城市治理、医疗健康、科学研究、智慧金融、智慧生活、智慧城市等重点领域,面向全市创新主体,将征集 80 余项行业大模型应用案例项目。
但更多的客户正面临一波新的知识积累和学习的过程。" 我们和客户交流时发现,很多客户对行业大模型还不太了解,但会主动提出需要百度的行业大模型。" 百度智能云 AI 平台副总经理李景秋说,这个时候会具体结合企业实际用的产品跟客户解析需求,例如希望行业大模型具备什么样的能力、用在什么系统或应用里面、这些应用到底被谁用、希望达到什么效果……
这些问题问完之后,才会真正发现客户需要的是基于文心千帆的工具链 SFT 的大模型,还是要构建行业的预训练模型。后者起码需要几个月、甚至上年的时间去构建部署——从数据的处理、算力层的资源配置等技术问题,到跟行业通用数据的长期训练。
从基础大模型喧嚣渐远,到行业大模型华灯初上,迈入 2023 年下半年,一场真正的商业变革将加速启动。
对比百度等国内厂商和 OpenAI/ 微软在大模型领域的路径,也是一件颇有意思的事情——在 ChatGPT 呈现全球现象级热度时,有声音质疑,中国为什么做不出来 ChatGPT,其中固然有技术环境、商业氛围等一系列的复杂成因,最终很多人还是有一个粗浅的共识—— " 中国 AI 更倾向于业务应用和商业化的能力 ",直白点说,中国 AI 耐心更少,更想赚钱。
但反过来讲,市场是技术发展的最大推动力,对于时间和节奏的把握,造就了不同的结果。就以行业大模型为例,微软或是在等待技术的进一步成熟,或是觉得还没到时机,慢了一步,国内厂商迅速从基础大模型过渡到行业大模型,大模型落地于场景,才能有持久的生命力。
失之东隅,收之桑榆,以结果论,国内行业大模型跑得快,不是一件坏事。
责任编辑:hnmd003
相关阅读
相关阅读
-
行业大模型,开卷!
文心一言看起来是匆忙上马,我认为这个东西根本就不是为了赚钱,就是为
-
iQOO 11S 首发评测:4000 元价位段的水桶型旗舰|全球速读
今年国内的手机市场除了「卷」我找不到其他形容词,手机厂商为了提升自
-
焦点简讯:推出全新咨询部门!德勤进军太空了
就是说,真不把硅谷的techfirms当回事是吧?现在的consultingfirms一个
-
欧盟委员会修改程序,欲加快对大型科技公司的隐私调查 天天热文
据报道,因被外界批评对隐私调查进展缓慢,且鉴于爱尔兰隐私监管机构在
-
这些小屏旗舰,把我带回了五年前的那个夏天
图片来源@视觉中国文|雷科技斯蒂芬 乔布斯曾经说过,3 5英寸是手机的
-
一涨再涨!有人手握 50 万发愁:要不要再下手?紧急提醒
6月30日,2023年上半年的最后一天,美元对人民币汇率冲高回落。当天,
-
Costco 为何严打“共享会员卡”?|新资讯
图片来源@视觉中国文|零售商业财经,作者|博雅,编辑|鹤翔Costco(开市
-
西藏出台人社领域优化营商环境若干政策措施
日前,西藏自治区人力资源和社会保障厅办公室印发了《全区人社领域优化
-
农村低保标准是什么条件?农村低保多久可以审批下来?
农村低保标准是什么条件?(1)没有经济来源、或者丧失劳动能力的、或无法定赡养人的老人或抚养人村民;(2)...
-
医保卡丢了怎么挂失?医保卡丢了还能去医院看病吗?
医保卡丢了怎么挂失?医保卡丢失可以补办的。具体办法如下:1、拨打医保服务热线12333(24小时服务)进行电...
-
西藏出台人社领域优化营商环境若干政策措施
为深入贯彻西藏自治区党委、政府关于优化营商环境的决策部署,充分发挥
-
2023年暑运启幕 拉萨火车站预计发送旅客62万人次|新动态
拉萨火车站出行旅客。通讯员李海星孙呈统记者张雪芳图由孙呈统提供7月3
-
每日快播:拉萨市市场监督管理局:加强展会知识产权保护 维护各类展会秩序
为认真贯彻区市党委、政府关于做好展会知识产权保护工作的安排部署,切
-
工商银行抵押贷款多久下款?工商银行抵押贷款条件及流程
工商银行抵押贷款多久下款?工行抵押贷款一般需要22-25个工作日放款。办理房产抵押贷款流程:1、借款人在...
-
高管离职是利好还是利空?高管离职后多久可以卖股票?
高管离职是利好还是利空?这个如果没有什么特别的原因引起的离职的话是没有什么利空利好的,如果是恶性离...
-
什么是卖空?卖空成交占比高说明什么?
什么是卖空?卖空又称做空,是股票期货市场常见的一种操作方式,操作为预期股票期货市场会有下跌趋势,操...
-
什么是创业板股票?什么条件可以买创业板股票?
什么是创业板股票?创业板市场可以称为二板市场,也可以称为第二股票交易市场,它是不同于主板市场的一个...
-
以军从约旦河西岸杰宁撤离|快看
巴勒斯坦安全人士4日说,以色列国防军当晚从约旦河西岸北部杰宁地区撤
-
大晟文化7月5日快速上涨-即时焦点
以下是大晟文化在北京时间7月5日09:58分盘口异动快照:7月5日,大晟文
-
环球快报:澳大利亚发布酒精饮料和含酒精食品标签标准
澳大利亚发布酒精饮料和含酒精食品标签标准
-
焦点快播:百万医疗险能报销几次住院?报销多少?
具体能否报销多次住院也取决于保险合同中的约定。一些百万医疗险产品可
-
世界消息!百万医疗包括哪些疾病?精神病可以买百万医疗吗?
视情况而定。 一些百万医疗保险产品会明确将精神病列入其保障范围之内
-
光大永明人寿百万医疗险咋样?保障什么? 天天热点评
比较不错,光大永明人寿百万医疗险是一款以保障个人医疗费用为主要目标
-
太平洋安享百万医疗保险有必要买吗?住院能报销吗? 世界球精选
太平洋安享百万医疗保险是由太平洋保险集团提供的一款医疗保险产品。太
-
【世界报资讯】投保百万医疗险需要体检吗?可以带病投保的百万医疗险有哪些?
根据具体情况而定。是否需要体检主要取决于个人的年龄、健康状况以及保
-
联动科技(301369)7月4日主力资金净卖出943.45万元|全球快资讯
截至2023年7月4日收盘,联动科技(301369)报收于81 91元,下跌1 17%,换
-
比亚迪加入拉丁美洲锂矿开采热潮|全球最新
比亚迪加入拉丁美洲锂矿开采热潮盖世汽车讯据外媒报道,中国电动汽车巨
-
世界即时:比亚迪宣布在巴西建设生产基地,投资额将达45亿元
比亚迪宣布在巴西建设生产基地,投资额将达45亿元盖世汽车讯据彭博社报
-
世界实时:肯塔基州支持采用特斯拉充电标准
肯塔基州支持采用特斯拉充电标准肯塔基州发布的该州电动汽车充电项目招
-
科技服务“上门” 政策红利“到家”
日前,九原区工科局组织科技服务机构分别前往包头市民族三兄弟饲料有限
精彩推荐
阅读排行
精彩推送
- 世界短讯!全市涉及药品和医疗用...
- “新包头 新青年”作品展播|我...
- 焦点快播:“便民大集进社区”直...
- “新包头 新青年”作品展播|如...
- 购买自住房的提取时限和提取额度...
- 伦敦金是现货还是期货?伦敦金交...
- 我国宪法规定今后国家的根本任务...
- 空翻多是什么意思?股票空翻多是...
- 出租车拒载的相关法律规定内容都...
- 新股停牌一般停多久?新股停牌规则
- 外地车牌能进北京吗?异地驾驶证...
- 国际货运代理运输方式都有哪些?...
- 焦炭期货是哪个交易所?焦炭期货...
- 债权人权益都有哪些?什么时候能...
- 小米裁员也拿不回钱:复制不了的...
- 投资者:强烈建议造车,宁德时代...
- 供应商称小米第一款车型已经报价...
- 华为与北京地铁战略合作 聚焦城...
- 三星专利书,压不住中国四大屏厂
- 当前资讯!经济第四大省,不想再...
- “寡淡”的汾酒,该何去何从?
- 董海锋再造“薇娅”
- 全球微动态丨投资者:强烈建议造...
- 储户 1 次只取 1 元钱气哭柜...
- 西藏:夏日普莫雍错美景如画 热消息
- “心连心·京藏号”旅游列车7月2...
- 以“训”应“汛”,西藏林芝市森...
- 2023全球数字经济大会拉萨高峰论...
- 援藏青年志愿者吴兆阳:让青春在...
- 车险的改革内容都有哪些?什么是...