华为的大模型终于来了,我的评价是:相当震撼。
2023-07-08 06:24:14来源:ZAKER科技
这不,在昨天的华为开发者大会 2023 上,华为就狠狠地秀了一把。
将近三个小时的发布会,还是继承了华为以往大杂烩的风格,看得世超是眼花缭乱。
【资料图】
不过,总结下来其实也就突出了一个主题:盘古大模型 3.0 。
其实就在前几天,当别的大模型还在比各种评分的时候,盘古靠着世界顶级期刊 Nature 认证的金字招牌,以一种别具一格的方式进入了大家的视野。据说,加入了盘古大模型,气象预测的速度提高了 10000 倍以上,几秒钟就能出结果,台风打哪来,几点来,啥时候走,都能给你预测得明明白白的。最主要的是,它的预测精度甚至超过了号称全球最强的欧洲气象中心的 IFS 系统,算是头一个 AI 预测赢了传统数值预测的产品。
要知道,以往的 AI 气象预测多是基于 2D 神经网络开发,但气象这玩意实在是太复杂了,2D 着实有点儿吃不消。而且,之前的 AI 模型会在预测的过程当中不断累计迭代的误差,容易影响到结果的精确性。
所以 AI 预测方法一直都不咋受待见。
而盘古气象大模型牛就牛在,他们用了个叫 3DEST 的三维神经网络来处理气象数据, 2D 干不了的那就换 3D 来。
3DEST 的网络训练和推理策略
针对迭代误差的问题,模型还用了个 " 层次化时域聚合策略 " 来减少迭代误差,从而提高预报的精度。这词儿虽然听起来挺容易被唬住的,但其实很好理解。
就比如,之前的 AI 气象预测模型 FourCastNet ,在台风来之前,它会提前 6 小时进行预测,在这 6 个小时里,模型会多次计算台风到底啥时候来。
可能一会儿算出来 5 个小时,一会儿又算出来 4 个半小时,这些结果加到一起误差就大了。
但盘古气象大模型想了个法子,训练了 4 个不同预报间隔的模型,分别是 1 小时迭代 1 次,还有 3 小时、 6 小时和 24 小时迭代 1 次。
再根据具体的气象预测需求,选择相应的模型进行迭代。
就比如说,咱们如果要预测未来 7 天的天气,那就让 24 小时的模型迭代 7 次;预测 20 个小时就是 6 小时的模型迭代 3 次 +1 小时的迭代 2 次。迭代次数越少,误差也就越小。
这波操作,让天气预报又迈向了一个新的 level 。
不过,可能有差友开始犯嘀咕了,人家的大模型都是生成图像和文字,怎么到华为这就变成了天气预报了?
有一说一啊,这盘古大模型跟咱之前接触到的 ChatGPT 、 Midjourney 的确不太一样,人家做的是行业的生意。
简单来理解,就是盘古大模型咱个人一般用不上。它并不是大家期待的 ChatGPT" 克星 " ,而是针对平时不太能接触到的To B 市场。
咱先不提难与不难,至少华为这么多年积累下来的企业客户资源,确实很容易变现。
而且华为这次的发布会可不止带来了气象预测模型这一个狠角色。
40 多年都没发现新的抗生素,盘古药物分子大模型一来就找着了超级抗菌药 Drug X ,而且药物的研发周期从数年缩短至几个月,研发成本降低 70% 。
盘古矿山大模型也能深入到采煤的 1000 多个工序之中,而且光是里头挑选精煤的这一个环节,就能让精煤回收率提升 0.1% 到 0.2% 。要知道,一家年产 1000 万吨焦煤的选煤厂,每提升 0.1% 精煤产率,每年就能多 1000 万的利润。
这可都是白花花的银子啊。。。
事实上,除了上边儿咱提到的天气预测、药物研发和选煤,盘古大模型在很多行业里都已经用起来了。
发布会上,华为云人工智能首席科学家田奇就表示,华为云人工智能项目已经应用在了超过 1000 个项目中,其中 30% 用在客户的核心生产系统里,平均推动客户盈利能力提升了 18% 。而华为能够量产这些各不相同的行业大模型,要归功于华为盘古大模型 3.0 的 5+N+X 三层架构。
正是这种结构,让盘古能够快速落地到各个行业里。为什这么说呢?
因为 AI 落地行业,数据是一大难点。
张平安在发布会上就说, " 由于行业数据获取难,技术与行业结合难,大模型在行业的落地进展较慢。 "
而盘古则很巧妙,通过 5+N+X 的三层架构,直接把这个大难题拆成了 3 个小问题来解决。
首先,是先让盘古 L0 层的 5 个大模型,学习了上百 TB 的百科知识、文学作品、程序代码等文本数据,以及数 10 亿张带文本标签的互联网图像。
咱们可以理解为,先让第一层 L0 的大模型( 自然语言大模型、视觉大模型、多模态大模型、预测大模型、科学计算大模型这 5 个基础大模型 )建立起基本的认知,也就是有点像咱们大学前的素质教育阶段。然后,在第二层 L1 中的模型,则是让 L0 中的某一个基础大模型学习 N 个相关行业的数据形成的。这就像大学的本科阶段,需要选择各种专业去学习。
打个比方,医院里的 CT 影像检测跟工厂的图像质检虽说用的都是视觉大模型。但毕竟一个是医院,一个是工厂,使用场景完全不一样,光靠基础大模型那肯定行不通,但如果把行业数据加进去,可能就有惊喜了。
最后的 L2 ,则类似研究生,会在具体行业的基础上再细化到某个场景。比如在仓储物流行业里,货物的运输、入库、出库可能都需要用到不一样的部署模型。与此同时呢,华为还在里头加入一个反馈环节,有点进公司实习内味了。
根据他们的说法,过去开发一个 GPT-3 规模的行业大模型,通常需要 5 个月;而有了这套东西,开发周期能缩短至原来的 1/5 。
同时很多行业数据集小的限制也能被解决。比如造大飞机这种很细很细的行业,也能有大模型。
除了这一套大模型,华为这次还提出了个非常有意思的东西——算力国产化。众所周知,咱们在 AI 算力方面,确实是比较尴尬。
一来, AI 行业的核心设备英伟达的 H100/A100 咱们买不到,二来,即使英伟达 " 贴心 " 出了平替 H800 ,但是也有所保留。比如,在传输速率上就砍了不少。
在大模型动辄几个月训练时间的背景之下,这就很容易被算力更强的国外同行弯道超车。
而这一回,针对这个问题,华为还是掏了些真家伙出来的。
比如,在纸面性能上,华为的昇腾 910 处理器已经够上了英伟达 A100 。不过实际应用起来,还是有一些差距的。而且 A100 这也不是英伟达的终极武器。
但是,昇腾已经受到了不少友商的认可。华为甚至在发布会上,直接表示 " 中国一半大模型的算力都是由他们提供的 " 。当然,华为这会儿在算力上的亮点,更像是整个软件生态带来的。比如,根据发布会的说法,算上 AI 昇腾云算力底座、计算框架 CANN 。。。等环节,华为在训练大模型方面,效率是业界主流 GPU 的 1.1 倍。
还有,他们给用户制定好了全套的应用套餐。例如,美图仅用 30 天就将 70 个模型迁移到了华为生态。同时华为还表示,在双方的努力下,AI 性能较原有方案提升了 30% 。还是挺可观的。
而且华为还说,他们现在有近 400 万的开发者,这个数量,是和英伟达 CUDA 生态对齐了。
这一系列的动作,算是把短板补上了一部分。总的来说,一场华为发布会看下来,差评君觉得华为在 AI 方面的布局是很深刻的,他们早就开始思考 "AI 真正能带给我们什么 " 这个问题了。
过去半年里, AI 行业虽然掌声雷动,但是真正落到行业层面,多少有些尴尬。
而华为的这一次动作,恰好印证了如任正非说的:
" 未来在 AI 大模型方面会风起云涌的,不只是微软一家。人工智能软件平台公司对人类社会的直接贡献可能不到 2% , 98% 都是对工业社会、农业社会的促进。 "
AI 领域,真正的大时代还在后头。
责任编辑:hnmd003
相关阅读
相关阅读
-
华为的大模型终于来了,我的评价是:相当震撼。
老被人说在大模型竞赛中掉队的华为,这次终于带着它的家伙事儿来了。这
-
财付通回应!
财付通回应央行行政处罚决定:诚恳接受、坚决服从和落实,严格执行相关
-
纺织服装品牌力跟踪月报202306期:品牌上新营销积极,比音勒芬发布新十年规划
核心观点搜索指数:部分运动品牌积极营销和推新,比音新十年规划引发高
-
国际首台大型非谐振全储能快循环脉冲电源通过测试
7月7日,国家重大科技基础设施强流重离子加速器增强器BRing二极铁电源
-
东方甄选自建电商平台:俞敏洪要“摆脱”抖音单飞,打造直播版山姆会员店?
抖音直播带货“一哥”东方甄选在近日开启了自有App的直播之路。7月5日
-
【全球时快讯】腾讯回应旗下财付通被罚没近30亿元:对集团整体没有任何重大不利影响
腾讯控股在港交所发布公告,公司注意到,财付通已收到中国人民银行
-
股票行情快报:丽珠集团(000513)7月7日主力资金净卖出358.16万元
截至2023年7月7日收盘,丽珠集团(000513)报收于36 63元,上涨0 85%,换
-
非农就业数据支持美联储7月升息 鹰鸽之争可能愈演愈烈
6月份强劲的非农就业报告和高于预期的薪资增速令美联储继续行驶在升息
-
梅州客家3比1击败成都蓉城 时隔8轮重迎久违胜利
当陈哲超上半场补时阶段打进那粒进球的时候,整座梅州城似乎都在欢呼,
-
厦门贝壳梦幻世界电话(厦门贝壳梦幻世界)
来为大家解答以上的问题。厦门贝壳梦幻世界电话,厦门贝壳梦幻世界这个
-
世界银行前行长:美国无法遏制中国发展
世界银行前行长罗伯特·佐利克在接受《华盛顿邮报》采访中表示,冷战是
-
华为盘古大模型 3.0 发布,友商们该急起来了?
「AIforIndustrise大模型重塑千行百业。」华为云官网上醒目地挂着一句
-
AIGC 资本盛宴:半年融资超 1000 亿,腾讯英伟达各投三家
作者|徐珊编辑|云鹏1000亿元人民币,在短短六个月内,流入了全球各大AI
-
阿里巴巴股价一度涨超 6%,入局 AI 大模型“国家队”
IT之家7月7日消息,热门中概股今日集体走高,阿里巴巴一度涨超6%,是表
-
支付宝、财付通收央行巨额罚单 分别被罚没超 30 亿和近 30 亿
财联社7月7日电,中国人民银行对支付宝、财付通开出巨额罚单。其中,针
-
蚂蚁集团回应被罚:诚恳接受、坚决服从
【蚂蚁集团回应被罚:诚恳接受、坚决服从并将进一步夯实合规治理水平】
-
多地迎“大烤”!极端高温持续,实现空调自由需依靠两类能源
又到了靠空调“续命”的季节。“卖得老好了,一天能安装十几台,师傅们
-
郑州交警:倾听群众出行诉求,积极进行整改优化!
郑州交警:倾听群众出行诉求,积极进行整改优化!,匝道,交警,群众,航海
-
好山好水,出好茶丨茶香中国·北纬24度的偏爱①
端起一杯茶,当杯中香气扑鼻而来,你嗅到的不只是茶香,更是来自北纬“
-
实事求是,在众说纷纭之时“一言立骨”
要引导主流声音,就要去找寻引发共鸣的评论视角,在众声喧哗中找准“裂
-
中医药为何应成为中华文化走出去的先锋?
中医药已经不只是中国人健康长寿的“秘方”。随着世界范围的中华文化热
-
6 月发行商收入榜:网易两款新品冲入畅销前三;紫龙、深蓝互动收入大涨
7月7日,SensorTower发布了6月中国手游发行商收入榜。本期共有39家中国
-
399 元听流行音乐利器!锐可余音 SG03S 入耳式耳机
点击上方播放视频来自ZEALERApp创作者【乱弹发烧友】,本期视频主要是
-
iPhone 16 Pro 采用固态按键可能性很低
科技 TechnologyiPhone16Pro采用固态按键可能性很低华为鸿蒙4 0第二期
-
《可信赖 AI 安全隐私技术研究》白皮书发布
北京商报讯(记者杨月涵)随着人工智能基础设施、设计研发及融合应用取
-
大模型内卷:2 天发了 10 余款,百模大战开打了
卷数量7月6日至7日,在上海2023年世界人工智能大会召开的2天时间里,据
-
海南“村VA”丨职业球员韩皇光助阵 海口三门坡镇队0:3不敌文昌蓬莱镇队
椰视频丨职业球员韩皇光凭借超强弹跳力频频暴扣,引发全场欢呼新海南客
-
电视价格止跌回升背后:年末备货旺季到来,部分面板产品涨价近四成
面板行业传来捷报,显示多类消费电子需求开始转暖。集邦咨询近日发布的
-
揭秘华为行业大模型:不作诗的盘古,只做哪些事?
“华为盘古大模型不作诗,只做事。”7月7日,华为开发者大会2023(Clou
-
“彩票龙头”变身最牛AI概念股,股价大涨4倍!重奖美女CEO超6500万元股权
连续五年扣非净利润为负,去年跨界AI领域后,股价在今年内录得超4倍的
精彩推荐
阅读排行
精彩推送
- 巨额罚单落地!平台企业整改基本...
- 环球今头条!阿里巴巴美股涨逾4%...
- 每日速讯:财付通被罚没近30亿元...
- 2023年7月总票房破20亿元
- 【中超】于汉超破门埃弗拉中框 ...
- 让高温下奋进的劳动者平安度夏
- 深城交:联想北京拟减持不超过 3%
- 推特遭 Threads 突袭,马斯克...
- 敲定了!9 家光伏组件企业联合官宣
- 规范中央银行存款账户服务及管理...
- 猴子“意念”玩游戏!世界人工智...
- 国有大行、股份行、中小银行统统...
- 支付宝、财付通收央行巨额罚单 ...
- 绝地求生message怎么解决(绝地...
- 拘留罚款3500元 三亚一男子无证...
- 名场面!16家车企联合承诺不打“...
- 从“蔚小理”到“理蔚小”:销量...
- 世界人工智能大会 2023 | 奥...
- 蚂蚁集团及旗下机构被罚没71.23...
- 天天要闻:浙江证监局:对蚂蚁(...
- 蚂蚁集团回应被罚71.23亿元:收...
- 每日快讯!支付宝、财付通收央行...
- 蚂蚁集团被罚款71.23亿元
- 苹果占优势的平板电脑行业,安卓...
- 技术杀疯?荣耀革命性折叠屏创新...
- 蚂蚁集团及旗下机构被罚款 71.2...
- 蚂蚁集团被罚款 71.23 亿元
- 浙江证监局对蚂蚁基金公司罚款 ...
- 仓储会员店:未来几年还是山姆、...
- 所有参与低价团购的餐厅,都不值...