首页 > 新闻 > 智能 > 正文

【天天新要闻】360+ 智谱 AI,中国版“微软 +OpenAI ”来了

2023-05-16 23:25:04来源:ZAKER科技  

在大模型核心技术研发上,360 采取自主研发 + 合作研发 " 双引擎 " 驱动,提升核心 " 发动机 " 的竞争力。

作者 / 洛枳 南溟

出品 / 新摘商业评论

ChatGPT 的成功绝不是凭一己之力,这款史上增长速度最快应用背后,合作者微软起着至关重要的作用,正是产研合作,才促成了大语言模型技术的颠覆性变革。中国已经掀起了大模型之争,然而几个月的喧嚣,却没有一家公司走上这条已经被验证的道路,中国版的 " 微软 +OpenAI" 是否会出现,是产业界关注的焦点。


(资料图片仅供参考)

今天,360 公司和智谱 AI 的合作给出了答案,双方宣布达成战略合作。双方共同研发的千亿级大模型 "360GLM",并宣布该模型已具备新一代认知智能通用模型水准。

中国的大模型时代正在来临

ChatGPT 的发布引发了一场大变革,微软宣布 ChatGPT 接入 Office 全家桶更是在应用上面带来了颠覆性创新,震惊了整个世界。

回看国内,在 ChatGPT 发布并应用后,各家大厂很快跟进,百度的文心一言,阿里的通义千问,科大讯飞的星火等都在大模型领域不断有新突破。

与此同时,各大厂也意识到,大模型技术的推进和具体应用结合的紧迫性。阿里云宣布阿里所有产品未来将接入 " 通义千问 " 大模型全面升级;科大讯飞的星火大模型具备文本生成、知识问答、数学能力等核心能力。

现实情况是,虽然很多公司都推出了大模型,但是各家大模型能力相差无几,没有一家能够遥遥领先、一统江湖,但可以肯定的是,当大家都在 " 画饼 " 时,落地才是关键。

业界有一个共识,最后能够胜出的决定性因素是 " 场景 ",拥有场景的公司才能在未来的大模型产业竞争中占据领先地位。

大模型技术本身不再是一个门槛,产业和研究如何更好地结合,如何更好地落地,是所有入局大模型的玩家需要进一步思考的问题。

显然,沿着被验证过的路径走更容易获得成功。

360 和智谱 AI 的合作,完全可以看做是中国版的 " 微软 +OpenAI"。

如果只有产业公司,会缺乏 Open AI 科学家长期主义的理想,可能没有人想到在大模型编码人类所有的知识这条路上走得更远。

反过来也是同样的道理,如果只有 Open AI,不断发论文是没有意义的,毕竟论文和技术如果不能跟用户的场景相结合,也是不能成功的。

微软和 Open AI 有非常好的分工:微软在自己的产品里绑上 Open AI 的服务,让 Open AI 的服务真正实现工程化、场景化、产品化,甚至包括商业化。

Open AI 不一定擅长商业化,也不一定擅长产品和场景化,但就从核心技术上不断从 GPT3.5 到 GPT4.0,说不准 GPT5 已经在路上。

国外已经蹚出了一条成功的产研结合的道路,360 没有理由拒绝模仿这条成功的道路。

技术 + 场景的 " 中国 GPT 组合 "

智谱 AI 是由清华大学计算机系技术成果转化而来的公司,被评为国内 " 最具 OpenAI 气质和水准 " 的公司,去年 11 月,斯坦福大学大模型中心对全球 30 个主流大模型进行全方位评测,智谱 AI 研发的双语千亿级超大规模预训练模型 GLM-130B 是亚洲唯一入选的大模型。

专业测评结果显示,GLM-130B 的准确性等关键指标与 OpenAI、谷歌大脑、微软和英伟达等公司的大模型接近或持平,全球已有 70 个国家 1000 余家机构申请使用。

智谱 AI 作为领先的大模型技术企业,在追赶 OpenAI 方面处于头部位置。然而单纯的技术过硬并不够,更重要的成就表现在落实到现实场景的应用中去。

此次 360 和智谱 AI 的合作,正是大模型与场景结合的重要实践。360 创始人周鸿祎一直强调场景在发展大模型中的重要性,他曾表示,技术如果不能跟用户的场景相结合,是不能成功的。

随着 ChatGPT 对人类的影响不断加深,国内越来越多的企业闯入大模型领域,对此,周鸿祎表示:最关键的已经不是你拥有大模型的技术,而是如何借鉴微软和 OpenAI 的合作模式,如何能够拿到更好的数据进行训练,如何实现更好的工程化的训练方法,以及,如何找到更好的用户场景,能够使用你的大模型。

据了解,360 浏览器平均 MAU 为 4.16 亿,360 搜索日均请求量超 10 亿次,这为大模型后续的流量运作、用户反馈、模型调优奠定了基础。

360 比肩微软 " 全家桶 " 的全端应用恰恰为智谱 AI 提供了技术落地机会,同时,通过全端应用的数据,又能帮助大模型技术提供数据支持,对于大模型来说,更多的数据支撑和场景信息反馈,也是辅助其改进的重要一步,技术与数据共同作用下产生飞轮效应。

一定程度上来说,大模型的 " 卷 ",卷的不仅仅是技术,还有技术和应用的结合。

这一点,微软和 OpenAI 的产研合作模式,已经验证了其可行性。与此同时,国内大模型技术落地方面,还需要考虑更全面的应用,而不仅仅局限于某一领域,某一场景。

拥有能够和微软匹敌的用户场景,360 和智谱 AI 的合作将成为中国版 " 微软 +OpenAI" 模式的最佳范本,在大模型产业竞争中占据一定优势,双方在技术上的的强强联合,在技术与场景的互补性上,能够将国内大模型产业竞争提升到全新的维度。

AI 时代,360 的两条线

360 的人工智能战略是 " 两翼齐飞 ",一方面发展核心技术,另一方面抢占用户场景。

在大模型核心技术研发上,360 采取自主研发 + 合作研发 " 双引擎 " 驱动,提升核心 " 发动机 " 的竞争力。

360 一直以安全闻名,实际在 AI 技术上,360 一直是国内的第一梯队,有着长期的积累。早在 2015 年,360 就成立了人工智能研究院,将 CV、NLP 等 AI 前沿技术应用于 IOT、安全大数据等领域。同时,承接了安全大脑 - 国家级人工智能开放平台项目。

得益于拥有国内先进的多模态研发团队,360 在自然语言理解、机器视觉与运动、语音语义交互等方面达到行业领先,核心成员和团队多次荣获 AI 相关比赛冠军 / 提名奖项。

大模型相关技术上,360 通过多模态学习解决跨模态检索,提升了搜索效率,接着,利用迁移学习技术、快速落地文本分类、信息检索、人机对话、NER、Summary 等能力进行了中文语言模型预训练研究。

之后,360 着手图文跨模态研究,在 50 亿图文对中精选 2300 万高质量中文图文跨模态数据集开源。后续在 CV、AIGC 和 MLLM 上的研究,让 360 在大模型上的前期准备有了更坚实的基础。

在 CV 上,OVD 开放了世界目标检测大模型 Zero/Few Shot;在 AIGC 上,中文 Stable Diffusion 模型尝试解决了 40 亿图文对解决中文理解问题;在 MLLM 上,具备原生视觉和语言能力的多模态 GPT 通过领域对齐实现了跨模态知识迁移。

综合来看,360 的自主研发经历了自然语言理解、机器视觉与运动、多模态大语言模型等过程,日益精进。

基于 AI 核心技术,360 借助自身优势场景," 四路并发 " 落地大模型,分别面向消费者、中小微企业、行业、政企和城市提供大模型相关产品和服务。

360GPT 的产品矩阵是 360 智脑,360 智脑全景包括 360CV 大模型、360GPT 大模型、360GLM 大模型、360 多模态大模型。

周鸿祎对自家大模型的落地有着清晰的规划,"360 智脑 " 率先落地搜索场景之后,结合 GPT 能力的智能浏览器、AI 生图工具和企业智能营销云将很快面向 B 端用户开放测试。显然在策略上,360 并不急于求成,而是聚焦用户刚需,成熟一个场景,开放一个场景。

周鸿祎在多个场合强调,中国的大模型落后 GPT 两年左右,发展起来需要的是用户的支持、理解和宽容。在有些问题、有些技能方面,中国玩家有后来居上的可能。只是说在有些能力方面,像强推理能力、思维链、涌现的能力还需要一个过程。

诚然,中国的 GPT 发展得确实还不够成熟,但谁知道最后的胜出者会以什么方式出现呢,而这个玩家会不会是复制 " 微软 +OpenAI" 成功模式的 360 呢?我们拭目以待吧。

往期回顾

新摘网全新上线

关键词:

责任编辑:hnmd003

相关阅读

相关阅读

推荐阅读