环球速讯:AI 基础软件,在大模型时代讲出新故事
2023-06-21 15:22:20来源:ZAKER科技
大模型热潮,让多家企业冲在 AI 产业底座的路上。
(相关资料图)
从交换机到高端 AI 服务器,再到云计算和数据中心都进入新增长周期。从 1 到 10 掀起 " 千模大战 " 的 AI 革命,将首先在软件和应用领域展开。
其中,算法作为实现 AI 功能的关键,基础软件为其提供运行的平台和工具。随着算力性能逐渐同质化和标准化,数据的差异性和企业需求的个性化逐渐加大,"AI 基础软件 " 作为模型训练效率和算力使用效率的决定性因素,地位更加凸显。
在企业迫切寻求生成式 AI 应用的加速工具和服务的需求下,一边 NVIDIA AI Enterprise 软件套件和 Azure 机器学习相结合,供开发者构建、部署和管理大型语言模型的 AI 应用;另一边在产业起跑发令枪尚未响起之时,有前瞻性的国内 AI 基础软件玩家也开始蠢蠢欲动。
沿着 " 把数据变成模型,让模型变简单,让模型真正用起来 " 的轴线发展,萌芽于硅谷车库,由两位前微软工程师创办于 2013 年的九章云极 DataCanvas,经历过去十年随着 AI 技术的不断普及和深入应用后,在这次大模型 moment 的爆燃之下,也欲发起新动作。
微软工程师回国创业,入局数据科学平台
作为 AI 赛道的早期入局者,九章云极 DataCanvas 背后站着两个男人:方磊和尚明栋。
两人在美国待了 10 年,不仅是美国雪城大学攻读计算机工程硕士时的同窗好友,后又都加入微软工作。2008 年,微软从各个团队中,抽取精明强将,组成了类 startup 的团队,晚亚马逊 2 年冲入云计算,方磊跟尚明栋便是其中之二。
彼时,身处内部,两人从工程师角度看到了很多趋势,比如早期微软只提供 PaaS 服务,后被市场教育,又变成了提供 SaaS 和 PaaS 服务。在大厂率先试错的过程中,2011 年,云上收入增长迅速,多家企业规模量级发生变化。
尚明栋观察到,一些传统的大公司,开始成批量把算力往云上去迁移,验证了当初杰夫贝索斯对云建设的初衷。
" 一开始有人嘲笑说云建设就是弄一堆 RDC 的机房,但贝索斯的愿景是以后接管所有企业的 IT,从底层计算存储一直到上层数据能力建设等各种基础能力的建设。企业不需要再有一个 IT 团队去维护,以非常低的成本就形成一套很复杂、高可用、高并发的架构。"
2013 年前后,美国的数据科学平台创业迎来爆发期,加之,公有云的技术环境形成,促使新一代数据和人工智能(Data AI)的公司不断孵化出来 ....Databricks、Snowflake 等一批后来崛起为头部的公司大都是从这个时候起步。
方磊和尚明栋顺势而为,决定回国在数据科学平台领域创业,九章云极 DataCanvas 由此成为国内最早入局自动化数据科学平台的供应商。
2014 年,方磊给投资人的邮件中表示:容器技术自 2012 年出现后,给分析行业带来了很大的改变,容器化的方式统一了分析流程的运行基础。而且,与容器结合后,机器学习、深度学习等不再只是在上层增光添彩的小工具,而成为了标准化的基础设施。
同年,这一创业设想便拿到了亚杰天使基金的天使轮投资。
聚焦 "AI 基础软件 " 扩大版图,超 20 家资本竞相押注
尚明栋也深知 AI 基础软件更清晰的定位以及上下游的合作,往往更适用于一个相对来说比较成熟的生态分工,绝非一蹴而就。
在花了两年时间打磨 DataCanvas 数据科学平台后,尚明栋意识到要把产品变成商品,需要对市场需求精准洞察,而技术创业的背景早期让其在市场化上也走过一些弯路。想要在国内把数据和算法变成生意,从有数据处理需求的大型企业入手成为了解法。
尚明栋坦言,模型作为数据资产的一部分,从大趋势上看,数据产生、能力构建是一个持续建设的过程,信息化能力建设最早的行业一定相对来说数据更刚需和密集。
彼时,金融行业的信息化程度远高于其他行业,银行是当时国内 IT 预算最高的企业之一,亦成为了九章云极 DataCanvas 瞄准金融行业的最先切入点。时至今日,中国前一百家银行里,九章云极 DataCanvas 客户占比超 50 家,验证了其 AI 创业以 "business" 的核心。
商业化验证的同时,为解决企业在进行数据分析时面临的 AI 建模难度门槛过高、以及 AI 推理等问题,九章云极 DataCanvas 也不断完善产品版图。
在 " 人工智能基础软件 " 的定位下,公司不仅通过 AutoML 自动机器学习、AutoDL 自动深度学习和 ModelOps 提供模型运行的全生命周期,更通过其研发的 HSAP 数据库 DingoDB 落地 Data-Centric AI。
此外,九章云极 DataCanvas 从 DAT 自动机器学习软件、DingoDB 实时交互式分析数据库,到去年 7 月发布的 YLearn 因果学习软件,不断以开源重器刷新了业界对开源基础软件的期望。后者作为全球首款一站式处理因果学习完整流程的开源算法工具包,填补了可信 AI、可解释 AI 高性能基础软件的市场空白,而这也正是推动 AI 技术实现从 " 预测 " 到 " 决策 " 的规模化应用的重要工具。
尚明栋表示,AI 基础软件不光是一个基础软件,还面向国内 toB 的生态合作。随着众多厂商协作产生的分工细化,在 toB 生态下,面对行业数据、结构的不同,企业更需要考虑在某一个能力层里进行长期的可复用、标准化。
这其中,越是偏底层的能力,他认为越应该参与到开源生态中,通过更多人适配变成整个标准化生态分工里的一环。
" 从这一点上来说,我们尊重且积极参与到开放生态,会开源一些比较底层的计算框架,而偏上面的行业应用,甚至是交互式的应用工具链,会更支持企业化特性。" 尚明栋表示,九章云极 DataCanvas 会保持对开源生态的兼容,处于中间层的位置,向上更靠近应用,向下更靠近底层。
据了解,九章云极 DataCanvas 软件产品收入占六成以上,除在金融行业客户渗透率不断提高外,其在通信、工业制造、政府、交通等多行业均有标杆客户落地。
10 年间,九章云极 DataCanvas 加速狂奔,资本的橄榄枝也接连不断。
去年 9 月,九章云极 DataCanvas 完成龙门资本领投的 C+ 轮融资,至此,已在 9 轮融资中获得超 20 家机构押注,其中中关村发展前沿基金、领沨资本、红点中国、赛富投资基金、襄禾资本等知名机构更是多轮加持。
以 " 大 + 小 " 方式,形成模型训练新范式
在技术快速发展和行业生态变迁下,如果说过去的产品矩阵是九章云极 DataCanvas 针对企业现有能力来进行伴生式的成长,那么大模型则是九章云极 DataCanvas 的诗和远方。
近两年,在跟规模体量特别大的客户沟通并构建大规模深度学习的分布式训练框架时,尚明栋就感受到面向未来的非结构化数据越来越多,只不过业内尚无大规模需求涌现。
而这些早期的个别需求让他在训练模型时,注意到随着模型由小变大,大模型训练成本高甚至可能还会进入到空转状态,形成大量成本浪费,故而需要一面训练,一面监控,一面动态调整训练参数,让其持续进入到收敛态。
尚明栋坦言,自 2019 年起,团队就开始挑可能通过长期投入来形成核心壁垒的点,作为大模型的投入重心。
在他看来,过去中小模型解决的是场景,现在大模型替代的是分工和角色。想让企业更认可大模型的价值,一要用大模型的能力,给企业带来更多收益,二要为企业节省更多人力成本。简而言之就是实现客户一些原先不能的,或者是原先效果不够好的能力,在能力建设和业务结合时做好开源节流。
基于这样的逻辑,九章云极 DataCanvas 将与行业生态结合得较紧密的需大量成本消耗的环节,作为可能被大模型所替代和驱动的目标。
当下,大模型虽表现优异,但对于各行业使用者来说,实际应用于业务场景仍然存在较高的技术和成本门槛。模型的参数标准并不统一,相对于参数级,模型的效果且是否能够支持快速迭代对于企业客户实际应用来说更为重要。客户能够在一个白盒大模型基础上快速地、低成本地微调和迭代出客制化的小模型,才能高效地实现丰富场景的大模型应用。而这正是 AI 基础软件工具链的重要性。
尚明栋表示,大模型未来可能和中小模型更趋同化,而大模型和小模型的融合使用,大模型的小型化,或者说以大模型为底座的小型化微调,也是一种趋势,能够以低廉的成本解决大量的问题。AI 基础软件通过大模型 + 小模型的方式,正形成模型训练新范式。
他指出,不管是大模型还是小模型,本质上都是模型,实际就是数据的浓缩,包含价值、逻辑密度。数据不开放,必然要搬运能力,而且是大模型所需的整个能力栈。
而通过过去啃下的技术 " 硬骨头 ",使得九章云极 DataCanvas 在大模型的落地和应用里,能快速找到能力组合的战略要点,打造更标准化的大模型工具链:不仅会在支持现有框架下,把构建大模型的能力引入行业的边界里去,而且还会给行业提供能力闭环。
" 作为 AI 生态链中基础软件环节的能力提供者,过去 10 年我们一直在验证从模型构建到模型推理生产化,甚至到后期的模型管理,形成一个基于以模型全生命周期作为起点和终点来进行的能力建设的闭环,来对行业产生价值,让客户为能力买单。"
而这样的闭环在大模型构建下,尚明栋预测会有新的能力建设随新的大闭环而产生。
在他看来,大模型很像新时代的制造业,大家在一个流水线上,下游负责算力、更底层的一些计算框架,九章云极 DataCanvas 负责好基础软件,模型的完整生命周期的构建和推理,并赋能于后面的应用,是一个更面向产业的闭环。
而其中,相较于专业能力分工更细致化,有前瞻性技术和能力构建的头部客户,真正进行大规模变现和赋能的是更偏向于最终应用的腰部企业,需要九章云极 DataCanvas 从基础软件往应用侧提供一部分服务,去把最后这一公里补齐。其透露,目前大模型方面已经开始有付费客户。
据 IDC 预测,到 2026 年,大规模基础模型将成为大型供应商提供的标准行业实用程序。随着各大厂商更加投入到底层基础软件的建设中,在时代推动和产业带动下,以九章云极 DataCanvas 为代表的 AI 基础软件公司又将有哪些变与不变,让我们拭目以待。
责任编辑:hnmd003
相关阅读
相关阅读
-
环球速讯:AI 基础软件,在大模型时代讲出新故事
来源:猎云精选;文 孙媛大模型热潮,让多家企业冲在AI产业底座的路上
-
黑客威胁、用户抗议 美版贴吧薅 AI 羊毛不成 陷入持续危机 全球热讯
财联社6月21日讯(编辑马兰)美国版贴吧Reddit想要从人工智能中分一杯
-
腾讯为何不做通用大模型产品?_全球滚动
出品|虎嗅科技组作者|齐健编辑|陈伊凡头图|腾讯云国内AI百模大战打
-
天天滚动:2023年06月19日全国山药报价分析
一、全国价格分析宇博智业监测数据显示,2023年06月19日,全国101类山
-
观热点:校方回应女子花30万拍短片拒领三等奖:评委老师很专业
6月19日,青岛电影学院颁奖典礼现场,一名获三等奖的女生上台后夺走主
-
郑州独角兽企业“致欧科技”登陆创业板!系河南首家互联网家居上市企业
6月21日,致欧家居科技股份有限公司(以下简称致欧科技)在深圳证券交
-
大童百万医疗保险好不好?有什么特点?_当前快报
比较好。大童保险销售服务有限公司是经保监会批准设立的中国首家全国性
-
平安人寿保险保单查询方式有哪些?购买保险的途径有哪些?-全球热点
首先,可以通过官方网站或移动应用程序进行在线查询。客户只需登录平安
-
6月21日江苏屿鑫金属不锈钢报价下跌-全球新资讯
6月21日,江苏屿鑫金属科技有限公司,304,1 0四八尺平板价格报13350元
-
百万医疗保险哪个产品好?有什么好处? 当前资讯
市场上有很多百万医疗保险产品,各有各的好处,以下是一些值得推荐的优
-
看点:百万医疗怎么关闭自动扣费?怎么续保?
联系保险公司:投保人可以直接联系百万医疗保险的销售渠道或者客服部门
-
重大疾病险过世后怎么赔付?赔付流程是什么? 今日热闻
要看实际的情况。第一类产品仅仅保障重大疾病责任或者再保障轻症责任,
-
全球热议:爱奇艺老会员价值提升:长期连包不断订会员保价可再次优惠一年
6月21日,爱奇艺宣布已于近期为长期保持连包不断订的会员,推出一项优
-
孩子在家的表现情况懒散不积极完成作业怎么写_孩子在家的表现情况-世界热点评
1、时间过得真快,转眼2010年已接近尾声,让我们一起来看看,经过一个
-
痔疮出来了怎么塞进去_痔疮出来了怎么塞回去
1、痔疮与经常便秘有关,排便时经常出现痔疮出血、疼痛、肿胀。2、当肿
-
世界今热点:北方经贸杂志社官网_北方经贸学院
1、本人工程学院毕业的,今年搬新校区就读,有些专业几年前就升本科了
-
小众“救命药”频频“喊救命” 亟待建立长效供给机制
小众“救命药”面向的单一病种患者并不多,但以我国总人口基数,加之对
-
全球今头条!乡村之美丨“千万工程”启示录之二:融合之路,城与乡双向奔赴
经历了华丽蝶变的广袤乡村,还“望得见山、看得见水、记得住乡愁”吗?
-
GPT-4 是 8x2200 亿参数的混合模型?这个小道消息今天传疯了
机器之心报道编辑:吴昕GeorgeHotz:除了苹果之外,大部分公司保密的原
-
德国电信准备挑战欧盟不合理规定 继续购买华为 5G 设备|天天热闻
【TechWeb】6月21日消息,据外媒报道,德国电信准备挑战欧盟的不合理规
-
“贾跃亭式”财技重现 A 股!股东变债主,昆仑万维实控人前妻欲套现离场? 当前观察
本文来源:时代周报作者:何明俊6月20日晚,昆仑万维(300418 SZ)发布
-
TCL、海信、小米密集推新,Mini LED 电视熬出头了
中国面板和电视行业逆转格局的机会来了。作者|辰纹来源|洞见新研社OLED
-
天天微动态丨直播回顾:HVV 经验分享与重保整体解决方案
6月15日,Coremail联合北京钛星数安科技有限公司举办【HVV经验分享与重
-
热讯:人民币汇率跌破 7.2!未来怎么走?出国留学、企业进口怎么办?全面解读来了→
近段时间,人民币身价问题,备受关注。5月17日、5月18日,离岸人民币、
-
《福布斯》长文揭密陈光英:币安背后的神秘掌舵人-每日视点
图片来源@视觉中国福布斯发文称,币安首席执行官赵长鹏的神秘助手陈光
-
日经 225 指数午后拉升,相关 ETF 集体大涨逾 1.6% 天天观热点
日本股市午后走强,日经225指数盘中一度涨逾0 8%。受盘面影响,场内4只
-
当前讯息:世界气象组织报告欧洲成为全球变暖最快的大陆
财联社6月21日讯(编辑马兰)世界气象组织(WMO)和欧洲哥白尼研究所周
-
“贾跃亭式”财技重现 A 股!股东变债主,昆仑万维实控人前妻欲套现离场?_环球时快讯
本文来源:时代周报作者:何明俊6月20日晚,昆仑万维(300418 SZ)发布
-
有心未怕迟_对于有心未怕迟简单介绍_今亮点
1、《有心未怕迟》是冯伟棠、黄恺欣演唱的歌曲。2、由李初作词作曲。文
-
世界看热讯:2023年6月21日连玉米期货早盘行情
据生意社统计,2023年6月21日,星期三,大连商品交易所玉米期货主力230
精彩推荐
阅读排行
精彩推送
- 拼了!33岁海归博士创业,7年干...
- 重疾险买长期还是终身?有哪些分...
- 平安百万医疗门诊报销吗?报销的...
- 重大疾病保险属于什么类型的保险...
- 女性百万医疗险推荐,女性百万医...
- 百万医疗可以续保终身吗?续保的...
- 世界快资讯:美国得州要求电动汽...
- 江波龙:融资净偿还154.31万元,...
- 世界最资讯丨辉瑞药物Talzenna获...
- 优予预制菜完成Pre-A轮融资
- 小米智造投资汽车制动系统研发商
- 索尼携最新 4K HDR 旗舰基准...
- 京东 AI 大模型官宣 7 月 1...
- 看热讯:OpenAI 被曝要搞「App...
- 美银:至 2025 财年 苹果近两...
- 30 万人挤进张兰直播间,只“吃...
- 当前讯息:中邮悦享金生有哪些优...
- 光明一生必须领取年金吗?投保规...
- 利宝互助保险集团管理团队到访水...
- 抖音发布新规:严厉打击仿冒新闻...
- 利宝互助保险集团管理团队到访水...
- 世界资讯:北京房山发放1000万元...
- 星纪魅族和极星联手,吉利的“算...
- 环球关注:公安部发布端午节假期...
- 体内“穿山甲”微型机器人问世
- 苹果自研基带不给力:iPhone SE...
- Epic 旗下 3D 扫描应用《Real...
- 今日关注:华为回应向日企收取专...
- Redmi K60 Ultra 入网,天玑...
- 每日资讯:小米投资储能企业安酷...