对话追一科技 CEO 吴悦:垂直大模型的机会在那些旧 bug 里 环球热闻
2023-06-09 10:29:02来源:ZAKER科技
深圳的科兴科学园面前的那条路,地铁修了好几年,走动很不方便。
【资料图】
这里是附近范围里的一个集散地。园区下沉空间里的餐饮区域是包括腾讯在内的,周围很多科技公司的 " 食堂 "。
也包括从创业之初就把公司放在距离腾讯不远的追一科技。他们的办公地在对面,与科兴一街之隔。
很多追一科技的员工会去对面吃饭,但修了路,就不太方便了。
这很像这家公司最近几年给人的感觉,它离热闹很近,但好像又不是很近。
不久前品玩写过一篇对于追一科技的观察文章,时间线终止在 2020 年。之后这家公司和整个 NLP 领域的沉寂一起消失在了外界的关注之中。
直到 ChatGPT 的出现重新把关于 AI 的一切活力唤起。但在生成式 AI 压倒性的优越性面前,NLP 这个概念本身甚至有被整个抛弃的危险。
如果 NLP 都不重要了,一家以 NLP 领域技术为根基的 AI 公司该如何变化?
在这个角度上,从上一次 AI 浪潮中存活下来的追一科技仍然是很多 " 不够大又不够新 " 的中国 AI 公司的合适样本。
品玩在深圳与追一科技的 CEO 吴悦做了一次对话,我们想知道这家公司在 2020 年之后在做什么,这样一位具备商业和技术视角的创始人是如何看待大模型产业的,以及在大模型的竞争中,这样体量的 AI 公司究竟还有没有独特的地方。
吴悦不是一个耀眼的创业者了,也没有选择在这次新的 AI 浪潮中重新成为一个 KOL 一样的人物。他的身份是一家 300 人的 AI 公司的经营者。这意味着他必须专注和务实。
这几年的沉默背后,追一完成了一个艰难的产品标准化的过程,这曾经是一块 2000 个 Bug 的硬骨头,啃下来后,变成面向未来的机会。
他不愿陷在对 AGI 没有答案的争论里,但相信垂直大模型是坚实的机会,就像发现美洲大陆这件事远不只成就了一人而已。
一切尚未尘埃落定。
以下是品玩与吴悦的对话,部分内容有些优化和调整:
现在国内初创公司 " 百模大战 " 的热潮像 2016 年左右追一科技出现时的热闹一样了。
现在不少创业公司做的主要还是对 ChatGPT 的解构和复现。这是一个非常有挑战的事,我们乐见其成。
首先复现 ChatGPT 在现在是一个可以实现的事吗?
首先相关的论文其实确实很多,并且开源社区中已经有非常多的团队在做复现。并且 ChatGPT 这个产品已经在那里了,它并不是一个不可体验的技术。综合这些维度来看,我觉得相对来说去复现这个事情的信心和信息密度还是够的。
另外就是,你要解决的问题明确了,这就变成一个更确定性的事。
也就是说现在寻找的是一个结果确定的东西。
对。美洲大陆在发现之前的投入是很大的,因为你不知道向哪个方向寻找。但一旦美洲大陆发现了之后,找到一条路去美洲大陆的航道其实容易多了。
这可以换一种更熟悉的说法——国内大模型的机会在垂直领域或者应用层面。但这有点像曾经智能客服和翻译可能是 NLP 领域最容易摘的桃子那种感觉。
我觉得这个事情,从创业公司角度是生存下去,虽然要有理想,但是生存是第一位的。但是并不代表着说我们没有一家公司在做这些事。但最终还是要基于有多大能力做多大事。
这是指追一的能力,还是整个中国 AI 领域的公司抽象成一个集体的 " 能力 "?
我不太好说,但我感觉大家现在还是以实用主义,也就是做应用的居多对吧?你说真的像 OpenAI 那样烧几十亿美金,反正过去我觉得是很难,未来行不行?我觉得也不好说。
从最初顶着光环迎来高增长到后来的发展降速,直到 2020 年的那次裁员后从大众视线里消失。追一科技仍然有特殊的地方,它是少有在此前的 AI 热潮中活下来的公司之一;它也有现在看来更平庸的一面,在大模型面前,他不够庞大,也不是直接从大模型入手的充满活力的初创公司。这样的公司有些 " 夹生 ",但这样的公司也正好是当下中国 AI 产业中的普遍样本。
2020年之后的追一在做什么?
我们进入到了服务传统行业的一个产品化的阶段。主要面向于金融和运营商、政务这种大型企业客户。2018、19 年属于大客户的打样阶段,然后到了 19 年之后开始传统大型企业客户的规模化扩展,20 年就面临到交付。
坦白来讲这个难度已经比我们预期的要难很多。
有多难?
因为我们定位自己是做 AI 产品,这里面有两个典型特征。第一是它底层是基于 AI 能力的,然后上层它其实是一个应用层的产品。但应用层产品的定义是要由客户定义出来的,也就是要有足够多的大型客户来帮我们来定义这样一个产品。
这些大客户的本地化部署中暴露了很多关于软件向下适配度和向上兼容度的问题。
这个其实挺夸张的,我们测算过软件的产品部署到客户现场之后,出现一个 bug 差不多就要 1 万块钱的成本来解决。我们累计做了 200 多个客户,在那个阶段已经有将近大几十家头部客户,累计的 bug 有几千个。
很大一笔开销,所以 2020 年之前这些问题还不显现。
做腰部还好一点,但是做股份支行这种大客户要求确实很高,我们的产品又是客服和营销这样银行里的核心业务系统。
为什么头部客户要求更高?
同样一个产品。可能腰部客户没有任何问题,但头部客户那里会暴露很多问题,因为他使用的很高频。
并且对整个软件的软件的质量要求更高。它会有非常严格的安全漏洞扫描,并且——如果用银行举例——客户的 IT 环境不一样,操作系统不一样,然后中间件也不一样,数据库也不一样,这些都要适配。
头部客户对同一个软件的使用深度会更深,也就会产生很多个性化的需求。如果说你整个软件结构架构设计不合理,它的需求可能会关联到这个软件的核心系统,核心系统被牵扯就需要我们主线开发人员去参与进来了。主线开发人员的资源其实是非常宝贵的。他被调用的话我们花费的成本就很高。
什么样的需求会牵扯到主线的设计?
比如出现了 AI 助手在回答时不精准或者直接没有回答的这种 bad case。
这意味着可能要改算法算子。问题直接就到了底层算法模型这一层,然后全公司的所有人都要卷进来解决这一个 bug。
但如果只做腰部,对底层技术推进的动力就没那么大。我们定位是 AI 公司,需要找到大把手。
又要底层技术,又要产品。
对,两头都要特别难。
这逼迫团队要把产品分层做的更合理,定制化需求最好在应用层解决而不影响主线。这是 PaaS 化之后才能实现的事,这个过程其实就是产品标准化的过程。
怎么理解产品的标准化,有没有明确的衡量方式?
我觉得有几个,第一个产品的 bug 收敛的非常明显,这是一个标准;另外就是面对客户各种各样的需求,可以通过一个应用开发团队去自闭环,不需要牵扯主线团队进来,我觉得这是第二个;第三个就是和产品相关的,从咨询到交付的配套可以标准化,可以可以按照管理流程的方式来驱动,而不是靠人来驱动。
在中国做软件,特别是大客户方向,是要做从咨询然后到产品,然后到实施三个环节的所有事的。理想状况应该是比如 IBM 做咨询,然后 SAP 做产品,然后艾森哲去做实施。
是因为中国整个软件行业不够成型导致的吗?
对,整个生态仍然不是很完整。
吴悦在对话中补上了公司在 2020 年后的空缺。在一场产品标准化过程中沉淀下来的东西,又成为追一在大模型时代的竞争基础。追一科技在前不久发布了自己的博文大模型。站在聚光灯和嗜血的资本之外,吴悦相信垂直大模型的机会在于这是大厂与创业公司之间的真空地带。
谈谈垂直大模型吧。如果把大模型技术延展成一条技术链,垂直大模型看上去是很末端的一环。追一可以帮银行做,银行也可以跟大厂直接合作,这就跳过了追一。这会不会意味着垂直大模型领域的 AI 公司其实很被动,缺少议价能力?
这是三个角度的问题。第一个是客户会不会自研,但对于传统企业的客户来说,因为他主营业务不完全在 IT 上,出于投入产出比的考虑它不会自己来做这个事。
然后就是,这是不是意味着有通用大模型的厂家就能解决好垂直大模型的问题,或者说垂直大模型这个领域是不是因为门槛不够导致竞争非常激烈。
没错。垂直大模型的门槛到底在哪里?
垂直大模型这个事的门槛不低。一个是私域知识如何融入到大模型里;然后还要考虑领域知识在回答生成上的精准度和可控性;并且这些垂直领域的知识最终都需要和软件产品做好融合才行。
从这几个角度来说,不是说是一个特别低门槛这个事。
最后这一点怎么理解?
软件的成熟度是一个独特的壁垒。这个就有点像比如说 Copilot 最终还是需要 GPT 去跟 Microsoft 365 结合起来做刻画的,不能脱离 Microsoft 365 这个产品去做这个事情。
所以产品能力可能才是差异化的优势,比如 CoPilot 的优势其实是Microsoft 365,你们的优势其实是之前已经成型的 AI 产品?
对。比如之前提到的牵扯到主线需要做分层设计的问题。在调整过程中可能会做一些支持规则系统的改变,比如简单的配一个规则,或者把算子的参数释放出来,可以调参数来调效果。这些就是一些知识沉淀或技术沉淀。
确实碰壁碰的多了,问题解决的多了,产品才慢慢知道怎么去设计,这不是拍脑袋想出来的。
大厂和创业公司都缺乏这个。
对。这种经验是靠 bug 堆出来,靠客户堆出来的。
大厂从顶层设计向下看,很顺利,但碰到比如安全漏洞就很麻烦。一个漏洞可能涉及到你的算法模块缺陷,然后你的后台模块有缺陷,软件后台也有缺陷,一动就有很多问题。
这是一些很泥泞的地方,大家看不到。
我觉得是。
还是一个精度的考量。比如说我们现在通过小模型模型能在对话中做到 90% 以上的准确率——虽然可能他的对话体验可能没想那么好——比如金融行业的头部客户,它对对话答案精度的要求是挺高的。
然后在大模型的能力进入这个 AI 产品后,可能它的对话体验变得更好,但是这个 90% 的精度可能会下降。因为生成式 AI 本身是个概率问题,有更多不可控的因素。在 B 端市场这是一个挺棘手的问题。
但数据仍然在那些你服务的公司里拿不出来,垂直大模型好像也没有回答因为缺少数据而影响软件迭代的问题?
不同的客户的数据差异度是 10% 到 20%,但之前在小模型技术的基础上,因为这个 10% 到 20% 的差异,你就要去训练一个新的定制化模型——因为小模型的理解能力不够。但是现在大模型的优越性在于,他的理解能力充分了,所以这 10% 左右的差异其实不需要再去训练一个新的模型。这其实是一个本质上的变化。
但客户要一个适合自己的 AI 产品,其实就是要那 %10-20% 跟它相关的差异化。如果我只是个 80% 契合的产品,但对所有银行都可以用的话,那也就是对所有银行来说它也都没区别了?
这个差异化的数据变量其实只是在表达上有差异。这部分表达上的差异在大模型下可以被理解出来。
也就是说数据这个痛点其实现在比原来小很多了。
对,是的。
2015前后开始的那一波 AI 热潮现在回过头来看,会给现在追一科技在垂直大模型的竞争有些什么启发或者遗产吗。
我们已经成立第七个年头了。有了可靠的业务和客户,也沉淀下来一个团队。我们现在更加专注企业本身的经营,所以也会更加冷静的来看待大模型这个事。
责任编辑:hnmd003
相关阅读
相关阅读
-
对话追一科技 CEO 吴悦:垂直大模型的机会在那些旧 bug 里 环球热闻
深圳的科兴科学园面前的那条路,地铁修了好几年,走动很不方便。这里是
-
全球简讯:荣耀 80 Pro 兼容性测试:实测近 50 款充电器
前言此前充电头网就给大家带来了荣耀80Pro的充电兼容性测试的视频,现
-
光荣与梦想歌词完整版(光荣与梦想歌词)-世界微资讯
今天小编岚岚来为大家解答以上的问题。光荣与梦想歌词完整版,光荣与梦
-
小学生家校共育工作存在的问题及对策研究|天天速看
家校共育教学模式将学校与学生家庭创造性地联系到一起,将学校、家长以
-
拉萨市市场监管局“四考”考点食堂“大检查” 守护考生舌尖上的安全
拉萨市市场监管局执法人员对学生早餐进行检查。记者央金摄日前,拉萨市
-
西藏自治区体育科学研究所开展“反兴奋剂宣传 教育进校园”活动_世界新资讯
近日,西藏自治区体育科学研究所走进林芝市八一中学、第二高级中学,举
-
北京师范大学师生与山南军分区某团官兵互寄信件-速看
“尊敬的边防战士,每当国旗在校园的上空升起时,我相信,我们心中感受
-
即时看!渤海人寿i宝贝停售了吗?可以领取多少钱?
没有。 这款保险产品目前没有停售,还可以在保险公司去购买,这是一款
-
天天播报:恒大传家宝的简介情况怎么样?要怎么购买?
这款保险是由恒大人寿保险公司所推出的保险的投保年龄为0到70岁,可以
-
渤海人寿i宝贝教育年金是长险吗?投保规定有哪些?
是的,保障时间超过了一年。 渤海人寿i宝贝这款保险能够保障到孩子21
-
天天关注:拖欠工资超1亿!“东北参王”紫鑫药业濒临退市,还有价值60亿的人参在地里
图片来源:图虫创意巨额债务压顶,“东北参王”濒临退市。6月8日盘后,
-
鑫福人生是哪个保险公司的产品?产品规则有哪些?
富德生命人寿保险公司。 这款保险的承保公司是富德生命人寿保险公司,
-
星海赢家养老年金保险怎么样?有哪些热门养老社区年金险?_全球球精选
星海赢家养老年金保险最长可支持30年缴费,还分为了终身版(计划一)和
-
环球观热点:通用汽车接入特斯拉超级充电网络
通用汽车接入特斯拉超级充电网络盖世汽车讯继福特汽车之后,通用汽车也
-
比亚迪F品牌官宣定名“方程豹”,首车将于今年推出
比亚迪F品牌官宣定名“方程豹”,首车将于今年推出6月9日,比亚迪官宣
-
世界热讯:2023包头马拉松赛啤酒美食嘉年华16日开幕
2023包头马拉松赛将于6月23日举办,作为包头马拉松赛的配套活动之一,
-
探路包马赛道
路景一体的包马赛道。跑友打卡包马赛道。微风不燥,阳光正好。包钢·20
-
石榴花开在草原
民警帮助群众铺草料首夏犹清和,芳草亦未歇。达茂旗明安镇清爽苍翠的初
-
天天热资讯!文艺周末公交直通车少儿专线开通
近日,市文联组织的“文艺周末直通车”特意开通了少儿专属路线,在一场
-
东河区劳模广场落成
近日,东河区总工会在南海湿地景区举行劳模广场落成仪式,来自各行各业
-
对冲机制是什么意思?对冲机制的目的
对冲机制是什么意思?所谓对冲机制,指的是盈亏相抵的交易,即投资者同时进行两笔行情相关、方向相反、数...
-
焦点快看:天天财经|0609 万达集团回应“19亿股权被冻结”;乐视网被列为经营异常
林志颖复出代言小鹏,本人仍开特斯拉?官方回应:只是玩梗;万达集团回
-
【世界独家】谁在做街拍这个产业?
图片来源@视觉中国文|新摘商业评论成都太古里的禁止令并没有挡住街拍爱
-
仰望 U8 实拍,近距离感受原地掉头
我相信有不少人之前就听说过仰望U8拥有「原地掉头」这个奇特本领,或许
-
天天即时:豪江智能(301320.SZ)创业板首日,开盘涨超 91%
同壁财经讯,豪江智能(301320 SZ)今日在深圳证券交易所创业板上市。
-
【快播报】谷歌将于 7 月推出新的广告透明度政策
钛媒体App6月9日消息,据市场消息,2023年7月,谷歌将推出新的广告透明
-
实时:水电角色将发生重大变化
在雅砻江中游,大型“水光互补”项目柯拉光伏电站将于6月投产;在金沙
-
西藏自治区文物系统文博业务培训班举办-世界热资讯
为切实提高西藏文博系统专业人才队伍综合素质和业务能力,近日,全区文
-
科考人员肩挑背扛设备上珠峰 探究“亚洲水塔”水从何来
以青藏高原为主体的第三极地区,是亚洲十多条大江大河的源头,是全球水
-
1至4月 拉萨跨省就医购药14.9万人次 观天下
2021年8月,西藏自治区拉萨市全面使用“国家医疗保障信息平台”,同步
精彩推荐
阅读排行
精彩推送
- 世界时讯:7月21日-22日喜马拉雅...
- 股票什么是k线?股票k线各种颜色...
- 交通信用卡积分怎么兑换?交通信...
- 仙佑集团:“老字号”膏药品牌发...
- 基金代码怎么看?基金代码a类与c...
- 千禾味业:6月8日融资买入1103.1...
- 股票什么是放水?放水对股市是利...
- 股票高位绿十字星意味什么?股票...
- 每日消息!“史上投入力度最大”6...
- 米哈游2022年营收273.4亿元,净...
- 特斯拉墨西哥建厂“复制上海工厂...
- 环球关注:传特斯拉考虑在西班牙...
- 全国“三夏”麦收进度过半!收完...
- 负基差是什么意思?负基差对量化...
- 股票里暗线是什么意思?股票暗线...
- 商家收款码怎么申请?商家收款码...
- 广东空调卖爆了!广州二手空调批...
- 天天视点!2023年1至4月基本医保...
- 首届文化强国建设高峰论坛系列分...
- iOS 版 ChatGPT 应用更新,新...
- 一加 Ace 2V 618 买超实惠!...
- 世界今热点:字节正在内部测试对...
- 每日时讯!AI 初创公司 Cohere...
- 每日信息:华为重磅发布两款数据...
- 跨平台直播里的“隐形墙”-世界速看
- 【当前热闻】多家国有银行下调存...
- 大连证券开户是什么业务?大连证...
- 世界热文:symbian系统的优缺点...
- 什么是钱荒?钱荒产生的原因是什...
- 什么是个股?个股成交量怎么看?