清华校友立功!谷歌发布首个全科医疗大模型,14 项任务 SOTA
2023-08-02 15:11:26来源:ZAKER科技
全球首个全科医疗大模型正式发布:
由谷歌 Research 和 DeepMind 共同打造的多模态生成模型Med-PaLM M,懂临床语言、懂影像,也懂基因组学。
【资料图】
而在 246 份真实胸部 X 光片中,临床医生表示,在高达 40.50% 的病例中,Med-PaLM M 生成的报告都要比专业放射科医生的更受采纳,这表明 Med-PaLM M 并非 " 纸上谈兵 ",用于临床指日可待。
对此,谷歌也自己给出了评价:这是通用医学人工智能史上的一个里程碑。
所以,Med-PaLM M 具体什么来头?
全球首个全科医疗大模型来了在正式了解 Med-PaLM M 之前,我们先简单介绍谷歌自建的多模态医学测试基准MultiMedBench。
谷歌表示,在 MultiMedBench 之前,市面上缺乏这样一个全面的多模态医学基准。
该基准由 12 个开源数据集和 14 个单独的任务组成,用于测量通用生物医学 AI 执行各种临床任务的能力。
其中 12 个数据集共包含了六种生物医学数据模式(文本、放射学(CT、MRI 和 X 光)、病理学、皮肤病学、乳房 X 光检查和基因组学),14 个任务则涵盖五种类型(问题回答、报告生成和摘要、视觉问题回答、医学图像分类和基因组变体调用)。
Med-PaLM M 就在上面进行了微调。正如其名 "M" 代表多模态,Med-PaLM M 相比之前谷歌发布的 Med-PaLM、Med-PaLM-2 等医疗大模型,是一个主打全科、通才的医疗 AI,不仅能回答各种医学问题,还能直接看片、懂基因组学。
它的基本架构是 PaLM-E(多模态语言模型),并采用 ViT 预训练模型作为视觉编码器,具体实现了三种组合:
-PaLM 8B+ViT 4B ( PaLM-E 12B )
-PaLM 62B+ViT 22B ( PaLM-E 84B )
-PaLM 540B+ViT 22B ( PaLM-E 562B )
通过 MultiMedBench 对 PaLM-E 模型进行微调,并将其与生物医学领域对齐,Med-PaLM M 得以诞生。以下是一些实现细节:
(1)数据集和预处理方面,将 MultiMedBench 中所有图像大小调整为 224 × 224 × 3,同时按需使用填充来保留原始纵横比。
(2)由于谷歌的目标是训练一个通用的生物医学 AI 模型,使用统一的模型架构和模型参数,用多模式输入执行多个任务。为此,他们为 Med-PaLM M 提供了特定于各种任务的指令以及一个纯文本的 " 一次性示例 "。
如下图所示的胸部 x 光解读和皮肤病变分类任务所示,这些指令有一种写提示语的味道,以 " 你是一个很给力的放射科助理 " 开头。
(3)训练过程中,作者对 PaLM-E 进行了端到端的微调。在多模态任务中,图像标记与文本标记交错,以形成对 PALM-E 模型的多模式上下文输入。对于所有微调任务,多模式上下文输入最多包含 1 个图像,然而 Med-PaLM M 能够在推理过程中处理具有多个图像的输入。14 项任务接近 or 超 SOTA,临床战胜 40% 放射科医生
性能评估阶段,作者主要测试 Med-PaLM M 的 " 多面手 "(即全科)能力、突发涌现能力以及放射学报告生成质量(与真实放射科医生进行对比)。
结果显示:
(1)与专业 SOTA 模型和无生物医学领域微调的广义模型(PaLM-E 84B)相比,Med-PaLM M 在 MultiMedBench 上的所有任务、数据集和指标组合(共计 14 项)中,性能均基本接近 SOTA 或超过 SOTA。
需要注意的是,该结果是在没有任何特定任务定制的情况下使用相同的模型权重集实现的。
(2)在 scale 实验中,三个不同规模的 Med-PaLM M 对各类任务的影响各不相同:粗略来看,对于纯语言任务和需要调整的多模式任务来说,模型越大越好;但对图像分类和胸部 X 光报告生成任务来说,84B 的效果比 562B 表现反而更好一些。
(3)零样本思维链推理能力涌现。Med-PaLM M 可以通过胸部 X 射线图像检测没有训练过的结核病,与针对该类数据集进行专门优化过的 SOTA 结果相比,它的准确率已相差不大。不过,它给出的具体报告还是存在具体错误,说明还有不足。(4)放射性报告生成测试中,80B 参数的 Med-PaLM M 平均有 40.50% 的报告比放射科医生做的更好(被临床医生采纳),而 12B 和 562B,分别为 34.05% 和 32.00%。另外,遗漏和错误率测试显示,Med-PaLM M 12B 和 84B 模型平均每份报告的遗漏率最低,为 0.12,其次是 562B 模型为 0.13。这一结果与 MIMIC-CXR 上人类放射科医生基线报告的相当。多久能实用?
作为人类首个全科医学大模型,Med-PaLM M 多久能投入实用,想必也是大家关心的问题。
虽然它被 " 自诩 " 为里程碑(主要是因为靠一组模型权重在各种生物医学任务上接近或超过 SOTA),但谷歌也指出目前还有不少局限性待解决。
比如缺乏高质量的测试基准。谷歌表示,这是迄今为止通用生物医学人工智能发展的关键瓶颈,因为只有高质量的基准才能在很大程度上促进相关领域的发展。
而目前的 MultiMedBench 还存在单个数据集大小有限以及模式和任务多样性有限(比如缺乏转录组学和蛋白质组学)等问题。
再比如,扩展(scale)多模态 AI 模型也具有挑战性。
在语言领域,这一操作可以显著提高性能和应急能力。然而,谷歌在 Med-PaLM M 上的初步实验表明,由于医学数据的稀缺性,这对于生物医学任务领域的多模态广义模型来说并没有这么简单。
作者介绍
目前,谷歌仅发布了 Med-PaLM M 的论文。
它一共有两位共同一作,其中一位叫 Tao Tu。他本科毕业于北理工(2010 年),硕士毕业于清华大学,博士为美国哥伦比亚大学,专业都是医学工程。目前已在谷歌担任软件工程师快两年。
论文地址:https://arxiv.org/abs/2307.14334
责任编辑:hnmd003
相关阅读
相关阅读
-
清华校友立功!谷歌发布首个全科医疗大模型,14 项任务 SOTA
全球首个全科医疗大模型正式发布:由谷歌Research和DeepMind共同打造的
-
百度智能云“千帆大模型平台”升级:接入 LLaMA2 等 33 个模型
品玩8月2日讯,据科创板日报报道,百度智能云千帆大模型平台已完成新一
-
阿里云通义听悟新增自动提取 PPT 等三大功能
品玩8月2日讯,阿里云通义听悟上线了三大新功能,包括国内音视频AI领域
-
Microsoft 成为 2023 年第二季度网络钓鱼诈骗中最常被冒充的品牌
CheckPointResearch的最新《品牌网络钓鱼报告》显示,随着Google排名上
-
警惕“黑客”来敲门!360 数字安全专家呼吁须提升安全防范意识
随着互联网的迅速发展,网络已经成为我们日常生活不可或缺的一部分,与
-
安徽省宿州市市场监管局高新区分局:履行观察员职责 确保资质认定评审公正性
中国质量新闻网讯近日,根据安徽省市场监管局工作部署,检验检测机构资
-
C视频·大运村的“young”气生活丨“三”人行必有我师,他们在这里练太极
三人行必有我师,他们在这里练太极
-
痛心!北京房山蓝天救援女队员王宏春在救灾中牺牲
记者8月2日从北京蓝天救援队获悉,在此次强降雨抢险救灾中失联的房山蓝
-
未名医药上半年预亏4764.90万元 净利同比降298.90 %
近期,未名医药(002581 SZ)公布2023年半年度业绩预告,报告期归属于上
-
三星 F34 5G 新机官宣!8 月 7 日正式发布 不到 1500 元?
【手机中国新闻】手机中国获悉,三星F345G新机正式官宣,将于8月7日在
-
华为 Mate60 系列高清图曝光!这次灵动岛有一点变化
【手机中国新闻】8月2日,有数码博主放出了最新制作的华为Mate60系列假
-
10 元起步的奶茶店早餐,怎么就成了打工人的福音?
图片来源@视觉中国文|观潮新消费,作者|行藏,编辑|杜仲当代打工人,一
-
俄罗斯正式禁用 iPhone?苹果回应来了
鸭鸭跟大家伙儿上回聊到俄罗斯政府部门将会全面禁用iPhone的事儿。详情
-
李杰:一加 Ace2 Pro 用的是地球上能选到的最好芯片
【手机中国新闻】8月2日,手机中国注意到,一加手机官方正式宣布一加Ac
-
2023年最后5个月,值得期待的10款车
不知不觉时间已经来到2023年8月,掐指一算今年满打满算也就剩下5个月时
-
关联公司成被执行人还借钱收购田中精机?肖永富入主后,加码布局新能源
关联公司成被执行人还借钱收购田中精机?肖永富入主后,加码布局新能源
-
姚振华遭多人围堵讨薪,冲突中被打掉眼镜,随即开会再裁员
日前,网传视频显示,宝能集团董事长姚振华被讨薪员工围堵在深圳市罗湖
-
意外保险出车祸可以报销吗?报销多少钱?
可以报销。 意外事故是在意外险的保障范围之内的,其一般可以对被保险
-
20万的重疾险值得买吗?怎么买?
这个问题的答案并不是简单的肯定或否定。 首先,我们需要根据个人的经
-
单位购买的意外险如何理赔?理赔比例是多少?
首先,被保险人需要及时向单位报告事故,并提供相关的证明文件,如医疗
-
工地意外伤害保险怎么赔付?赔偿标准是什么?
一般来说,保险公司会要求被保险人在发生意外伤害后及时向保险公司报案
-
太平洋寿险分红如何领取?领取多久到账?
太平洋寿险的分红领取方式主要有两种:现金领取和再投保。客户可以根据
-
浙江荣泰聚焦耐高温绝缘云母制品,A股将迎“电池安全卫士”
文 孙沐霖8月1日,浙江荣泰电工器材股份有限公司(以下简称“浙江荣泰”
-
关联公司成被执行人还借钱收购田中精机?肖永富入主后,加码布局新能源
肖永富入主后,田中精机(300461 SZ)业绩出现好转。今年一季度,田中
-
一起看!这9部纪录片,让课本知识活起来了
9部中央电视台出品的纪录片,把课堂里涉及到的人文、历史和地理信息生
-
捍卫祖国统一坚定不移!东部战区发布热血MV《底气》
硬核实力,是战场制胜的底气!瞄准制胜先机,苦练本领杀敌……打胜仗有
-
阿里分家,优酷“断流”
撰文|何芙蓉编辑|吴先之在长视频平台亏损的漫漫长路中,爱奇艺一度因为
-
2023《财富》世界500强:10家深企上榜,一家排名“狂飙”
2023年8月2日,最新的《财富》世界500强排行榜正式发布。深圳卫视记者
-
韩国KOSPI指数跌幅扩大至2%,日经225指数现跌2.17%,澳大利亚S&P/ASX200指数现跌1.08%
韩国KOSPI指数跌幅扩大至2%,日经225指数现跌2 17%,澳大利亚S&P ASX20
-
平安寿险退保去哪里退?要注意什么?
平安寿险退保可以通过多种途径进行,包括线上和线下两种方式。 首先,
精彩推荐
阅读排行
精彩推送
- 小学生平安险怎么报销?可以报销...
- 意外保险报销需要什么材料?报销...
- 平安车险个人意外险有必要买吗?...
- 百万医疗保险过期一天能续费吗?...
- 网约车司机驰援京冀 滴滴救援队...
- 传丰田将在美国为斯巴鲁生产电动...
- 齐晖医药终止上交所主板IPO 保...
- 荣盛发展:收深交所第二轮定增事...
- 阿里巴巴、小米、理想汽车等多家...
- 我在网上做手机租赁,遇到了一批...
- 海尔惧怕的对手是小米?
- 探访北京雁柏山庄:“豪华”酒店...
- 京东辟谣收购永辉超市,永辉成色...
- 杭州65亿元成交4宗涉宅地块,绿...
- 嘉靖差点把明成祖朱棣的牌位扔出...
- 山西钢厂产量稳居高位 资源悄然累库
- 今日欧元/美元汇率交易策略(202...
- 玫莉蔻玻尿酸面膜,开启“膜法”...
- 酒驾身故意外保险理赔吗?理赔多...
- 北京医疗保险要交多少年?要交多...
- 重疾险交20年还是30年划算?每年...
- 人意外死亡保险公司赔多少?理赔...
- 意外险买了多长时间生效?可以保...
- 宝马集团上调2023年全年利润率预期
- 阿维塔7月交付1786辆
- 通用因高田气囊故障召回超900辆汽车
- 美国因转向失灵对28万辆特斯拉汽...
- 福特F-150 Lightning产能将提升两倍
- 九强生物8720.93万股限售股将于8...
- 7月沪深两市IPO申报降温 上会...