超负荷 Google I/O:AI 大满贯更新在前,没人关注 Pixel 手机了 视焦点讯
2023-05-11 10:06:52来源:ZAKER科技
在 AI 上积累了 7 年的谷歌,迎来了一场真正以 AI 为核心的 I/O 发布会。
比起去年,强调「整合全球信息,使人人都能从访问中受益」的使命,谷歌 CEO Sundar Pichai 今年 以「Making AI helpful for everyone」总领整个发布会。AI 将成为工具,帮助每一个人。这既包括了谷歌一贯强调的整合信息、学习,还包括 AI 成为创作力辅助、帮助企业更好地创新产品。模型、产品、功能、平台、硬件,一个接一个 demo,一个接一个 trailer,掌声和欢呼一刻也没有停下。
【资料图】
如果没有 OpenAI 和微软带来的竞争,我们可能永远看到不到这样一场,超负荷的 Google I/O 发布会。
在这两个半小时里,山景城的海滨露天剧场,渴望成为世界中心。
开场三个 Demo
开场前的表演即是一个生成式人工智能实验。
音乐家丹 · 迪肯使用谷歌的 MusicLM、Phenaki 和 Bard Al 制作。「在制作这个节目的过程中,没有鸭子受到伤害。」
Sundar Pichai 登台,「机会终于来了,」他说,「这是 AI 的好年」。
在大模型及一系列产品功能更新前,他先上了三碟前菜。
Gmail 发布新功能「帮我写」(Help Me Write),根据邮件内容,用自然语言命令 AI 撰写对应的回复。比如,航空公司发来航班取消的邮件,表示会送上代金券作为补偿,这时候你可以让 AI 帮你写一个全额退款的邮件,它就会结合具体邮件内容,撰写全文。
Google Maps 将街景与导航结合,发布新功能「沉浸式路线视图」(Immersive View for routes)。用户可以在导航时,直接提前看到整个路线的动态街景视角。
在这一视图中,用户还能查看路线中的交通、天气情况。Google Photos 推出「魔法编辑器」(Magic Editor)。这是编辑前的图片,仅仅使用拖拽和一键优化,孩子的位置移动了,天空变得更蓝了。PaLM2 取代了 LamDA,分化出四个版本
如今谈 AI 技术,必须先亮出大模型,谷歌也不例外。
在 I/O 之前,关于谷歌最新模型的消息就陆续传出。此前支持 Bard 的模型是一个轻量级的对话模型 LamDA,Pichai 在三月份采访中就表示,将把背后的模型升级为更大规模的 PaLM 模型。
I/O2023 上,最新最强的 PaLM2 终于露出了庐山真面目。PaLM2 是 PaLM1 的升级版。PaLM2 在数学、编码、推理、多语言翻译和自然语言生成上的表现都更加出色。
Pichai 现场展示了一个修改 Bug 后,用韩语对代码进行解释的例子:
PaLM 是谷歌于 2022 年 4 月份推出的大语言模型,有 5400 亿参数。这次介绍的 PaLM2 是在此基础上的升级版。PaLM 是 Pathways Language Model 缩写。可以理解为,在 Pathway 架构上训练的模型。Jeff Dean 曾经专门撰文介绍 Pathway 架构,这个架构是为了可以处理多任务的通用模型而设计,采用了一种新的异步分布式数据流,这使得并行计算和运行更加高效。Pathways 还可以支持包含视觉、听觉和语言理解的多模态模型。
PaLM2 使用谷歌自主研发的 TPU 进行计算,具体使用了多少算力计算 PaLM2 目前尚未公布,但可以参考训练 PaLM1 的数据,使用了 6144 块 TPU。
使用谷歌最新的 TPU 架构来训练模型,意味着在基础工程上,谷歌进行了整合计算、优化缩放、改善数据集组合和模型架构等各项工作,这些也能够使得模型能力灵活被调用进各种产品、服务中。谷歌能够将模型的能力按照需求进行蒸馏和提炼。
为了让模型的能力更灵活地服务于产品,Pichai 特地强调,PalM2 有四种不同的尺寸,分别以动物的名称命名:壁虎、水獭、野牛和独角兽。其中壁虎(Gecko)最轻量级的版本。
Gecko is so lightweight that it can work on mobile devices and is fast enough for great interactive applications on-device, even when offline. This versatility means PaLM 2 can be fine-tuned to support entire classes of products in more ways, to help more people.Gecko 是如此轻量级,以至于它可以在移动设备上工作,而且速度足够快,可以在设备上运行交互式应用程序,即使在离线时也是如此。这种多功能性意味着可以对 PalM2 进行微调,以便以更多的方式支持整个类别的产品,从而帮助更多的人。
最轻的模型可以在移动设备上运行交互应用程序,而在最新的三星 Galaxy 上,它能够每秒处理 16 个 Token。
此外,pathway 架构的设置,也利于在特定领域对模型进行微调。健康研究团队在此基础上进一步发展,创建了 Med-PaLM 2,它可以检索医学知识、回答问题、生成有用的模板,解码医学行话。
在上一代 AI 视觉技术中,AI 已经被训练能够看懂 X 光片等图像,现在结合语言生成能力,模型能够根据提供的
搜索新体验:升级 Bard 之外,
又加了一个 Search Lab
之前为了应对 NewBing 的挑战,谷歌匆匆上线了对话机器人 Bard。但是从各种用户反馈来看,许多人都觉得作为搜索助手的 Bard 不如 NewBing 好用。
对话与生成将更新搜索体验,已经成为新的共识,但是具体的产品形态依旧在探索的路上。谷歌也不想用 Bard 这个产品完全定义自己未来的搜索产品形态,因此关于搜索功能的升级,Keynote 中分为两个部分来展示:Bard 产品升级,Search Lab 的新功能测试。而这些新的功能,都由最 PalM2 来支持。
Bard 的基本功能点升级比如支持更多语言,能够识别图像信息,都属于规定动作,并无意外。让人感到惊喜的地方是,Bard 将接通谷歌自己的应用程序,以及一些外部的应用,来实现更强大的功能。
比如,有着惊艳语言生成图像能力的 Adobe firefly,在未来几个月将直接集成到 Bard 中。这样在和 Bard 的对话中,就能够设计图片,比如请柬的封面、想象中的蛋糕。
谷歌地图、图表能力也能够直接在 Bard 中调用。现场演示给了一个例子,用户通过提问得到了几所符合自己报考目的大学名单,让 Bard 在地图中将这几个学校的地址标出来,再让 Bard 根据学习的专业、排名、地址等相关信息生成对比表格。
关于复杂问题的搜索,则在 Search Lab 的环节中进行演示。Search Lab 是一个探索性的产品,目前还没有全部开放,需要申请 Waitlist 才能使用。新的搜索体验试图帮助人们更好地分析一个复杂、或者有些模糊的问题。在人们开始搜索的时候,往往问题并不明确,而是知道一个大致的方向,又或者是问题能够再被拆分为子问题。
现场演示了对比景点、购买 ebike 两个例子。搜索即是决策过程,AI 生成要点提供了思考的框架,并提供相关链接,用户可以通过对话深挖信息。
有 3 岁以下的孩子和狗狗的家庭,Bryce Canyon 和 National Parks 哪个更适合?在这个案例演示中,Generative AI 汇总提炼了两个景点的优劣,并且提供了几篇参考链接,如果用户有需求,可以打开参考链接阅读,而且链接文章也会根据不同的内容重点进行分类。在另外一个演示案例中,用户需要选购一辆支持通勤 5 英里和山路的 ebike,AI 会提炼设计、电池、减震装置等关键的选购因素。对话模式下,AI 会记住用户之前的一些选择,对信息做进一步的处理。比如用户想要「红色的 Ebike」,AI 会继续基于「通勤 5 英里、支持山路」等条件继续进行筛选。谷歌的 AI 副驾驶,叫「Duet AI」不出意外,有了新模型,对内,能升级的产品升级;对外,向企业提供服务,帮助他们更好地用上模型能力。这也符合 Pichai 在开场后不久提到的「AI helpful everyone」。
Google Workspace 是谷歌推出的多人协作软件,现在无论是写作文案、故事写作、制作幻灯片、制作表格,都可以用上 AI 了,形式类似于微软的 Copilot,在工作的主界面右侧有一个边栏,谷歌将其称为「sidekick」,AI 会在这里提出文章的修改意见、建议生成配图、表格的样式,用户选择合适的结果,就可以将 AI 生成的内容移入主界面。
「sidekick」样式「Help Me Write」的写作辅助功能,同时出现在 Workspace 和 Gamil 里。据谷歌介绍,目前在 Workspace 最受欢迎的用例是「给出几个关键词,完成招聘要点」。
阅读室、豌豆荚创始人,同时也是谷歌前员工的王俊煜对此吐槽,这个产品设计就是沿用了 Microsoft 365 Copilot 的思路,但是换了个「Duet AI」的名字。
形式上看起来的确差不多,不过使用体验如何涉及很多细微的因素,比如根据 prompt 的生成内容是否令人满意,根据文章内容生成的配图效果如何,是不是可以直接使用。这些都需要等待用户们使用了一段时间后,给出反馈。
就像各处出现的「Help Me Write」,「Duet AI」也出现在给开发者的云工具上,在 Cloud Console 出现的「Duet AI」,功能是用语言改善开发者与云平台上工具的交互体验。利用生成式 AI 提供实时的上下文代码完成、代码函数生成、基于代码库的建议,甚至协助进行代码审查和检查。
面面俱到的服务:
平台、模型、计算设施
谷歌面向企业的 AI 平台叫做 vertex AI,企业用户可以在这个平台上调用需要的模型、按照需求对模型的参数权重进行微调、根据内部数据建立企业版本的搜索引擎。
除了语言模型,谷歌还提供了其它三个专业能力模型供选用:图像生成模型、代码生成模型、以及文本转语音模型 Chirp。
在现场展示的合作伙伴中,Replit、Character AI、Canvas 等明星公司都在其中,当然还有谷歌自己投资的 Antropic,也在使用谷歌提供的模型云服务。
现场还公布了一个基础设施层面的消息,谷歌和英伟达合作,搭建了基于 H100 的下一代 A3 图形处理器超级计算机。
基于 H100 的 A3 虚拟机,网络带宽比上一代 A2 虚拟机多 10 倍。当然,PalM 的 API 也将在不久开放。
可以说,在对外输出模型能力上,谷歌确实拿出了实力雄厚的大厂做派,从开发工具平台、到基础模型、到基础设施、开放 API,一整个做了全套。
硬件:三款新产品,
Android 14 未登场
这次 I/O 大会上 Google 也发布了一系列的硬件。除了在 2022 I/O 上预告的 Android 平板、新机 Pixel 7a,谷歌也终于发布了自己的折叠手机。
今年 5 月 4 日星战日,Google 的一段视频泄露了折叠手机 Pixel Fold 的存在。
对标三星的 Galaxy Z Fold 系列,目前有黑白两种配色,官方价格 1799 美元,已同步上架,预定送 Pixel Watch,6 月开始配送,默认不包含充电器。为了实现折叠的形态,谷歌重新设计了长焦镜头模组、电池组件等等,使其保持相对的轻薄,官方号称是最薄的折叠屏手机。
双屏除了我们常见的桌面模式和悬停模式之外,谷歌考虑的「内外屏」同时显示功能是『实时翻译』,内外屏显示两种翻译的语言(感觉并不是什么有用的功能,语音翻译不是更实用?)。总结
在微软的 NewBing、Office 365 全家桶、Notion AI 辅助写作功能面世之后,再看谷歌的产品似乎都给人一种似曾相识之感,很难耳目一新。大模型给产品形态上带来的第一轮冲击,已经基本完成了。
值得注意的是,虽然产品展示了识别图片的能力,但是谷歌似乎还没有一个像 GPT-4 这样的拥有文字、图像多模态的基础模型。Pichai 只是预告了一个叫做 Gemini 的多模态模型,正在研发之中,不久后会公布。
抛开 Duet AI 与 Copilot 类似的产品形态,谷歌在介绍时,强调了其自动优化 Prompt 语言表述,以及自动根据文章内容提出写作建议的特点,似乎更加用户友好。是否用起来也会如此,还需要等待用户反馈。同理,最新的模型 PaLM2 所支持的搜索功能,和 NewBing 相比,究竟体验如何?PaLM2 支持的 Bard,比之前 LamDA 支持的 Bard,使用感能够提升多少?
在 I/O 的媒体预沟通会上,有人提问,看起来谷歌将模型的能力分散到了各个产品里,重点不明确。来自谷歌研究部门的工作人员回答道,「这似乎是一种分散策略,但在谷歌,我们支持大量的产品,我们将其视为模型的灵活性,来支持不同的用例和受众群体。这也是我们能够同时在许多不同方向上测试模型能力的好方法。」
长期来看,大模型的最终竞争壁垒不在于技术,而在于产品是否会被用户真正接纳,围绕技术能否实现开发者生态。从这次发布来看,谷歌布局了所有能布局的产品与服务,而在其进入的领域中,是否能够真正形成优势,所有人将拭目以待。
责任编辑:hnmd003
相关阅读
-
超负荷 Google I/O:AI 大满贯更新在前,没人关注 Pixel 手机了 视焦点讯
在AI上积累了7年的谷歌,迎来了一场真正以AI为核心的I O发布会。比起去年,强调「整合全球信息,使人人都能
2023-05-11 -
登顶 DXOMARK,海外发布,华为 P60 Pro 为何持续“遥遥领先”?
别忘了余承东之前所讲的三年之约:2023年王者归来。按照华为的实力与决心,无论是中国还是全球市场,都将如
2023-05-11 -
天天消息!Google 刚刚发布手机、平板全家桶!我们现场体验后有点失望
总觉得GoogleI O大会,与苹果WWDC大会有异曲同工之妙。名义上都是「开发者大会」,实则总会发布一些硬件产
2023-05-11 -
最新消息:凌晨重磅!Google 版 ChatGPT 史诗级更新, 新模型赶超 GPT-4,要把搜索彻底颠覆
文章开始之前先说个冷知识:今年是Google举办I O开发者大会的第15个年头。纵观近七年来的I O大会,AI内容一
2023-05-11 -
焦点速看:百级分区大屏普及者 雷鸟 75 英寸鹤 7PRO 评测
在2023年,我们所知的主流电视品牌大多已经加入了MiniLED电视的赛道。MiniLED背光作为一种更进一步的液晶屏
2023-05-11
相关阅读
-
超负荷 Google I/O:AI 大满贯更新在前,没人关注 Pixel 手机了 视焦点讯
在AI上积累了7年的谷歌,迎来了一场真正以AI为核心的I O发布会。比起去年,强调「整合全球信息,使人人都能
-
登顶 DXOMARK,海外发布,华为 P60 Pro 为何持续“遥遥领先”?
别忘了余承东之前所讲的三年之约:2023年王者归来。按照华为的实力与决心,无论是中国还是全球市场,都将如
-
AMD 将展示新一代数据中心技术 AI 将提振算力行业后市需求|全球即时
AMD将在太平洋时间6月13日上午10点,展示新一代数据中心和人工智能技术。AMD将此次活动称为AMD数据中心和人
-
AI 专家:人工智能将在几年内取代八成人力 焦点
人工智能取代人力的争论自ChatGPT爆火以来,一直被反复提及。高盛3月时发布报告估计,全球将有3亿个岗位将
-
比亚迪跨界进入保险市场 险企资产、负债两端有望持续向好
日前,银保监会官网公布了关于易安财产保险股份有限公司变更股东的批复。公告显示,银保监会同意比亚迪汽车
-
乌海“空天地一体” 赋能生态环境立体监测|环球热门
乌海市于去年底上线运行的大气污染精细化监管系统,是地市级沿黄工业城市智慧物联、大数据技术在环境管理中
-
24 小时炒美股将成真 美散户大本营 Robinhood 亮出“大招”
财联社5月11日讯(编辑潇湘)两年前在美国散户大战华尔街战役中大红大紫的在线券商平台Robinhood,本周又推
-
【全球独家】巴彦淖尔市建设8700亩鲜食玉米试验示范基地
今年,市现代农牧事业发展中心与内蒙古沃原农牧业发展有限公司合作,在杭锦后旗头道桥镇黄河村建设鲜食玉米
-
包头九原区全力做大经济总量提升发展能级
大道如砥,大势如潮。2023年即将过半,九原区的经济“航船”又行进到关键一程。从农田到工厂,忙碌的身...
-
天天热消息:理想汽车 Q1 净利润超 9 亿 销量超过蔚来和小鹏同期总和 !
财联社5月11日讯(编辑周新旸)理想汽车(02015 HK)周三(5月10日)晚间公布了财报。一季度总营收人民币187 9
-
强奸美女犯法吗?女性性侵犯男性会被认定为强奸罪吗?刑法第二百三十六条规定内容
女性性侵犯男性是不能被认定为强奸罪的,因为我国刑法规定的强奸罪是男性性侵女性。如果女性性侵男性造...
-
什么是假释?对犯罪分子决定假释时所居住的社区不愿意接受怎么办?
假释是一种对被判处有期徒刑、无期徒刑的犯罪分子,在执行一定刑期之后,因其遵守监规,接受教育和改造...
-
假释的条件包括哪些内容?有哪些犯罪行为是不得假释的?
假释的条件包括:1、犯罪分子被判处有期徒刑的,执行原判刑期二分之一以上;被判处无期徒刑的,实际执行...
-
日喀则市文化局开展文化领域消防安全检查-天天速看
为进一步强化各类火灾防控措施,确保全市各级文物保护单位和文化市场领域的消防安全,近日,日喀则市文化局
-
西藏第一届技工(职业)院校职业技能大赛开幕 全球播报
职业技能大赛现场。记者梁兰摄为充分发挥职业技能竞赛在促进人才培养、激发人才创新创造活力中的重要作用,
-
西藏申请授予法律职业资格5月10日起提交材料
图为申请授予法律职业资格人员在排队等候递交申请资料。拉萨融媒记者齐永昌摄记者日前从西藏自治区司法厅了
-
假释是什么意思?假释的适用条件是什么样的呢?假释一般是适用于哪些犯罪分子?
假释是一种对被判处有期徒刑、无期徒刑的犯罪分子,在执行一定刑期之后,因其遵守监规,接受教育和改造...
-
什么是纳税人识别号?纳税人识别号是按照不同业务管理划分分为哪三类?
纳税人识别号是,纳税人、扣缴义务人的纳税识别代码,分为扣缴义务人登记时发放的登记纳税证件中的代码...
-
宝塔线是什么线?宝塔线和k线有什么区别?
宝塔线是什么线?宝塔线指标宝塔线指标,称为TOWER指标,一般是股价的中长期走势的工具,它从当天的起始...
-
纳税人编码一般是有什么组成的?每一个公民的纳税编码是不一样的吗?
公司的纳税人代码学名纳税人识别码,通常简称为税号。纳税人识别号就是税务登记证上的号,每个企业的识...
-
片仔癀20年涨价18次!片仔癀有什么功效和作用?
片仔癀20年涨价18次!片仔癀又涨价了。记者梳理发现,自2003年6月11日片仔癀上市至今,20年间片仔癀官方...
-
缴纳个人所得税的纳税标准是什么样的?个人所得税应纳税的起征点是多少?
交纳个人所得税,起征点每月5000元,应纳税所得额=月度收入-5000元(起征点)-专项扣除(三险一金等)-专项...
-
怎么办理护照?办理护照一般是在哪里办理的?护照的申请材料都有什么?
办理护照的流程是:1、公民携带本人的居民身份证、户口簿、近期免冠照片以及申请事由的相关材料;2、向公...
-
配股是什么意思?配股的股票什么时候可以卖?
配股是什么意思?配股是上市公司根据公司发展需要,依照有关法律和相应的程序,向原股东进一步发行新股、...
-
如何办理护照?公安机关出入境管理机构应当自收到申请材料之日起多少天发护照?
办理护照的流程是:1、公民携带本人的居民身份证、户口簿、近期免冠照片以及申请事由的相关材料;2、向公...
-
板块轮动是什么意思?如何掌握板块轮动的规律
板块轮动是什么意思?板块轮动分为指数轮动板块以及非指数轮动板块,其中,指数轮动板块往往以权重大盘股...
-
护照怎么办?办理护照的流程是什么样的呢?护照怎么加急办理?
办理护照的流程是:1、公民携带本人的居民身份证、户口簿、近期免冠照片以及申请事由的相关材料;2、向公...
-
题材股具有哪些特征?题材股和概念股的区别
题材股是指哪些股票?题材股就是可以有炒作题材的风格股票。一般都是于社会发生的重大事件或者突发事件息...
-
什么牌子的奶粉吸收好?好吸收的奶粉还得看它
婴幼儿肠道功能发育不完善,消化吸收能力差,如果家长给孩子选的奶粉不易消化吸收,孩子喝了之后容易出...
-
股息红利怎么发放?股息红利差异扣税什么意思?
股息红利怎么发放?1、送红股形式采用送红股的形式发放股息红利实际上就是将应该分给股东的现金留在企业...
精彩推荐
阅读排行
精彩推送
- 江恩角度线以多少角度最佳?江恩...
- 中国人才吸引力10强城市出炉!人...
- Mysteel:11家重点房企2023计划...
- 护照办理流程是什么?办理护照都...
- 股票仙人指路第二天会怎么走?股...
- 护照怎么办理?办理护照的基本流...
- 散户应该怎么打新股?散户打新股...
- 沿着政策的边际变化寻找产业贝塔...
- 云计算企业追踪:从PaaS到多云管...
- 环球简讯:尼康发布全画幅微单数...
- 微软宣布2023年全职员工不加薪,...
- 中国平安人寿保险靠谱吗?险种有...
- 合众人寿保险公司排名第几?可靠...
- 一般交通事故赔偿标准医疗费是按...
- 建行银行卡被大批量冻结?银行回...
- 医疗事故鉴定标准是什么呢?根据...
- 真的在裁员?福特中国称“正打造...
- 大众CEO:加强合作是解决在华挑...
- 交通事故责任赔偿一般需赔偿哪些...
- 麦当劳为什么改名?中国麦当劳和...
- 河南交通事故赔偿包括哪些费用?...
- 江苏省交通事故赔偿标准是怎么计...
- 为什么电脑自动重启?电脑自动重...
- 浙江省交通事故赔偿标准算法是什...
- 交通事故理赔标准是什么样的?误...
- 21寸显示器分辨率多少最佳?21寸...
- 工程质量事故分类都有哪些?根据...
- 网线最长多少米不影响网速?90米...
- 交通事故责任认定标准都有什么?...
- 激光打印机打印不清楚是什么原因...