全球快资讯丨随时随地,追踪每个像素,连遮挡都不怕的「追踪一切」视频算法来了
2023-06-10 14:04:44来源:ZAKER科技
机器之心报道
机器之心编辑部
(相关资料图)
Tracking Everything Everywhere All at Once.
前段时间,Meta 发布「分割一切(SAM)」AI 模型,可以为任何图像或视频中的任何物体生成 mask,让计算机视觉(CV)领域研究者惊呼:「CV 不存在了」。之后,CV 领域掀起了一阵「二创」狂潮,一些工作陆续在分割的基础上结合目标检测、图像生成等功能,但大部分研究是基于静态图像的。
现在,一项称为「追踪一切」的新研究为动态视频中的运动估计提出了新方法,能够准确、完整地追踪物体的运动轨迹。
该研究由来自康奈尔大学、谷歌研究院和 UC 伯克利的研究者共同完成。他们联合提出了一种完整且全局一致的运动表征 OmniMotion,并提出一种新的测试时(test-time)优化方法,对视频中每个像素进行准确、完整的运动估计。论文地址:https://arxiv.org/abs/2306.05422项目主页:https://omnimotion.github.io/
有网友在推特上转发了这项研究,仅一天时间就收获了 3500 + 的点赞量,研究内容大受好评。
从该研究发布的 demo 看,运动追踪的效果非常好,例如追踪跳跃袋鼠的运动轨迹:荡秋千的运动曲线:还能交互式查看运动追踪情况:即使物体被遮挡也能追踪运动轨迹,如狗在跑动的过程中被树遮挡:在计算机视觉领域,常用的运动估计方法有两种:稀疏特征追踪和密集光流。但这两种方法各有缺点,稀疏特征追踪不能建模所有像素的运动;密集光流无法长时间捕获运动轨迹。该研究提出的 OmniMotion 使用 quasi-3D 规范体积来表征视频,并通过局部空间和规范空间之间的双射(bijection)对每个像素进行追踪。这种表征能够保证全局一致性,即使在物体被遮挡的情况下也能进行运动追踪,并对相机和物体运动的任何组合进行建模。该研究通过实验表明所提方法大大优于现有 SOTA 方法。
方法概述
该研究将帧的集合与成对的噪声运动估计(例如光流场)作为输入,以形成整个视频的完整、全局一致的运动表征。然后,该研究添加了一个优化过程,使其可以用任何帧中的任何像素查询表征,以在整个视频中产生平滑、准确的运动轨迹。值得注意的是,该方法可以识别画面中的点何时被遮挡,甚至可以穿过遮挡追踪点。
OmniMotion 表征
传统的运动估计方法(例如成对光流),当物体被遮挡时会失去对物体的追踪。为了在遮挡的情况下也能提供准确、一致的运动轨迹,该研究提出全局运动表征 OmniMotion。
该研究试图在没有显式动态 3D 重建的情况下准确追踪真实世界的运动。OmniMotion 表征将视频中的场景表示为规范的 3D 体积,通过局部规范双射(local-canonical bijection)映射成每个帧中的局部体积。局部规范双射被参数化为神经网络,并在不分离两者的情况下捕获相机和场景运动。基于此种方法,视频可以被视为来自固定静态相机局部体积的渲染结果。
由于 OmniMotion 没有明确区分相机和场景运动,所以形成的表征不是物理上准确的 3D 场景重建。因此,该研究称其为 quasi-3D 表征。OmniMotion 保留了投影到每个像素的所有场景点的信息,以及它们的相对深度顺序,这让画面中的点即使暂时被遮挡,也能对其进行追踪。
实验及结果定量比较
研究者将提出的方法与 TAP-Vid 基准进行比较,结果如表 1 所示。可以看出,在不同的数据集上,他们的方法始终能实现最佳的位置准确性、遮挡准确性和时序一致性。他们的方法可以很好地处理来自 RAFT 和 TAP-Net 的不同的成对对应输入,并且在这两种基准方法上提供了一致的改进。
定性比较如图 3 所示,研究者对他们的方法和基线方法进行了定性比较。新方法在(长时间)遮挡事件中显示出了出色的识别和追踪的能力,同时在遮挡期间为点提供合理的位置,并处理很大的摄像机运动视差。
消融实验与分析研究者利用消融实验来验证他们设计决策的有效性,结果如表 2 所示。
在图 4 中,他们展示了由他们的模型生成的伪深度图,以展示学习到的深度排序。需要注意的是,这些图并不对应于物理深度,然而,它们展示了仅使用光度和光流信号时,新方法能够有效地确定不同表面之间的相对顺序,这对于在遮挡中进行追踪至关重要。更多的消融实验和分析结果可以在补充材料中找到。THE END
投稿或寻求报道:content@jiqizhixin.com
责任编辑:hnmd003
相关阅读
-
全球快资讯丨随时随地,追踪每个像素,连遮挡都不怕的「追踪一切」视频算法来了
机器之心报道机器之心编辑部TrackingEverythingEverywhereAllatOnce 前
2023-06-10 -
全文 + 视频来了!张宏江对话 OpenAI Altman:AGI 会从根本上改变文明,不会很快有 GPT-5_全球最资讯
6月10日,OpenAI创始人SamAltman以视频连线的方式现身于中国北京举办的
2023-06-10 -
苹果头显出新招!收购 AR 明星公司:乔布斯灵魂伴侣 Jony Ive 曾任顾问,还是任天堂合作方 焦点速递
比赛,才刚刚开始——就在苹果刚刚发布VisionPro头显之后第二天,有外
2023-06-10 -
快看点丨Sam Altman 中国对话全文:要警惕 AI 风险,但看懂神经网络比了解人在想什么容易多了
SamAltman的致辞发生在6月10日智源大会的AI安全与对齐分论坛上。现场座
2023-06-10 -
Bethesda 新作《星空》定价曝光:PC 和 Xbox 版本 69.99/79.99 欧元起|全球讯息
由BethesdaGameStudios开发的《星空(Starfield)》是今年不少玩家期待
2023-06-10
相关阅读
-
全球快资讯丨随时随地,追踪每个像素,连遮挡都不怕的「追踪一切」视频算法来了
机器之心报道机器之心编辑部TrackingEverythingEverywhereAllatOnce 前
-
全文 + 视频来了!张宏江对话 OpenAI Altman:AGI 会从根本上改变文明,不会很快有 GPT-5_全球最资讯
6月10日,OpenAI创始人SamAltman以视频连线的方式现身于中国北京举办的
-
苹果头显出新招!收购 AR 明星公司:乔布斯灵魂伴侣 Jony Ive 曾任顾问,还是任天堂合作方 焦点速递
比赛,才刚刚开始——就在苹果刚刚发布VisionPro头显之后第二天,有外
-
焦点信息:一般意外险多少钱一年?包括哪些范围?
一般意外险的价格因保额、保障范围、购买年龄等因素而异。 通常情况下
-
当前快讯:团险意外险包括什么?怎么买?
团险意外险是指由企业或组织向其员工或成员提供的一种商业保险,主要针
-
樊纲:中国经济有很大的韧性 今年5%以上增长可以预期
“即使复苏进程不像原来想象的那么快,今年5%以上的增长还是可以预期的
-
焦点热文:增额终身寿是寿险吗?为什么不值得买?
是。 增额终身寿险是一种保险,它的主要功能是提供终身保障。与传统的
-
2023世界动力电池大会储能发展高峰论坛举行 宜宾被授予“中国储能产业新高地” 焦点
6月9日,2023世界动力电池大会储能发展高峰论坛在宜宾市召开。来自国内
-
年金险给孩子买还是自己买?买多少金额合适?
给孩子买年金险或自己买年金险都有其各自的优缺点,购买时需要根据实际
-
当前看点!合众理财保险安全吗?怎么买?
安全。合众理财保险是一种由保险公司发行的理财产品,其安全程度相对较
-
【世界独家】龙湖集团:今年前5个月累计销售额817亿元,5月新增4宗土地
每经AI快讯,6月9日,龙湖集团控股有限公司(00960 HK)公告,今年前5
-
快看点丨Sam Altman 中国对话全文:要警惕 AI 风险,但看懂神经网络比了解人在想什么容易多了
SamAltman的致辞发生在6月10日智源大会的AI安全与对齐分论坛上。现场座
-
中国电科发布生成式人工智能大模型“小可”
品玩6月10日讯,据中国电科官微,中国电科所属电科太极在京正式发布生
-
Bethesda 新作《星空》定价曝光:PC 和 Xbox 版本 69.99/79.99 欧元起|全球讯息
由BethesdaGameStudios开发的《星空(Starfield)》是今年不少玩家期待
-
微软大牛加入 ZOOM,AI 人才大战打响|热推荐
AI大战越演越烈,人才争夺战也开始白热化。稀缺的AI顶尖人才,成为各大
-
强者恒强,江铃福特全顺何以持续领跑轻客市场?
如果想购买一辆轻客车型,俯瞰全球汽车市场,相信江铃福特全顺定会成为多数人的首选,无论从市场保有量...
-
2023深圳灵活就业社保退休工资与职工有差别吗 环球快资讯
无论是以职工身份,还是以灵活就业人员身份参加职工基本养老保险,达到
-
焦点滚动:解剖案例做到举一反三|天天头条
解剖案例做到举一反三---用好调查研究传家宝,在解剖案例中举一反三,
-
百万医疗康健华尊是消费险吗?怎么买? 世界今头条
百万医疗康健华尊是一款商业医疗保险,不属于消费险范畴。其主要特点是
-
医疗保险一个月多少钱?是人寿保险吗? 焦点消息
首先,要回答这个问题,需要考虑多个因素,如年龄、性别、健康状况和选
-
热门看点:人寿理财保险可以退吗?退保损失多少?
可以。 一般来说,人寿理财保险是可以退保的。人寿理财保险是一种长期
-
学校意外险包括什么?报销需要什么材料?_天天热议
学校意外险是指由学校或学生家长购买的一种旨在保障学生在校期间发生意
-
【环球报资讯】泰康人寿重疾险交满20年后钱怎么办?多少钱?
1 继续缴纳保费:客户可以选择继续缴纳保费,保单将继续有效。如果客户
-
RK3588开发板(armsom-w3)之PWM实操
RK3588开发板(armsom-w3)之PWM实操
-
国宝画重点丨上天入海,到处“出差”!这件宝贝可不得了-环球时讯
太阳神鸟金饰2001年出土于成都金沙遗址。这枚圆形黄金饰品薄如蝉翼,灵
-
全球今日讯!马斯克:推特将向认证创作者支付在评论中投放广告的收益
IT之家6月10日消息,推特(Twitter)老板埃隆马斯克(ElonMusk)刚刚表
-
环球今日报丨联想服务器连续三季度全球第三!以算力赋能实体经济
全球知名市场调研机构IDC近日发布的2023年第一季度x86服务器全球市场追
-
百事通!三星电子据称已开始全面开发大语言模型,目标在 7 月底前完成初始版本
钛媒体App6月10日消息,据市场消息,三星电子本月初已经开始全面开发人
-
与 watchOS 10 相处 72 小时后,我发现了下一代 Apple Watch 的秘密|全球快播报
在VisionPro和visionOS的光芒下,WWDC23上其他软硬件更新都略显暗淡,
-
热议:BlackCat 勒索软件启用了新的签名内核驱动程序
我们将在本文中详细介绍发生在2023年2月的BlackCat勒索软件事件,研究
精彩推荐
阅读排行
精彩推送
- 纷纷上调!事关中国
- 这生意突然走红!有人懵了:当垃...
- 商家挂“高考加油”横幅被城管拆...
- 焦点观察:约基奇23分12篮板掘金...
- 阳光百万医疗优缺点有哪些?多少...
- 当前观察:平安E家百万医疗险怎...
- 工伤团体意外险怎么买?多少钱?...
- 世界今亮点!医保重大疾病险包括...
- 场地意外险多少钱?在哪里买? ...
- 340多家葡萄酒企业悉数亮相 第...
- 【天天速看料】国内物价运行总体...
- 深度学习三巨头之一 Yann LeCu...
- 世界观焦点:完美世界:已在研发...
- 被低估的智能门锁,为何成为智能...
- 百元级的“小屏平板”市场:死不...
- 微软准备在加拿大新建实验室,将...
- 增额寿与年金险哪个收益好?怎么...
- 养老年金保险可靠吗?在哪里买?...
- 即时焦点:年金险和增额终身寿险...
- 招商信诺年金险有必要买吗?在哪...
- 年金保险产品有哪些类型?靠谱吗...
- 暖心助考 全球速看
- 这就是信心|优化营商环境 各地...
- 三星正开发自有 AI 大语言模型...
- 热门:21 个“问界”商标已转让...
- Ryzen Threadripper 7000 系...
- 苹果发布 MR 头显 XR 的“ ...
- OpenAI 联合创始人 sam altma...
- 年轻人更爱买金条了,周大福一年...
- 看热讯:我,“绝版”毕业生,专...