视频版 Midjourney 又进化了:一句话生成视频,谷歌注资,网友大呼好莱坞已死! 每日动态
2023-06-17 14:07:08来源:ZAKER科技
提到国外的生成式 AI 大模型,文本生成领域有 ChatGPT,图像生成领域有 Midjourney 和 Stable Diffusion,那么视频生成领域有什么?
很多人第一个会想到 Runway 公司的 Gen-1。
Gen-1 是 Runway 在今年 2 月推出的一款(也是该公司的第一款)由文本生成视频的 AI 大模型。不过就在几天前,它的迭代版本 Gen-2 也正式发布了。
(资料图片仅供参考)
虽然当时 Runway 的发言人 Kelsey Rondenet 说过 Gen-2 会在未来几周对所有人开放,不过直到 6 月,这个承诺才算真的兑现了。
所以千呼万唤始出来的 Gen-2,到底进化到哪一步了?
真正的从零开始生成视频
在发布 Gen-1 的时候,Runway 专门开辟了一个网页来给大家讲解 Gen-1 能怎么用,大致来讲主要包括了下面 5 个功能:
- 输入一张图片提示,来让原视频变成你想要的风格;
- 上传视频 + 一段提示词,生成你想要的视频(比如让一只拉布拉多变成斑点狗);
- 输入图片或提示词,来让一段只做了 3D 建模的视频草稿变完整;
- 上传一段随意拍摄的视频,自动生成一段有故事感的片段(比如随意摆放的书最后成了一片高楼大厦);
- 在原视频的基础上,更自由地定制你想要的视频风格(哪怕变出一只现实里并不存在的奇行种)。
发现没有,使用 Gen-1 的前提是必须先有一个现成的视频。说白了,Gen-1 的作用其实就相当于给原视频加了一个更高级的滤镜。而到了 Gen-2,可以说才真正实现了从零开始生成视频的梦想。
从介绍来看,Gen-2 比 Gen-1 多了 3 个厉害的功能:
- 文本到视频:只用输入一段提示词,就能生成一段视频;
- 文本和图片到视频:输入一张图片 + 一段提示词,就能让图片动起来;
- 图片到视频:只用输入一张图片,就能自动生成一段视频(比如让图片里的云飘起来,水流起来,人走动起来)。
此图为输入 "The late afternoon sun peeking through the window of a New York City loft" 的提示词生成如果说 Gen-1 充其量只能当做一个修改视频的工具,那么 Gen-2 几乎已经能作为一个视频生产工具了——试想一句话生成的一个个视频片段,最后拼到一起就能讲一个完整的故事了……
总之就是只能拿来玩和能拿来用的区别。
虽然目前 Gen-2 生成的视频依然存在细节模糊不清、形态扭曲等等品质问题,且生成的视频长度最多只有 4 秒,但它可能是现在视频生成领域最厉害的 AI 大模型工具了。
当然,从 Gen-2 开始,也标志着 Runway 公司正式进入了收费时代:不同于 Gen-1 的完全免费,Gen-2 免费版的视频生成功能有限(试用额度只有 105 秒,约等于 26 个 4 秒视频,且分辨率低、有水印),用户需要每月付 15 美元(或 144 美元包年)才能用到它的完整功能。
Runway 有啥来头?
Gen-2 背后的 Runway 是一家成立于 2018 年的年轻公司,一直在研究怎么用 AI 来提升视频制作效率。
除了 TikTok 和 YouTube 上的普通用户,Runway 的客户还包括了不少主流影视工作室,比如扣扣熊主持的《深夜秀》就用到过 Runway 的工具来辅助编辑图像。
它最著名的一次应用应该是去年在中国观众中间非常出圈的电影《瞬息全宇宙》,据报道里面让人印象深刻的面条手,还有石头对话等超现实场景都用到了 Runway 的技术。
不过很多人可能会忽略的是,早些天被爆出大丑闻的 Stable Diffusion 也和 Runway 关系密切。准确来说是一直被外界视作 Stable Diffusion(时下图像生成领域最热门的大模型之一)背后公司的 Stability AI 爆雷了,媒体列出 Stability AI 的罪状之一就是,它把 Stable Diffusion 的 10 亿代码成果 " 据为己有 ",而它充其量只是给 Stable Diffusion 提供了算力(出了钱)。
实际上真正为 Stable Diffusion 出力的是慕尼黑大学、海德堡大学,以及 Runway。
Stable Diffusion 最早发表在 CVPR 2022 年中的一篇论文也就是说,Runway 是 Stable Diffusion 的研发者之一。
Runway 在去年还因为官宣发布了 Stable Diffusion v1.5 版本一度被 Stability AI 抓着不放,但那次的舆论最终还是站在了 Runway 这边。
这也是 Runway 在 " 成名 " 以前为数不多的 " 八卦 "。
后来就像大多数的大模型开发公司一样,不再参与 Stable Diffusion 项目的 Runway 在发布 Gen-1 之后,发展速度就像坐上了火箭,并且在本月初拿到了谷歌的投资,距离 D 轮 1 亿美元的融资刚过去一个月,累计融资至少已有 2 亿美元,成为大模型领域的明星公司。
说个更直观的数字,2021 年 12 月对冲基金 Coatue 花 3500 万美元投资 Runway 时,其估值为 2 亿美元,一年后估值变成 5 亿美元,再过了半年,它的估值就又翻了 3 倍(保守说有 15 亿美元)。
网友:好莱坞 is dead
Gen-2 的正式发布让不少网友感到兴奋。
在 Runway 官宣发布 Gen-2 的推文下,出现了一些普通用户 " 求教程 " 的声音:
不过已经有行动力强的用户开始试着用 Gen-2 生成自己的视频了,不少用户都在 Runway 推文的评论区交上了自己的 4 秒钟 " 作业 "。尽管 Runway 只是在网站列出了 Gen-2 的主要功能,并没有教给大家更多 Gen-2 的玩法,但聪明的网友已经自己学着用 Gen-2 生成的视频剪辑出了一个有反转的短故事。
比如这个叫 "Monster of the sea(海怪)" 的48 秒故事:天气晴朗、风平浪静的一天,一搜帆船开始还很悠然地行驶在海上,船上的游客惬意地碰着杯喝着酒,可突然狂风大作,船员拿起望远镜往远处望,发现一只巨大的海怪出现在海面,船随着海浪开始颠簸,甚至燃烧了起来,船上的人纷纷跳水弃船逃生。
来自推特网友 @MHU甚至有直接用 ChatGPT 写了剧本、再用 Gen-2 生成的视频拼成一个故事的。
还有用户拿 Gen-2 生成的素材剪了一个 1 分钟的电影预告片,甚至在最后幽默地加了一个戛纳电影节的标志,如果生成的视频质量再高一点,怕不是真能以假乱真。
来自推特网友 @Toni Seldr不过视频质量差、生成的视频时长太短等也确实成了用户吐槽 Gen-2 的点。
并且在为安卓用户提供 App 服务的问题上,Gen-2 和 Gen-1 一样也还是没有长进。当然,更多用户还是对 Runway 表现出了宽容。有网友评价说," 虽然它有太多的不完美,但有一点可以肯定,整个视听工业都将迎来革命性的改变。"还有网友更激进地说," 好莱坞已死,任何人都可能做出一部世界级的电影。"真能取代好莱坞吗?可以理解为什么广大网友对 Gen-2 的推出如此兴奋。Gen-2 对普通用户的好处是明摆着的——假以时日,文本生成视频技术一旦成熟,将意味着拍电影不再只是大制片厂的专属,任何一个普通人都可以做一部自己的电影。
Runway 并没有明确说过 Gen-2 面向的人群到底是谁。不过我们可以从它推出 App 以及之前和影视工作室有过的合作等等动作来看,大致猜到有哪些人会用到 Gen-2:专业的制片公司,个人工作室性质的独立生产者,以及我们这样的普通用户。
虽然 Gen-2 看起来对普通用户很友好,但制片公司们会用 Gen-2 这样的工具也是肯定的。
毕竟大模型不同于过去任何一个热过之后就销声匿迹的概念,它将成为未来又一次深刻改变人类的产业革命,几乎已经是各行各业的共识。
事实上在国内,已经有影视项目开始借助大模型来完成一些工作。比如在剧本筹备阶段,会把分镜头故事板的产出工作交给 Midjourney(据说能省下几十万元的成本)。
那假设,有一天 Gen-N 成熟到也能生成能直接拿去用的完美镜头呢?
或者可以拿大模型在游戏行业的应用做个类比,Midjourney 等工具的使用显然已经对游戏公司产生了非常现实的影响:先是出于节省成本的需要砍掉美术外包团队,接着就是在自己人身上动刀,甚至有从业者提到最多有 8 成的原画师会下岗。
考虑到如今大模型的迭代速度,它的影响真正显现在影视行业也会是迟早的事。
不过我反而觉得,Gen-2 大模型可能会淘汰那些影视行业流水线上的 " 工人 ",但却淘汰不了真正的艺术家。
之前听到过一个说法,AI 大模型生成的内容里,可能有 80% 都会是对人类过去经验无聊的重复,但也可能有 20% 闪光的东西。就比如在中式美学和赛博朋克如何进行融合的问题上,普通创作者可能需要极长时间进行思考,AI 却可能生成一个让人意想不到的结果,给人带来惊喜。
这 20% 是 AI 存在的意义,剩下的就需要真正有创造力的人去补足。
还有从业者提到过一个观点,AI 大模型运用到影视行业的生产,不意味着非专业人士也能轻松上手——如果想借助 AI 的力量创作剧本,还需要针对剧本公式和故事结构等相关知识进行充电。不具备基础知识的小白即便有了 AI 这个超级助理也无济于事。
所以回到 AI 是不是能取代好莱坞的问题,事实上好莱坞可能是最早对新技术的 " 入侵 " 有所感知的,就像在今年 5 月初,数以千计的好莱坞编剧工会(WGA)成员曾进行罢工示威,诉求之一便是抵制在剧本写作中广泛使用 AI 的现象。
如果有一天 Gen-N 真的来了,好莱坞导演们可能第一个不答应。
责任编辑:hnmd003
相关阅读
-
“空间计算”深意:“眼动追踪 + 脑机技术”,苹果 Vision Pro 硬核定义“ iPhone 时刻”
我们迎来了onemorething,一个全新的增强现实平台、一个革命的新产品
2023-06-17
相关阅读
-
视频版 Midjourney 又进化了:一句话生成视频,谷歌注资,网友大呼好莱坞已死! 每日动态
提到国外的生成式AI大模型,文本生成领域有ChatGPT,图像生成领域有Mid
-
即时:中国创投“抢滩”印尼
点击进入钛媒体「出海参考」公众号,关注获取更多出海资讯(图片来源:
-
适马即将带来 RF 卡口镜头产品?
根据国外网站RumorMill的最新传闻,适马即将宣布两支新的RFmount镜头。
-
萝卜快跑获深圳全无人商业化出行首批牌照|环球今头条
品玩6月17日讯,据财联社报道,百度旗下自动驾驶出行服务平台萝卜快跑
-
每日看点!是谁杀死了机械硬盘?不是固态硬盘
图片来源@视觉中国文|雷科技Ieitech虽然小雷并没有打算在618期间升级自
-
三亚,五连涨了!
三亚楼市又热了?今年1月以来,三亚新房、二手房住宅销售价格指数已经
-
焦点滚动:侥幸心理_侥幸
1、侥幸jiǎoxìnglucky由于偶然的原因而得到成功或免去灾害,很幸运。2
-
全省唯一!常德巴家营地获2023全国青少年户外夏令营活动承办权
6月15日,中国登山协会官网发布了《关于公布“奔跑吧·少年”2023年“
-
泰康人寿重疾险值得买吗?多少钱?-热讯
泰康人寿重疾险在保险市场上享有较高的声誉,值得购买。 作为一种专门
-
富德生命人寿保险重大疾病险怎么样?多少钱? 世界滚动
富德生命人寿保险重大疾病险是由富德生命人寿保险公司推出的一种健康保
-
交通意外的保险赔偿项目有哪些?怎么赔付? 即时焦点
1、意外伤残赔偿:根据事故造成的身体伤害程度和意外伤残等级,给予受
-
中信保诚年金险怎么样?可以买吗?
中信保诚年金险作为一种养老保险,具有以下特点: 1、长期稳定收益:中
-
全球实时:重疾保障是什么意思?免费领取是真的吗?
重疾保障是指保险公司在被保险人罹患特定的重大疾病时,根据保单约定给
-
“青岛海骊科技考察中融新大集团玻璃园区产业发展” 天天通讯
近日,青岛海骊科技股份有限公司考察团一行到中融新大巨润建材及拓新公
-
世界互联网大会数字文明“尼山对话”25日在山东召开 聚焦人工智能 引领数字世界未来发展|世界速读
世界互联网大会数字文明“尼山对话”25日在山东召开,聚焦人工智能,引
-
三星 Watch 6 系列手表渲染图曝光 或与折叠屏一同发布 全球动态
【手机中国新闻】按照往年的惯例,三星将在即将到来的新品发布会上一次
-
“空间计算”深意:“眼动追踪 + 脑机技术”,苹果 Vision Pro 硬核定义“ iPhone 时刻”
我们迎来了onemorething,一个全新的增强现实平台、一个革命的新产品
-
医生用 ChatGPT 帮你看病,越来越有必要|当前速看
如果你向ChatGPT倾诉过烦恼,它大概率会在开头说,很遗憾听见你感到难
-
大模型衍生应用层出不穷 IT 生产力亟待释放 低代码平台驶入发展快车道|焦点滚动
《科创板日报》6月17日讯(编辑邱思雨)AI大模型的衍生应用层出不穷,
-
快报:东南亚房产市场调研报告
图片来源@视觉中国文|鲸维度,作者|《鲸维度》调研组,执笔:Wichy近年
-
央视女记者王冰冰写真!雪肤玉貌笑容超甜美得让人窒息
最近,王冰冰粉丝发布了一组超赞的美图,魅力十足。王冰冰身穿黑白无袖
-
消息!重疾险有没有必要买?君龙人寿重疾险怎么样?
君龙人寿重疾险作为一种专注于重大疾病风险的保险产品,它的存在是有其
-
国寿鑫裕尊享年金保险条款是什么?值得买吗?
国寿鑫裕尊享年金保险的条款包括以下几个方面: 1、投保范围:凡出生28
-
百万医疗如何报销?一年要交多少保费?_实时焦点
就医时需先支付费用:在使用百万医疗保险时,就医时需要先支付医疗费用
-
筑福未来年金保险B款(分红型)怎么样?怎么买? 今日要闻
年金保险B款(分红型)的投保年龄范围广,可保至被保人100周岁,缴费方
-
速递!怎么查养老保险交了多少年?养老保险断交的影响是什么?
1 社保卡查询:持社保卡去当地社保局或相关机构,通过刷卡或提供个人信
-
新华全媒+|探访高考评卷现场:各地严把评卷质量关_世界最新
2023年全国高考评卷工作如何开展?我们一探究竟。
-
环球今头条!「村 BA」进入子弹时间
这是决定胜负的一球。0秒出手,终场哨音破空而响,望着篮球滑向弧线的
-
“ AI 安卓时刻”真的来了!不只是开源还将允许商用,Meta 正在考虑大模型下一步,扎克伯格要“逆袭”_环球热资讯
为了进一步开启AI安卓时刻,报道称Meta正在研究如何使其开源大语言模型
-
中国学者制备磁控人造纤毛,具备生物相容性和异步可编程性
小纤毛普遍存在于自然界里,比如在水生生物和人体中,是一种微小的毛发
精彩推荐
阅读排行
精彩推送
- 超过 60,000 个 Android 应...
- 【焦点热闻】陶哲轩自曝用了「满...
- “少年”视频号成长记:还要走过...
- 80 后基金经理猝然离世!几天前...
- 世界快资讯丨A 股首单!房地产...
- 受梅西中国行带动,阿迪达斯同款...
- 被乳腺癌“敲门”的年轻女性
- 焦点速讯:共庆余年年金险优点有...
- 悠享一生C款年金保险值得购买吗...
- 金融圈大案!四川首家寿险机构原...
- 天天信息:信美相互互信金生终身...
- 中金普洛斯REIT完成首次扩募,募...
- 全球新消息丨大家鑫佑所享养老年...
- 君龙人寿龙抬头B款养老年金险保...
- vivo X90s 跑分出炉:165 万...
- iOS 17 升级密码功能,苹果给...
- 腾讯向左,阿里向右,蘑菇车联蒙...
- 王者荣耀国际服体验服下载方法有...
- 微信小游戏五年成绩单:累计开放...
- 今日播报!蔚来降价智己跟进,一...
- 对标 Model Y!蔚来 ET5 旅...
- 三星抽奖最稀有的Galaxy Z Fli...
- 易斯顿美术学院建筑风格_易斯顿...
- 焦点热议:恒安智盈未来教育金年...
- 复星保德信星海赢家年金险保障如...
- 信泰如意永享年金险如何?享有哪...
- 光明一生慧选版产品解读?收益高...
- 鑫佑所享养老年金险怎么样?养老...
- 马斯克与阿尔诺共进午餐,谁买单...
- 天天快讯:广东汕头:抢占数字经...