7

Sora新视频只发TikTok:OpenAI 4天涨粉10万

 6 months ago
source link: https://awtmt.com/articles/3708715
Go to the source link to view the article. You can view the picture content, updated content and better typesetting reading experience. If the link is broken, please click the button below to view the snapshot at that time.
neoserver,ios ssh client

Sora新视频只发TikTok:OpenAI 4天涨粉10万

量子位 发表于 2024年02月21日 08:18
摘要:Sora杀入Tiktok,生成视频逼真,4天涨粉10万,搞崩短视频创作者心态。“字节版Sora”也在积极备战中。

Sora新视频,变成“抖音独占”了。

悄无声息,OpenAI正式杀入TikTok,加上洗脑配乐直接让人刷到停不下来,疯狂引流吸粉中:

短短4天,涨粉10万,50万赞——这还是不打枪不宣传的情况下。

这以后,人类创作者还怎么玩?

c304314d-0337-4800-b216-5037f150c3c5.png
Sora新视频,只发TikTok

在OpenAI刚开的TikTok认证帐号上,悄然更新了不少全新生成视频。

每一个都很有特点,同样引发各路热议。

来感受一下:

07aeb3e7-f4ca-4207-befb-c987b3dc7011

a16z合伙人惊呼,如果这是在信息流里刷出来的,绝对分不出真假。

我看过很多AI视频了,但这一条感觉到了转折点。

e7262bcb-8475-428b-a042-94e9396bbb68.png

来到真实的短视频消费场景中,就更显Sora与竞品代差明显:太逼真,以至于要特别声明不是真的。

OpenAI可太担心AI视频被当真引起不好影响了,不遗余力的以各种方式提醒“这是假的!这是假的!”。

0b63e89f-c79e-474a-aff5-100c4aa34574.png

网友开始发出这样的预警:

从现在开始,你在网上看到的一切都是值得怀疑的,不要相信你的眼睛。

ab6017fd-6aa8-47c2-a00c-ff34c07f56b2.png

有句老话叫“互联网时代,没有人知道你是一条狗”。

现在正式升级成“Sora时代,没有人知道你是一条不存在的狗”。

下面再来欣赏几个“抖音独占”版Sora视频:

超微距追踪蚁群,效果堪比纪录片。

07aeb3e7-f4ca-4207-befb-c987b3dc7011

以前DALL·E 3画的静态图也可以拿出来重复利用,Sora加工一下再配上电音,就成了爆款舞蹈视频。

还特意用一条长达1分24秒的视频,展示了类似抖音特效的AI视频编辑能力。

07aeb3e7-f4ca-4207-befb-c987b3dc7011

直接搞得不少短视频创作者心态爆炸,要退坑了。

a3699ae5-a688-49ba-adae-baac5ef28a5e.png

甚至连平台本身都被降维打击。

c1656504-888d-4fbb-a4a9-b8a639373bbc.png

全球估值第一的独角兽字节跳动,与刚刚跃升第三位的OpenAI之间,似乎正酝酿着一场对决。

UGC王者和AIGC新贵之间,终有一战。

“字节版Sora”也在备战

实际上,在Sora一夜爆火之前,字节内部并不缺乏AI视频技术。

甚至其中一款Boximator还被传成是“中国版Sora”。

e305f12f-e178-49a8-8322-4e22c583a20a.png

在Sora发布之前Boximator的论文就已经公布,由字节AI实验室总监李航领衔。

dfc00e97-c119-4fd0-9451-9f1ecdaf1c5f.png

其实Boximator的功能并非根据纯文字生成视频,而是按照文字提示将静态图片动态化。

它以字节去年11月推出的PixelDance为基础模型,加入了新的动作设定方式——

从图像中框选物体,然后设置运动终点或直接绘制轨迹,就能对动态效果进行精细控制。

形式上,Boximator作为一个插件,与现有的视频扩散模型结合使用,通过冻结基础模型的权重,仅训练控制模块来实现这一功能。

比如,通过框框画画,让小哈基米按照一定的轨迹追着球跑。

f7744dd8-1592-4b5c-bda8-d7d34b146b10.png

效果上,虽然也有bug(飘走的雨伞没有伞柄),但与Pika 1.0(中)和Gen-2(右)相比,Boximator的动画明显更加完整,也更接近文字提示。

f68d8d57-5a14-42f3-a01c-d1e374dd79da.png

从材质和物理效果上看,也是Boximator更胜一筹。

10326bf9-7b78-4105-88a3-49bfd1f90b38.png

技术层面,从架构上看,Boximator在视频扩散模型的每个空间注意力块中增加了一个新的自注意力层,用于处理由对象ID、硬/软标志和边界框坐标编码的控制token。

为了简化学习“框-对象”关联的挑战,Boximator在训练过程中还采用了一种称为自跟踪(self-tracking)的技术。

34792d43-471a-4da2-aa0a-acff95baf79c.png

那么Boximator到底算不算“字节版Sora”?

字节对此传闻,以辟谣的姿态来回应:

Boximator是视频生成领域控制对象运动的技术方法研究项目,目前还无法作为完善的产品落地,距离国外领先的视频生成模型在画面质量、保真率、视频时长等方面还有很大差距。

Boximator建立在之前PixelDance(基础研究)、MagicAnimate(专注于人体动作)等更多字节团队研究基础之上的最新成果。

1edfba3a-f6da-4bb1-be4b-3937eaebc7ee.png

总的来说,这些技术并非针对Sora特意开发,但在AIGC大战如火如荼的背景之下,仍不失为一种“战备”

再加上年前原抖音CEO张楠卸任,专注于剪映,奔赴AIGC风口。

可以说虽然Sora的发布很突然,但字节并不是毫无准备,或者说早就在业务推进中感知到了技术趋势。

而相比OpenAI与字节这样早晚要有的对决,视频行业上下游其他选手,更像是遭遇了一场飞来横祸。

视频编辑、素材站遭殃

Sora的第一刀,其实砍向了Adobe。

5天过去了,股价跌跌不休,市值蒸发过百亿美元。

7ed4bcbf-ac7f-4aae-8cb7-4323e0413be0.png

危机时刻,Adobe刚刚紧急宣布,组建了一个50人的AI研究团队。

4392dd4c-fb7e-41d6-9c03-38a0a006e5a8.png

但是这投入的力度,没让大家看出诚意。

29945员工中的50人,只占0.16%。

50758d0c-b030-4a43-87ba-d0295e8b8b6b.png

Adobe代表的是沿用近30年的视频生产、编辑工具,服务于内容创作者。

不转型就会变成下一个柯达、诺基亚,但转型也被认为面临很大挑战。

比如有人指出,Adobe坐拥大量数据,但要用过去创作者的成果去训练AI,就会与这些用户关系紧张。

也正是因此,Adobe的AI生图工具Firefly并没有在自家创意作品社区Behance的数据上训练,有些束手束脚。

01c5ac54-08ee-41cc-9f6a-547a8d696e69.png

又比如从过去Adobe在AI生图的表现来看,效果比Midjourney尚且很大差距,如今在AI视频上又该如何面对OpenAI的技术代差。

12678e89-b6dd-46bd-9204-37cc58ca1ea5.png

Adobe之外,受冲击第二大的就是素材供应商了,代表公司Shutterstock的日子也不好过。

连马斯克都认同“这个行业可能消亡”的观点。

9380a060-b061-4126-bd76-6f6801572e35.png

不过Shutterstock也给自己找好了退路,早早与OpenAI签订了合作协议,从素材供应商开始转型训练数据供应商。

这几天不断刷屏的Sora视频中,就有不少Shutterstock图片的影子。

7b1a7b9d-b39e-415e-b7b5-97012cff627b.png
4b441921-afd6-4aa8-8bdd-2ed8c41cdc54.png

还有人开玩笑说,Sora名字四个字母不会就是代表“Shutterstock原创,AI搅拌”吧。

ae933400-64de-465f-8af8-53bbaab12a43.png

本文作者:梦晨、克雷西,来源:量子位,原文标题:《Sora新视频只发TikTok:OpenAI 4天涨粉10万》

风险提示及免责条款
市场有风险,投资需谨慎。本文不构成个人投资建议,也未考虑到个别用户特殊的投资目标、财务状况或需要。用户应考虑本文中的任何意见、观点或结论是否符合其特定状况。据此投资,责任自负。

About Joyk


Aggregate valuable and interesting links.
Joyk means Joy of geeK