3

Sora火了,抖音们慌了?

 6 months ago
source link: https://www.chinaventure.com.cn/news/78-20240222-379795.html
Go to the source link to view the article. You can view the picture content, updated content and better typesetting reading experience. If the link is broken, please click the button below to view the snapshot at that time.
neoserver,ios ssh client

Sora火了,抖音们慌了?

考验创作者和抖音快手们的时刻到了。

Sora有多火?

马斯克、杨立昆、贾扬清、Jim Fan、谢赛宁等各路大佬都在讨论,周鸿祎更是喊出,Sora的诞生意味着AGI(通用人工智能)的实现或从十年缩短至一两年。

不少“普通人”也提前嗅到商机,围绕Sora搞钱的生意先火了。有媒体报道,一张网传截图显示,某机构已售出2万多份Sora培训课程,轻松到手200万。

如今,距离2月16日OpenAI发布文生视频大模型Sora已经过去快一周,但讨论依旧热烈,这实在是因为它过于优秀。

功能上,它能生成长达60秒的视频内容,远超其他文生视频工具几秒至十几秒的限额;它还能进行自我编辑和扩展,将两个不相关的内容过渡在一起,能转换主角周围的风格和环境等;

前景上,Sora不仅是视频生成工具,它更被视为世界模拟器;

创始团队上,也堪称传奇,核心成员包括12人,成立尚未超过1年,由两名刚刚毕业的博士生带队,其中还有00后。

在兴奋之余,Sora的强大也让一些内容创作者有了危机意识,有网友评价,“长短视频、游戏行业的朋友们一整年都不会快乐了。”

多位业内人士指出,以目前Sora生成视频的长度来看,它的到来最先会冲击到短视频领域。一旦大范围推广,Sora将大大降低短视频创作门槛,丰富短视频平台的内容供给,但随之而来的问题是,AI生成内容的增多可能会影响平台的内容生态,同时Sora还会和剪映、快影等工具抢夺用户,让此前的大笔投入付诸东流。

Sora朝短视频领域扔下了一枚重磅炸弹,考验创作者和抖音快手们的时刻到了。

Sora降低了门槛,也增加了竞争

虽然市面上已经有不少文成视频工具,比如Pika、Runway,用户输入文字就能得到一段几秒到十几秒的视频内容,但目前它们并未被广泛使用,主要原因还是效果一般。

某MCN机构负责人大成告诉「定焦」,他使用过Runway,“我们还从外部购买了优质素材,但最终生成的内容不够精良,根本用不了。”

看到Sora后,他十分激动,“时长能达到60秒,内容还合乎逻辑,感觉和之前的工具不在一个层次上。”

“Sora与此前的同类产品相比,效果好了不止10倍。”人工智能在读博士、做过相关大模型研究的牛小博表示。“目前Sora60秒的稳定生成效果,将对短视频行业带来革命性影响。”

研究AI的阿涅也表达了相同观点,“创作者的门槛被降低,哪怕视频的可信度还没那么高,甚至会出现一些错误,但不仔细很难看出来,将来技术也会很快迭代。”

综合多位从业者的说法,Sora直接解决了文生视频领域的两大难题,准确性和一致性。

AI研究者Cyrus的感受是,与之前的工具相比,“Sora就像三体人打原始人”。

所谓准确性,指生成的视频能准确识别用户输入的文字需求,一致性是指,在运动过程中,主角在多视角运动变化中内容连贯,不会发生形变,同时其变化还能遵循物理规律。最明显的表现是,主角和背景的互动符合逻辑。

一年前,牛小博和团队还在探讨生成式AI无法了解空间尺度,比如生成图尺寸不对,但他们觉得,Sora的出现已经解决了这个问题。

有人用视频还原物理空间模型,发现也能够对应上,牛小博觉得这证明了Sora的空间计算能力基本正确,而人对空间的感知很大一部分也依靠视觉。

从这个角度看,Sora生成的视频背后,有物理空间的逻辑支撑。

综合多位受访者的观点和多位科技界大佬的公开发言,尽管还有瑕疵,但Sora给视频乃至整个人工智能领域的重大突破在于,这是一个更智能、甚至具备一定思维能力的模型,其生成的视频能理解物理世界的客观规律。

这也让一批做短视频内容的从业者开始思考,Sora到底会不会抢自己的饭碗?

我们把现有的短视频简单分为两类,一类由真人出镜,往往真人就是一个账号甚至一家公司的“核心资产”,Sora对这类内容的冲击并不大;另一类由素材集合而成,考验拍摄、创意能力。Sora的出现,将大大提升这类视频的生产效率。

一些想要提高产量的创作者,非常期待Sora的到来。

大成表示,这类工具完全可以取代公司的低端劳动。“我们公司体量小,为了节省成本招了很多大学生,但他们刚毕业,半天憋不出一个文案,用了AI,几分钟就能写出上百条。”

去年他和团队就开始大规模使用AI工具了,“虽然这些工具还不成熟,但处理文案和粗剪,都很好用。作为一家视频生产商,一定要提高效率。”他表示。

对于一些有创意的团队来说,则认为短期内Sora不会对他们产生威胁。

头部MCN机构负责人达克告诉「定焦」,“Sora还没有开始公测,该技术离成熟还有很长一段时间,而且我们的视频主要靠人的创意、头脑风暴,包括拍摄也是讲究创新的,镜头如何设计、如何过渡,都有思考。虽然Sora很强大,但完不成我们目前的创意设计需求。”他还透露,目前公司没有使用任何AI工具。

不过,这些创作者们必须面对的问题是,Sora的出现降低了短视频创作门槛,会有越来越多的人加入,跟他们抢夺流量和变现机会。

一名新媒体从业者表示,他们有内容创作能力,但苦于没有合适的视频拍摄、剪辑团队,新的工具出现,就是他们的机会。

综合多位业内人士的观点,在类型上,目前Sora对真人出镜类短视频影响较小,对动漫类、解说类内容影响比较大,甚至会淘汰很多没有创意、只蹭热点的批量做号公司。在岗位上,部分做机械性重复工作的人员可能会面临淘汰,但创意类人员会被提至更高位置。

总之,未来做短视频,参与者更多,竞争也更激烈。

抖音快手们会慌吗?

Sora的出现,将给短视频平台带来更加丰富的供给,但同时也让抖音快手们面临新的考验。

从业者表示,一方面,AI生成视频过多,会对短视频平台原有的内容生态造成冲击,另一方面,Sora的火爆,会抢走一部分抖音、快手旗下剪映、快影等工具的用户。

达克告诉「定焦」,AI生成的内容在上传短视频平台时,需要特殊标注。

去年5月,抖音就发布了《抖音关于人工智能生成内容的平台规范暨行业倡议》,这一倡议提出,要对该类内容进行显著标识,虚拟人使用者需要实名认证,同时对利用AI工具创作、发布侵犯肖像权、弄虚作假等内容进行严格处罚。

快手、小红书等平台也有相关的限制。今年2月,小红书官方发布AI创作内容的规范,要求创作者主动声明AI创作内容、不能用AI创作内容虚构使用体验进行商业变现等。

多位从业者表示,他们能够明显感觉到,平台在控制该类内容,甚至会限流。

“AI创作的内容同质化严重,且创意性不高,用户一旦刷到太多相似内容,就会变得不耐烦,甚至转战其他平台。”一位互联网行业观察者表示。

他还觉得,“如果平台对这类内容不做限制,越来越多创作者也会图省事使用AI,这会严重影响到平台各类内容占比,最直观的是,一些独有的、稀缺的视频会减少。”

以及还有可能会诞生大量虚假视频。Sora能快速生产大量逼真的短视频,也让造假变得轻而易举,一些用户对该类内容难辨真伪,一旦被骗,平台公信力也会受到严重影响。去年,利用文生图、AI换脸等AI生成内容进行诈骗的案件就被曝出不少。

在Cyrus看来,如果平台扶持AI创作类内容,很像“为他人做嫁衣” ,结果就是影响用户留存。“设想一下,如果小红书上全是字节豆包大模型生产的内容,用户为什么不直接刷抖音呢?反之亦然。”

Cyrus预测,抖音、快手、小红书、B站上,不会大量推荐AI创作的内容。除非是平台自己做的文生视频大模型,在自家进行大范围推广后,进行单独变现。“比如当其优化到一定程度,可以直接走用户付费模式,但各家的产品目前都不具备这一能力。”

不止一位业内人士推断,Sora和其他AI视频创作工具之间的差距会越来越大,此前,“Sora会不会杀死剪映”的话题就曾引发热议。Sora如果被大规模应用,大多数AI工具可能会被市场抛弃,其他公司前期的大笔投入将付诸东流。

为什么差距会拉大?

周鸿祎曾公开指出,国内的大模型发展水平表面上看接近GPT-3.5,实际上离4.0还有一年半的差距。牛小博从技术端给出解释,Sora不是一个点状技术,而是一个复杂的系统工程。即便外界知道其核心技术是transformer注意力算法+diffusion的扩散算法等,但其背后是OpenAI给予的资金支持和积累的超强数据。

OpenAI通过积累的GPT通用语言模型加上DALL-E3图像生成模型,发展出视频能够理解图片内容,到Sora的时候,又提升了一致性和物理空间理解能力,这每一步的积累,缺一不可。

更大的预测更是让抖音们前路难料。有影视从业者认为,Sora被大范围使用后,有可能会出现比抖音更大的新平台。

在一部分人看来,Sora降低了用户门槛,必然导致内容创作者数量级猛增,而抖音这样的短视频平台,其体量、内容创作和推送的逻辑规则,能否承载该类内容很难说,很可能会诞生一个与Sora更相符合的平台。

牛小博通过观察互联网行业的发展,也赞同这一观点。“互联网在早期是专业用户使用,后来PC的普及扩大了用户,接着智能手机出现,人人可以联网,以至于服务各类人群需求的平台都出来了。也许随着Sora使用人群的增加,会有新的生态出现。”

Sora影响巨大,但不必神化

目前,Sora还没有开放公测,只有一些视觉艺术家、电影制作人、OpenAI员工等人士获得了访问权限。一部分原因是,Sora并非完美无缺。它对短视频的冲击,还没有完全展现。

AI训练师小刚指出,Sora存在大模型普遍存在的“幻觉问题”,它在理解物理规律、人与物体交互等方面还存在缺陷。

比如OpenAI官网公布了一些缺陷视频,包括蜡烛吹不灭、投篮时篮球在下落过程中爆炸,以及挖出来的椅子直接漂起来等不符合物理规律的内容,这是因为Sora的理解还不够成熟,误以为从沙子里挖出来的东西,一般都比较轻。

而具体到短视频行业,小刚认为Sora最重要的一个不足是,还做不到人物固定。

举个例子,比如创作者用Sora生成了一条60秒的视频,画面中主角为A,但其在生成下一个视频后,主角很可能就换成了B。

相比Pika、Runway,大家能看到Sora的空间能力很强,但内容再短,做不到人物固定就没有意义,用户持续在短视频平台观看内容,无论是真人还是动画,都需要一个中心人物保证故事的延续性。

以及算力问题,也让很多人担忧Sora的普及速度。毕竟技术突破再大,如果成本过高,还是难以被大众接受。多名业内人士认为,这是目前Sora面临的最大困难。

“目前OpenAI没有公布Sora具体的算力、能源消耗需求以及参数量。初步判断,它需要的数据量、算力以及大量的能源消耗将是巨大成本,而这与其下个阶段的广泛推广必然存在矛盾。”牛小博认为。

每一次新技术的出现,都会引发一场新旧交替的大讨论。

虚拟拍摄技术刚诞生时,为影视行业节省了拍摄成本,但传统的拍摄方式至今仍然存在。OpenAI推出ChatGPT一年多以来,文字从业者也没有被替代,反而让更多人意识到优质内容创作者的价值。

同理,Sora对市场上同类AI工具带来了冲击,但它再强,淘汰的更多是没有创意、只想走量的短视频从业者,或是不会使用这类工具的人。

至于Sora是否会颠覆整个短视频行业,会不会诞生下一个超级平台,目前大家还在观望,需要看Sora能否迅速解决现有问题,以及国内有没有新的挑战者诞生。

应受访者要求,文中达克为化名。

网站编辑: 郭靖

About Joyk


Aggregate valuable and interesting links.
Joyk means Joy of geeK