6

AI渗透短视频赛道:只需一个提示词,文本影像画外音一键搞定

 1 year ago
source link: https://www.qbitai.com/2023/01/40947.html
Go to the source link to view the article. You can view the picture content, updated content and better typesetting reading experience. If the link is broken, please click the button below to view the snapshot at that time.
neoserver,ios ssh client

AI渗透短视频赛道:只需一个提示词,文本影像画外音一键搞定

head.jpg衡宇 2023-01-02 11:52:12 来源:量子位

AIGC:短视频也太好入侵了吧

衡宇 发自 凹非寺

量子位 | 公众号 QbitAI

小美、小帅、丧彪和佛波勒,这几位AI配音的主角,已经成为某音某手用户心里比“李华”还要亲的朋友们了。

然鹅,配音显然已经满足不了AIGC“大放异彩”之心,它对短视频赛道的入侵再加一:

生成式AI,开始拍视频

还是带画外音的那种。

e0f64d1913944f25920b50bca4fa8f50~tplv-tt-shrink:640:0.image

这个技术来自一个名为QuickVid的新网站,它把好几个生成式AI组合成了一个工具。

创建的短视频适配YouTube、 Instagram、 TikTok和Snapchat等。、

ffc3c35fce0148679be1fc1f157d3767~tplv-tt-shrink:640:0.image

哇哦,Unbelievable~

QuickVid,明星AI产品杂烩

QuickVid,是个刚出生7天(去年12月27日推出)的小baby网站。

年纪虽小,但不妨碍它一展身手。让我们看看这个网站要怎么玩儿:

首先,用户需要输入一个提示词或一小句提示语,用来描述想要创建的视频的主题。

比如本文开头的视频,就由短短的两个提示单词“Machine Learning”生成。

cacb621aa1a945be8bcf92957bc94c75~tplv-tt-shrink:640:0.image

这个功能,依托的是GPT-3的文本生成能力。

接着,根据这些提示,QuickVid会从免版税的媒体储备库Pexels中选择一个背景视频,并使用DALL-E2生成覆盖图像。

然后,QuickVid会通过Google Cloud的文本到语音API输出画外音。

这一步可以选择克隆用户自己的声音。

因为创始人了解到,好多创作者对自己制作的AI配音视频提不起多高的兴趣,毕竟视频配音没有用自己的声音。

最后一步非常简单,就是把上述元素合并

当当当当!一个AI生成的短视频就诞生了。

dbf7ea078c154e7c9c42d0d6228c5381~tplv-tt-shrink:640:0.image

GPT-3、DALLE-2……总而言之,QuickVid像是一道现有AI产品的明星杂烩

并且,利用重复的、模版化的B-roll短视频格式,还避免了必须自己生成视频这一关。

值得关注的一点是,因为允许Copilot在GitHub的公共仓库上“偷代码”,微软、GitHub和OpenAI正因被指控违反版权法而接受集体诉讼。

这个案子对DALL-E2这类的AI产品有着深远的影响,因为人们发现AI可以从训练集中“抄袭”

不过QuickVid并不太担心,他的创始人Daniel Habib大胆放话:

如果明天出现一起让OpenAI消失的诉讼,我们也不怕。

因为我们有好几种替代方案可以为QuickVid提供AI生产力呢~

972fa1be44724edb83148b0fe7c37c0d~tplv-tt-shrink:640:0.image

这里提到的替代方案,是类似于DALL-E2的开源系统Stable Disusion,QuickVid已经在用它测试生成头像图片了。

Habib曾是Meta的员工,负责Facebook Live和视频基础设施的开发,他用几周的时间搞出了QuickVid。

根据一些媒体的实测,QuickVid生成的视频质量好坏参半

生成的背景视频内容往往十分随机,有的和提示词只能有拐十八道弯的一丢丢联系。

不过也不算稀奇,因为QuickVids目前背靠的仅限于Pexels,而且DALL-E2生成的图像本身也有文本混乱和比例失调的局限性。

官方针对这一点给出的回应是,“我们每天都在修补bug哟”!

现在的QuickVid功能还比较简单,但已经足以凑出一个带有信息量的YouTube或TikTok短视频了。

e0feafebf1b846f2acb1ff2d8b4f781c~tplv-tt-shrink:640:0.image

△推特用户用QuickVid生成短视频

这个月,QuickVid会维护更新一些个性化功能。

摆在QuickVid们面前的几道坎

Habib在回复TechCrunch电子邮件时,将QuickVid称为为创作者提供快捷制作高质量内容的工具。

“(目的是)帮助创作者增加内容输出,减少过度劳累的风险。”

创作者生产短视频时的工作量是减少了,但用户和审查者的工作量蹭得往上涨。

大量内容的一键生成,让目前质量还不高的视频内容,连字带影像,有瞬间挤满整个视频网站的能力。

c1ca46dfad4c4aa698b90d222a9d2399~tplv-tt-shrink:640:0.image

没错,像QuickVid这样的工具,可能会让已经拥挤的短视频网站和APP充斥着没啥营养的信息,以及重复内容

回答相关问题时,Habib把相关责任归在平台身上。

他认为,是视频平台的算法而不是QuickVid来决定这些视频会不会被推荐、是否会被放在首屏。

“如果人们不想看你的视频,那么你在YouTube这类平台发了视频也传播不开。”他补充道,“不管你是不是使用QuickVid生成的视频,但凡内容质量太低,人们就会抛弃你的频道。”

当然,站在QuickVid面前的难题显然不止这一个,它面临诸多问题考验。

比如有创作者的潜在抵制

不管是因为成本问题(QuickVid的包月费用是10美元/月),还是因为会面临与AIGC抢饭碗的窘境,对自己内容质量更为看重的创作者们,有的会选择不使用这类工具。

ac267254f65042719f81adaa31c4477b~tplv-tt-shrink:640:0.image

再比如版权问题

根据Habib的说法,QuickVid用户们可以将自己生成的视频商用,但是AIGC的版权问题本就处于暧昧不明的阶段。

就前几天的事儿,美国专利和商标局(USPTO)撤销了对AI漫画的版权保护,称要获得版权保护需要人工授权

不过,Habib觉得USPTO的这一行为跟QuickVid没啥直接关系,因为那只涉及AI产品的“可专利性”,而不涉及创造者使用和商业化其内容的权利。

创作者关心的是放出高质量的内容,帮助频道涨粉。

8ec195c573714c0e86f82bb795823d10~tplv-tt-shrink:640:0.image

除了法律问题,摆在QuickVid面前的还有内容审查这个大工程。

虽然OpenAI已经利用过滤器来防止偏激内容和歪曲事实的内容生成,但bug依旧存在。

GPT-3时不时仍会提供错误信息,尤其是近期发生事件,因为近段时间的信息还没进入它的知识库。

这对ChatGPT来说也一样,而且后者已经被证明会被“套出”性别歧视和种族主义相关内容。

当Techcrunch进行测试时,QuickVId在“批判性种族理论教育学生”这个提示下,生成了一个视频,其内容暗含观点,认为批判性种族理论可以用来给学生洗脑

对此,QuickVid主要依赖的还是OpenAI的过滤器来避免错事儿发生。

同时还动员每一个使用QuickVid的用户,宣称大伙儿有义务手动审查每一个由QuickVid创建的视频,以确保“一切都在法律的范围之内。”

One More Thing

不过有个值得令QuickVid们小兴奋的消息,那就是谷歌并没有区别对待人写文本和AI文本。

不过谷歌还是对那些“旨在操纵搜索排名而不是帮助用户”的内容采取裁制,因为这些内容“没有足够的价值”。

这就让QuickVid们需要小心了,因为纯自动化流程生成的内容,很容易就被归到“没啥价值”那一类。

36357749e3794fa5a5eca0e033fda1ef~tplv-tt-shrink:640:0.image

不过说到底,如Habib所说的那样,生成式AI革命是不可阻挡的。

如果AI生成短视频开始大规模流行,各类平台不会也不敢拿它怎么样——至少不会全面禁止它。

你会因为有了这样便利的工具,成为短视频平台的创作者吗?

也许今晚打开短视频App刷到的第一个推荐就是你的(手动狗头)。

直达链接:https://www.quickvid.ai/
(由于涌入人数过多,现在注册需要排队了,我恨)

版权所有,未经授权不得以任何形式转载及使用,违者必究。

About Joyk


Aggregate valuable and interesting links.
Joyk means Joy of geeK