AI渗透短视频赛道：只需一个提示词，文本影像画外音一键搞定

衡宇 2023-01-02 11:52:12 来源：量子位

AIGC：短视频也太好入侵了吧

衡宇发自凹非寺

量子位 | 公众号 QbitAI

小美、小帅、丧彪和佛波勒，这几位AI配音的主角，已经成为某音某手用户心里比“李华”还要亲的朋友们了。

然鹅，配音显然已经满足不了AIGC“大放异彩”之心，它对短视频赛道的入侵再加一：

生成式AI，开始拍视频！

还是带画外音的那种。

e0f64d1913944f25920b50bca4fa8f50~tplv-tt-shrink:640:0.image

这个技术来自一个名为QuickVid的新网站，它把好几个生成式AI组合成了一个工具。

创建的短视频适配YouTube、 Instagram、 TikTok和Snapchat等。、

ffc3c35fce0148679be1fc1f157d3767~tplv-tt-shrink:640:0.image

哇哦，Unbelievable～

QuickVid，明星AI产品杂烩

QuickVid，是个刚出生7天（去年12月27日推出）的小baby网站。

年纪虽小，但不妨碍它一展身手。让我们看看这个网站要怎么玩儿：

首先，用户需要输入一个提示词或一小句提示语，用来描述想要创建的视频的主题。

比如本文开头的视频，就由短短的两个提示单词“Machine Learning”生成。

cacb621aa1a945be8bcf92957bc94c75~tplv-tt-shrink:640:0.image

这个功能，依托的是GPT-3的文本生成能力。

接着，根据这些提示，QuickVid会从免版税的媒体储备库Pexels中选择一个背景视频，并使用DALL-E2生成覆盖图像。

然后，QuickVid会通过Google Cloud的文本到语音API输出画外音。

这一步可以选择克隆用户自己的声音。

因为创始人了解到，好多创作者对自己制作的AI配音视频提不起多高的兴趣，毕竟视频配音没有用自己的声音。

最后一步非常简单，就是把上述元素合并。

当当当当！一个AI生成的短视频就诞生了。

dbf7ea078c154e7c9c42d0d6228c5381~tplv-tt-shrink:640:0.image

GPT-3、DALLE-2……总而言之，QuickVid像是一道现有AI产品的明星杂烩。

并且，利用重复的、模版化的B-roll短视频格式，还避免了必须自己生成视频这一关。

值得关注的一点是，因为允许Copilot在GitHub的公共仓库上“偷代码”，微软、GitHub和OpenAI正因被指控违反版权法而接受集体诉讼。

这个案子对DALL-E2这类的AI产品有着深远的影响，因为人们发现AI可以从训练集中“抄袭”。

不过QuickVid并不太担心，他的创始人Daniel Habib大胆放话：

如果明天出现一起让OpenAI消失的诉讼，我们也不怕。

因为我们有好几种替代方案可以为QuickVid提供AI生产力呢～

972fa1be44724edb83148b0fe7c37c0d~tplv-tt-shrink:640:0.image

这里提到的替代方案，是类似于DALL-E2的开源系统Stable Disusion，QuickVid已经在用它测试生成头像图片了。

Habib曾是Meta的员工，负责Facebook Live和视频基础设施的开发，他用几周的时间搞出了QuickVid。

根据一些媒体的实测，QuickVid生成的视频质量好坏参半。

生成的背景视频内容往往十分随机，有的和提示词只能有拐十八道弯的一丢丢联系。

不过也不算稀奇，因为QuickVids目前背靠的仅限于Pexels，而且DALL-E2生成的图像本身也有文本混乱和比例失调的局限性。

官方针对这一点给出的回应是，“我们每天都在修补bug哟”！

现在的QuickVid功能还比较简单，但已经足以凑出一个带有信息量的YouTube或TikTok短视频了。

e0feafebf1b846f2acb1ff2d8b4f781c~tplv-tt-shrink:640:0.image

△推特用户用QuickVid生成短视频

这个月，QuickVid会维护更新一些个性化功能。

摆在QuickVid们面前的几道坎

Habib在回复TechCrunch电子邮件时，将QuickVid称为为创作者提供快捷制作高质量内容的工具。

“（目的是）帮助创作者增加内容输出，减少过度劳累的风险。”

创作者生产短视频时的工作量是减少了，但用户和审查者的工作量蹭得往上涨。

大量内容的一键生成，让目前质量还不高的视频内容，连字带影像，有瞬间挤满整个视频网站的能力。

c1ca46dfad4c4aa698b90d222a9d2399~tplv-tt-shrink:640:0.image

没错，像QuickVid这样的工具，可能会让已经拥挤的短视频网站和APP充斥着没啥营养的信息，以及重复内容。

回答相关问题时，Habib把相关责任归在平台身上。

他认为，是视频平台的算法而不是QuickVid来决定这些视频会不会被推荐、是否会被放在首屏。

“如果人们不想看你的视频，那么你在YouTube这类平台发了视频也传播不开。”他补充道，“不管你是不是使用QuickVid生成的视频，但凡内容质量太低，人们就会抛弃你的频道。”

当然，站在QuickVid面前的难题显然不止这一个，它面临诸多问题考验。

比如有创作者的潜在抵制。

不管是因为成本问题（QuickVid的包月费用是10美元/月），还是因为会面临与AIGC抢饭碗的窘境，对自己内容质量更为看重的创作者们，有的会选择不使用这类工具。

ac267254f65042719f81adaa31c4477b~tplv-tt-shrink:640:0.image

再比如版权问题。

根据Habib的说法，QuickVid用户们可以将自己生成的视频商用，但是AIGC的版权问题本就处于暧昧不明的阶段。

就前几天的事儿，美国专利和商标局（USPTO）撤销了对AI漫画的版权保护，称要获得版权保护需要人工授权。

不过，Habib觉得USPTO的这一行为跟QuickVid没啥直接关系，因为那只涉及AI产品的“可专利性”，而不涉及创造者使用和商业化其内容的权利。

创作者关心的是放出高质量的内容，帮助频道涨粉。

8ec195c573714c0e86f82bb795823d10~tplv-tt-shrink:640:0.image

除了法律问题，摆在QuickVid面前的还有内容审查这个大工程。

虽然OpenAI已经利用过滤器来防止偏激内容和歪曲事实的内容生成，但bug依旧存在。

GPT-3时不时仍会提供错误信息，尤其是近期发生事件，因为近段时间的信息还没进入它的知识库。

这对ChatGPT来说也一样，而且后者已经被证明会被“套出”性别歧视和种族主义相关内容。

当Techcrunch进行测试时，QuickVId在“批判性种族理论教育学生”这个提示下，生成了一个视频，其内容暗含观点，认为批判性种族理论可以用来给学生洗脑。

对此，QuickVid主要依赖的还是OpenAI的过滤器来避免错事儿发生。

同时还动员每一个使用QuickVid的用户，宣称大伙儿有义务手动审查每一个由QuickVid创建的视频，以确保“一切都在法律的范围之内。”

One More Thing

不过有个值得令QuickVid们小兴奋的消息，那就是谷歌并没有区别对待人写文本和AI文本。

不过谷歌还是对那些“旨在操纵搜索排名而不是帮助用户”的内容采取裁制，因为这些内容“没有足够的价值”。

这就让QuickVid们需要小心了，因为纯自动化流程生成的内容，很容易就被归到“没啥价值”那一类。

36357749e3794fa5a5eca0e033fda1ef~tplv-tt-shrink:640:0.image

不过说到底，如Habib所说的那样，生成式AI革命是不可阻挡的。

如果AI生成短视频开始大规模流行，各类平台不会也不敢拿它怎么样——至少不会全面禁止它。

你会因为有了这样便利的工具，成为短视频平台的创作者吗？

也许今晚打开短视频App刷到的第一个推荐就是你的（手动狗头）。

直达链接：https://www.quickvid.ai/
（由于涌入人数过多，现在注册需要排队了，我恨）

AI渗透短视频赛道：只需一个提示词，文本影像画外音一键搞定

AI渗透短视频赛道：只需一个提示词，文本影像画外音一键搞定

QuickVid，明星AI产品杂烩

摆在QuickVid们面前的几道坎

One More Thing

Recommend

【最全】2023年中国汽车后市场行业上市公司全方位对比（附业务布局汇总、业绩对比、业...

长视频的2022年：“钱”路难寻

这才是Excel未来的样子，口喊求和什么的弱爆了

Top stories of 2022: Q4

My top 5 phones of 2022 - Ro

Top 10 new technologies on 2022 mobile phones - Which is more practical? - Gizch...

Davy lamp - Wikipedia

Motorola ThinkPhone leaked again with fresh images and specs

5600 XT怎么样？当前性价比最好的显卡之一

AITO问界系列12月交付再超1万辆，全年交付76180辆

About Joyk