3

OpenAI还在烧钱,但开发者已经利用GPT和Stable Diffusion挣钱了

 1 year ago
source link: https://www.qbitai.com/2023/03/42829.html
Go to the source link to view the article. You can view the picture content, updated content and better typesetting reading experience. If the link is broken, please click the button below to view the snapshot at that time.
neoserver,ios ssh client

OpenAI还在烧钱,但开发者已经利用GPT和Stable Diffusion挣钱了

head.jpg衡宇 2023-03-15 08:39:46 来源:量子位

短片已经可用AIGC填空式生成

衡宇 发自 凹非寺

量子位 | 公众号 QbitAI

Text-to-Video文生视频,继作文、绘画之后AI杀入的又一领域,有越来越多产品涌现。根据读者爆料,一款主打AI生成视频的产品,已经在小圈子内被频频提及,还是国产的。

量子位迫不及待浅扒了一段关于曹操的介绍,喂给它,得到这样一段视频:

32946ae7992f4ef29368da2f8dd369e3~tplv-tt-shrink:640:0.image?traceid=2023031508355312E94310CE4D156E5C72&x-expires=2147483647&x-signature=%2F%2B%2BZeRjbt3GkC%2FTwafINS87am3U%3D

在不经任何替换和干预的情况下,生成的视频画面符合人物、时代背景和部分文案提及的场景,效果还算不错。

最最重要的是,用它制作一段视频,几乎不存在“剪辑”这个步骤,比以往图文转视频的产品门槛更低,耗费的时间也更短。

但要评判这款产品到底是骡子是马,还得多次体验,再往深处挖一挖。

什么样的产品?

这产品名叫一帧秒创,本次体验的主角是它最基础常规的“文案一键生成视频”。

开头关于曹操的简介视频,是用该功能这样生成的——

点击该选项后,会跳出一个文本框供输入标题和正文,底端可以选择最终的画面呈现形式是横屏还是竖屏。

这一步骤实测下来,标题部分对后续内容生成影响不大,现阶段可以不用输入,后续AI会自动提取补充。相对而言,第二个需要输入文案内容的部分非常重要。

量子位做了如图文案输入:

19ee63cae6934d7e94557bfe0d42b048~tplv-tt-shrink:640:0.image?traceid=2023031508355312E94310CE4D156E5C72&x-expires=2147483647&x-signature=bC0Ja9%2BFHxopFftzZ6oKdQVjsdw%3D

点击右下角“下一步”,可以更改AI对文案进行的分类,也可以修改文案的分割。分割成n个小段的文案,承担分镜头脚本文案的功能,以便后续AI从素材库里匹配对应的视频片段。

在这方面,AI的分割效果没有出太大纰漏。

但从下图可以看到,此处AI把曹操title中的“书法家”单独作为一个分镜头文案,量子位对其进行了合并。

7bd1d992caa7481aaebf5d19e017aef0~tplv-tt-shrink:640:0.image?traceid=2023031508355312E94310CE4D156E5C72&x-expires=2147483647&x-signature=%2BUYo8YdxX%2B%2FOlvkrYjkoLj3thms%3D

接下来就会进入最后的调试界面,分出两大板块,即左半部分的调整界面和右半部分的预览界面

通过左侧的工具栏,在最顶端的场景部分,AI为文案匹配了12个视频片段。

12个视频片段中,原本AI为片段8生成的视频中出现了现代社会的外国人。也就是说,在画面内容和文案内容的匹配度上,AI能力还有所欠缺。

最终量子位通过小蓝框中的替换素材功能,在素材库中选择了更符合文案的视频画面。

cfbd2cab02c24b06b71ef2d89a1ba84f~tplv-tt-shrink:640:0.image?traceid=2023031508355312E94310CE4D156E5C72&x-expires=2147483647&x-signature=MVLCFVjBH2%2FfYPMHc020dHG8%2BUE%3D

12个镜头整体拉片式通看一遍,直观感受是视频质量算不上精致。虽然并非完全不相关,但还是与人类剪刀手的视频编辑水平有明显差距

敲定视频片段后,在音乐板块挑选国风类型的BGM,又选择了“磁性浑厚”的解说男声,Logo和字幕都是默认选项。

一切确定,点击生成视频选项,就能在预览板块看到这一套搭配下来的视频效果,最终生成文章开头的视频。

历史分类的AI视频效果不错,那是否在每个分类下都有同等水平的效果呢?

又陆续还尝试了科普类(量子位文章,扔进去)、美食类(宫保鸡丁菜谱)等多种类别的文案,甚至还把谷歌Phenaki效果惊艳的小企鹅冲浪视频的6句文案丢给了它。

66e28cb629d447bfac8bf4eea82b77b2~tplv-tt-shrink:640:0.image?traceid=2023031508355312E94310CE4D156E5C72&x-expires=2147483647&x-signature=xvF7qlk9U7xNi2PoYauwXhpEO%2FE%3D

结果显示,科普类和美食类,生成视频的表现都还算文案和画面贴合。

但,小企鹅冲浪文案的生成效果就有些拉胯

看遍视频画面的每一秒钟,从未出现过一只企鹅,连影子都没有……

Excuse me??? 

0a35f497fc3349e5bd741ea11cc3f635~tplv-tt-shrink:640:0.image?traceid=2023031508355312E94310CE4D156E5C72&x-expires=2147483647&x-signature=qTodg2HFwzmBCBASC2oT747mV4A%3D

虽然部分画面也和文案有所关联,比如出现人在沙滩上走的第一视角视频片段。但和曹操视频的效果相比,可以说大相径庭,实在有点出乎意料。

无独有偶,国外有个Quickvid同样主打AI生成视频的功能,同样在小圈子里走红。而目前开放Beta测试的Youtube Shorts功能,和上述国内产品功能类似。

为了测试,把相同的小企鹅冲浪文案喂给了Quickvid。结果是,Quickvid生成的视频里,仍然不见企鹅的踪影,一帧也没有!

(谷歌Phenaki听后狂喜)

5841fe07160243fa94b6b0ff9a9b3f44~tplv-tt-shrink:640:0.image?traceid=2023031508355312E94310CE4D156E5C72&x-expires=2147483647&x-signature=BdRJYMntEFqau5VOG1b7Dsfsm%2F8%3D

当然,Quickvid之所以走红,并不是因为生成的视频质量惊人。除了成为文本生成视频赛道的“早鸟”外,与背后的开发者密切相关。

开发者小哥名叫Daniel Habib,此前在Facebook的虚拟现实部门Oculus工作。

Quickvid走红是从今年2月开始的,当时它正式从内测转为Beta测试,仅2月23日一天,就有2万2千多人成为用户。本月ChatGPT开放API后,Daniel把它接入了Quickvid,成为了第一批ChatGPT生态内开发者。

5e797190a89543ec89149108fb2759f9~tplv-tt-shrink:640:0.image?traceid=2023031508355312E94310CE4D156E5C72&x-expires=2147483647&x-signature=fSav49a13lvZuG67CpeJOFJoOEA%3D

量子位的视频编辑对两款产品也进行了试玩,用户评价是这样的:暂不认为这东西能威胁自己的就业。

但对于AI生成视频展现出的趋势,多少有点心有凄凄焉

因为你不得不承认,用这玩意儿做视频,完全不需要懂得剪辑知识。而且做一条同等质量的视频,相比人工剪辑,用AI生成,时间和资源投入显著降低

不完美的视频创作AI工具

不仅仅是Quick接入了别人家的API,事实上,今天体验的一帧秒创也接入了GPT-2的API,还用上了开源Stable Diffusion模型。

这不是猜测,是我们直接找到背后开发者“对质”后得知的结果。

一帧秒创背后的公司叫做新壹科技

这个名字或许比较陌生,但这个“新的一”是“一下科技”的“一”。

一下科技,曾经多次站在视频风口上的公司,一直播、秒拍、小咖秀,都出自一下科技之手,这是移动互联网时代视频领域响当当的玩家。背后的团队,也是源自搜狐视频-酷6网-新浪视频一脉的视频内容老兵们。

caa750aabc854fb58f8a83b6336bcd95~tplv-tt-shrink:640:0.image?traceid=2023031508355312E94310CE4D156E5C72&x-expires=2147483647&x-signature=T1fGAQ2txjKhLT6wbVTCIMDB9Jo%3D

其创始人兼董事长韩坤,在创立一下科技之前,以联合创始人的身份把酷6网打造成中国第一家在美国纳斯达克上市的视频网站。

新壹科技是韩坤手下孵化出的最新公司,现有团队在2020年年中开始筹备,领队人雷涛,现任新壹科技CEO,也是一下科技的创始团队成员。

团队正式组建的2020年12月,距ChatGPT出生还有一年,连DALLE-2和Stable Diffusion代表的AI绘画也还没有名声大噪,但春江水暖鸭先知,一下内部这支团队感知到了AI对于视频内容创作的方向性改变。

因为视频内容的传统和基因,新公司诞生之初,新壹并没有把自己定位为一个人工智能公司。

他们希望从首先解决创作者需求切入,让AI介入视频生产全流程,尽可能降低视频内容创作门槛。

通过AI能力,让用户以低成本制作视频,还能用秒拍平台上的视频为AI匹配提供一个庞大的素材库,形成规模壁垒。

把秒拍作为现成的数据库,这对新壹算是一个地利,不仅因为秒拍有10亿级规模的视频素材和数据,更因为秒拍能为一帧秒创进行版权授予,让AI生成的视频有版权保障

后者简直解决了AIGC方面一直争论不休的大问题。

所以首款产品一帧秒创,有了明确的应用场景,也有了面向视频内容创作者、视频自媒体营销的方向。

这是一个集合多种AIGC能力的工具,但是,无论是文生图还是AI帮写,最终的目的都归于一处——把它们作为素材应用到视频生产流程,让视频生产更加高效。

4c52c6b93263434aa4f1b6103297edfd~tplv-tt-shrink:640:0.image?traceid=2023031508355312E94310CE4D156E5C72&x-expires=2147483647&x-signature=7bCiiG2Xg%2FmPwnsVAkjmRr3xtQw%3D

为了高效和低门槛,一帧秒创尽量做到去剪辑化,创作视频的过程从开放式变成了填空式

虽然距离产出极致和精彩的视频还有距离,但最直观的是,哪怕完全不懂剪辑知识的人,也能上手制作视频——甚至是批量制作。

eb606a0607ba48a0b2d5d9860e774f67~tplv-tt-shrink:640:0.image?traceid=2023031508355312E94310CE4D156E5C72&x-expires=2147483647&x-signature=1IEb7P5EVkm9prqQ0hIVNyPtZx8%3D

社交平台的剪辑小白用户评价

目前,一帧秒创方面也知道,自己生成的视频还不能和人工剪辑的视频媲美,但是足以应对一些应用场景,如科普类视频生成效果是最好的,批量生产内容可以应用到抖音本地生活推广。以及除了面向C端的高阶功能订阅模式,一帧秒创还有来自B端的商业合作,比如跟360搜索的合作,已经获得了不错的反馈。

对于一帧秒创当前的初创状态,新壹也透露正在通过一些具体的解决方案改进。

比如创作者集中的内容类别,投入更多的素材分析和标注成本;又比如推出私有化素材库,提高匹配率和视频片段替换率。

雷涛表明了一帧秒创的思路,称作为产品公司,新壹科技虽然没办法让技术和硬件等基础条件实现跨越式的发展,然而,能够在每一阶段适时提供符合当时阶段水平的应用,“这已经足够去忙了”。

他多次以智能手机时代开启后,移动互联网的产品开发机遇举例,也多次用新能源、智能车变革进程中的理想造车模式类比,话里话外,追求的不是一步到位,而是与技术基础设施和整个行业生态一起成长进步,而最关键的是,必须躬身入局,不能站着观望。

这其中自然有视频老兵对新周期的敏锐洞察,但也多少有些不甘心

如果你对2015年以来的互联网江湖还有记忆,应该多少能感知这种不甘心的合情合理。在如今字节独大或抖音快手的双雄格局之前,秒拍和一下科技,才是短视频领域最火爆的明星公司。然而商场如战场,如今的结局和市场份额,已经再清楚不过了。

或许“赢回来”的最好方法就是赢在未来、赢在下一个时代。

下一个时代就是AIGC。连比尔·盖茨都说,背后不亚于互联网的发明。

94706ac4bd91444390bcaa455fdb0d31~tplv-tt-shrink:640:0.image?traceid=2023031508355312E94310CE4D156E5C72&x-expires=2147483647&x-signature=J8%2BJBYInD2BoOOuBGM9Bvv7TZ0g%3D

面向这个全新的创新创业赛道,已经分出了两拨创业者,走出不同条路线。

一条是技术路线,训练大模型,把底层技术牢牢掌握在自身的手里,做底层,做平台。但门槛极高,创业公司在底层大模型方面取得突破的难度和成本都会很高。

另一条就是面向需求和场景,走产品、应用、工具平台的路线,集成开源和开放的现有技术,先入场再发展壮大,这也是更多中小创业者和开发者最可见的机遇。

这两种路线也不稀奇。

一如当初苹果做出了iOS系统,有人对标iOS,要研发新手机系统,建立新生态;也有许许多多的开发者基于iOS做各种创造,在游戏、开发、创作、工具类别下疯狂推出各种适配iOS系统的App。

所以技术和应用两条道路,都能有玩家走到最后,完成商业化闭环,选择不同而已,没有优劣之分。

从来没有事实能笃定表明,其中某一种能一统天下。

据透露,走产品应用路线的一帧秒创,已经快速积累了近200万用户,每日的视频生成量在10万级——这算不算AIGC时代的船票还不好说,但至少让外界看到变数发生的可能。

版权所有,未经授权不得以任何形式转载及使用,违者必究。

Recommend

About Joyk


Aggregate valuable and interesting links.
Joyk means Joy of geeK