1

开年抢跑AI赛道,Sora“截胡”字节

 6 months ago
source link: https://www.chinaventure.com.cn/news/114-20240221-379788.html
Go to the source link to view the article. You can view the picture content, updated content and better typesetting reading experience. If the link is broken, please click the button below to view the snapshot at that time.
neoserver,ios ssh client

开年抢跑AI赛道,Sora“截胡”字节

奋起直追还来得及吗?

最近,国内的大公司在AI赛道上被Sora抢占了风头。

在2024年2月初,此前在大模型领域保持低调的字节跳动终于有了新动作,上线了“Coze扣子”AI Bot开发平台,据Coze官方介绍,Coze可以让用户快速创建各种由AI提供支持的问答Bot,且可以将Bot发布到各种应用程序,从而促进与这些应用程序上的用户的动态交互。

简单来说,Coze的特点是,可以让用户创建个人定制版Bot,实现“0代码”开发。

这倒也并非创新之举。早在2023年末,OpenAI发布的GPTs也是旨在“每个人都可以定制自己的ChatGPT,从而让GPT成为一个家族。”但对于字节跳动而言,这多少算个大动作,毕竟此前它在大模型领域沉寂已久。

不过,还未等Coze掀起太大的水花,OpenAI发布的Sora直接“王炸”,抢走风头,引发热议。

定制Chatbot,从求职到小红书文案

“Coze是一个一站式AI机器人开发平台。”

据Coze官网,为了促进和简化AI机器人的开发过程,Coze目前集成了60多个插件,增强了Bot在信息检索、旅行协助、生产力、图像理解等领域的功能,“你可以直接将这些插件添加到Bot中,丰富Bot能力。例如使用新闻插件,打造一个可以播报最新时事新闻的AI新闻播音员。”用户也可以通过指定现有API的输入和输出来快速创建自定义插件。

此外,Coze支持为Bot创建定时任务。Coze官网介绍称,用户无需编写任何复杂的代码,只需一个简单的描述,Bot就可以按需完成工作。例如,可以配置为:每天早上 9:00 向您发送个性化新闻。提醒您每天早上7:00查看今天的天气预报和日程。

锌刻度体验Coze时发现,目前Coze的Bot商店内已有各种场景的预置Bot,其中包括女生头像生成器、小红书文案输出大师、求职助手等,而根据官网介绍,选择预生成Bot后,用户会被引导到该Bot的配置页面。在这里,你可以查看这个Bot的配置信息,与这个Bot进行交互,体验它提供的能力。

经体验,锌刻度留意到,目前的预置Bot多搭载云雀大模型。其中,“求职助手”可以提供求职建议、推荐工作机会。

而部分Bot或许还有一定完善和提升空间。比如,在体验“小红书文案输出大师”时,锌刻度分别提出“帮我列出送妈妈的礼物清单”和“帮我列出送奶奶的礼物清单”的需求,但得到的回答基本相同。这一问题在“春联大王”这一Bot也出现,据钛媒体,要求bot帮助写一个关于雪的春联,经过两次追加不一样的提示词(Prompt),最后生成的两副春联竟是一模一样的,并未如预期出现不同的回答。

值得一提的是,除了可以体验这些预置Bot,用户也可复制一个预置的Bot,并根据你的具体需求对其进行修改。

至于Coze背后的开发团队,据界面新闻报道,Coze由2023年11月字节跳动成立的AI创新业务部门Flow研发而成的,该部门业务主要聚焦于AI应用层,由字节跳动技术副总裁洪定坤担任技术负责人,原今日头条CEO朱文佳担任字节大模型团队业务负责人。

不过,Coze官网链接的企业为“北京春田知韵科技有限公司”,天眼查显示,该公司成立于2023年7月,由北京抖音信息服务有限公司100%持股。

字节猛追进度

在发布Coze之前,字节跳动在AI赛道上一度“掉队”。

在字节跳动2024年全员会上,字节跳动CEO梁汝波表示,字节跳动存在低效和迟钝现象,并直言,“字节对于大模型领域的反应过于迟钝,直到2023年中才出现跟GPT相关的讨论,而GPT-1在2018年就发布了,且业内做得比较好的大模型创业公司也基本在2018-2021年间创立。”

回顾此前,直到去年8月,字节跳动基于云雀大模型开发的AI聊天机器人“豆包”才开始公测,面向C端市场发力AI应用。与此同时,还在国外发布了基于CPT模型训练的Cici,后者目前已经在超过30个国家和地区上线。

与此同时,国内大公司纷纷在这个赛道发力:从2023年的3月到9月,从百度的大语言模型“文心一言”、360的智脑大模型,到阿里巴巴的“通义千问”大模型、科大讯飞的星火大模型,再到腾讯的混元大模型,国内传统的三大互联网巨头“BAT”悉数下场。

手机厂商也未缺席,华为、小米、OPPO、vivo、荣耀都先后在赛道亮相;五科研院所和初创企业不甘示弱,北京智源人工智能研究院发布了“悟道”大模型,上海人工智能实验室推出了“书生”大模型,鹏城实验室研发了“鹏城·脑海”大模型;京东、携程、好未来等也相继召开发布会;甚至连移动、联通、电信三大运营商,长虹等家电生产企业也欲分一杯羹……

更不用提诸多风云人物对此的讨论不断。其中,据财经网,华为创始人任正非3月中旬参加华为 “难题揭榜火花奖” 颁奖座谈会时称,华为会做底层算力平台:“未来AI大模型会风起云涌,不只微软一家。ChatGPT把计算、管道流量撑大,华为的产品就有了机会。”同月月底,腾讯总裁刘炽平在财报电话会上说,生成式人工智能可成为腾讯已有业务,如社交、游戏的 “倍增器”,也可帮助开拓数字助手、搜索等新增长线。此外,《张朝阳的物理课》直播结束后会自动生成字幕:“‘社交互动’‘算法推荐以及AIGC’‘自媒体’,是这些年来互联网的三个线索。”

数据则更为直观,据“趣解商业”,2023年5月的中关村论坛上,专家口中中国“10亿级参数规模以上”大模型的发布数量尚为79个;而《2023中国新一代人工智能科技产业发展报告》显示,截至2023年10月,我国拥有10亿参数规模以上大模型的厂商及高校院所共计254家,分布于20多个省市/地区,国内大模型总数达238个;而据GitHub的统计数据,到2023年底国内已经发布的大语言模型接近300个。

所以,当“百模大战”如火如荼时,在2024年初发布Coze的字节跳动,与其说是抢跑,可能更精确的说法是“奋起直追”。

OpenAI抢占风头,字节又该如何应对?

字节跳动或许本想着在2024年初抢先崭露头角,却不料OpenAI再放“狠招”,直接“王炸”,抢占了风头。就在Coze上线后不久,Sora横空出世。

2月16日,OpenAI推出了一款能根据文字指令即时生成短视频的模型,命名为Sora。据介绍,Sora能够从文本说明中生成长达60秒的视频,并能够提供具有多个角色,特定类型的动作和详细的背景细节的场景。Sora还能在一个生成的视频中创建多个镜头,体现人物和视觉风格。此外,Sora可以一次性生成整个视频,也可以扩展生成的视频,使其

这意味着,OpenAI已然在人工智能赛道上迈入下半场,国内外大模型的差距更明显了。当OpenAI官方公布长达60秒未经修改的AI视频,国内也有AI团队紧急上线相关“文字生成视频”大模型,但与国外主流AI视频模型能力相仿,均暂时无法超越Sora的水平。

不过,当OpenAI已经开始深耕文生视频的大模型,字节跳动却似乎如梦初醒,刚刚开始追赶对话问答大模型的进度。

日前虽有消息称,在Sora引爆文生视频赛道之前,国内的字节跳动也推出了一款颠覆性视频模型——Boximator。与Gen-2、Pink1.0等模型不同的是,Boximator可以通过文本精准控制生成视频中人物或物体的动作。但对此,字节跳动相关人士回应新浪科技称,Boximator是视频生成领域控制对象运动的技术方法研究项目,目前还无法作为完善的产品落地,距离国外领先的视频生成模型在画面质量、保真率、视频时长等方面还有很大差距。

事实上,字节跳动的Coze也多少有些亦步亦趋,早在Coze发布之前,其实在2023年11月的OpenAI首届开发者大会上,GPTs就已经发布,而根据当时的介绍,GPTs无需编程技巧,可以让用户用自己的自然语言来创建“个人版ChatGPT”,实现全程“0代码”开发。

用OpenAI CEO奥尔特曼的话说,每个人都可以定制自己的ChatGPT,从而让GPT成为一个家族。那时候,外界讨论,GPTs搭配GPT Store,很可能会在AI应用生态中诞生下一个苹果。

彼时,华西证券研报曾评价,类比App Store,GPT Store将成为OpenAI生态重要一环。

按照研报的说法,对初创公司来说,GPTs本身就是一个值得挖掘的AI应用项目;而对于现有的互联网应用来说,GPT Store是一个优质的流量入口,GPTs要实现复杂功能普遍需调用外部API,若现有App能充分利用GPTs的高智能、高灵活性,并与自身应用进行结合,有望为现有互联网生态注入新鲜血液,“AI+一切”已近在咫尺。

显然,Coze的设定与此相同。

只不过,当字节跳动这次试图紧跟OpenAI脚步时,还是稍有差距。可以预想的是,国内或许很快也将掀起文生视频大模型的新浪潮,而字节跳动又该如何应对呢?

网站编辑: 小川

About Joyk


Aggregate valuable and interesting links.
Joyk means Joy of geeK