2

阿里达摩院上线“文本生成视频大模型”

 1 year ago
source link: https://www.8btc.com/article/6810504
Go to the source link to view the article. You can view the picture content, updated content and better typesetting reading experience. If the link is broken, please click the button below to view the snapshot at that time.
neoserver,ios ssh client
2023-03-22 08:00

阿里达摩院上线“文本生成视频大模型”

据《都市快报》消息,阿里达摩院昨日在魔搭社区(ModelScope)放出了“文本生成视频大模型”。根据官方介绍,目前这个模型,由文本特征提取、文本特征到视频隐空间扩散模型、视频隐空间到视频视觉空间这 3 个子网络组成,整体模型参数约 17 亿。支持英文输入。扩散模型采用 Unet3D 结构,通过从纯高斯噪声视频中,迭代去噪的过程,实现视频生成的功能。

此前 2 月消息,阿里版聊天机器人 ChatGPT 正在研发中,目前处于内测阶段。

FvvxrLylYrV16LWZIA8vGbbSrnNP.png

本文链接:https://www.8btc.com/article/6810504
转载请注明文章出处

登录 账号发表你的看法,还没有账号?立即免费 注册

About Joyk


Aggregate valuable and interesting links.
Joyk means Joy of geeK