OpenAI展示了Sora，这是一种可以从文本提示生成逼真视频的AI模型

admin 　2024年02月16日 10:49

OpenAI 一直是消费类 AI 领域的开拓者，借助 DALL-E 和 ChatGPT，彻底改变了文本和图像生成。现在，凭借其最新产品Sora，该公司旨在涉足文本到视频生成领域，试图进一步推动人工智能创造力的界限。

Sora 拥有制作长达一分钟的视频的能力，包括具有“多个角色”、细微动作和“详细背景”的复杂场景——所有这些都由用户提示驱动。结果令人惊讶地栩栩如生，展示了人工智能在视觉叙事方面不可否认的潜力。

在 OpenAI 提供的几个演示中，Sora 毫不费力地将提示带入生活。从一辆在山区行驶的老式 SUV 到坐在融化的蜡烛旁边的毛茸茸的怪物的异想天开的场景，生成的视频对所提供的说明表现出非凡的保真度。

然而，Sora 当然不是没有缺陷。一些实例揭示了轻微的不一致或不切实际的动作，突出了需要改进的地方，例如在猫向熟睡的主人索要早餐的场景中。虽然整个场景的渲染令人信服，但敏锐的观察者可能会注意到当主人从睡眠中醒来时偏离现实的微妙动作。然而，与模型产生令人惊叹的视觉叙事的整体能力相比，这些缺陷显得苍白无力。

一个突出的例子是描绘一个毛茸茸的怪物在融化的蜡烛旁边。结果看起来真的很精彩，就像皮克斯电影中的东西一样。错综复杂的细节，例如生物皮毛的纹理，否则很难渲染，展示了 Sora 在处理复杂视觉元素方面的实力。

目前，Sora可供一组选定的“红队成员”使用，他们的任务是评估其潜在风险和影响。此外，OpenAI 正在与视觉艺术家、设计师和电影制作人合作，收集反馈，旨在增强该模型对内容创作者的整体效用。随着 Sora 继续进行改进和评估，它有望使视频创作民主化——为讲故事的人和创作者提供强大的工具，帮助他们将愿景变为现实。

来源：IT时代网

OpenAI展示了Sora，这是一种可以从文本提示生成逼真视频的AI模型

OpenAI展示了Sora，这是一种可以从文本提示生成逼真视频的AI模型

Recommend

Raising children on the eve of AI

Security Recruiter Directory

丞相，起風了！從ASP.NET 5的變革談起

春节整活，年轻人过“自己的年”

FDA Approves First Medication to Treat Severe Frostbite

U盘如何安装win7旗舰版

Astral unveils ‘extremely fast’ Python package installer

现在圈 X 这类 APP 有啥能用的贴吧去广告吗

Tier1巨头血裁7150人！研发行政都优化，目标降本30亿

自己写一个超级简单的AXI Lite外设

About Joyk