【OpenVI】AIGC纪元，兔年AI绘画实践

AIGC指的是AI Generated Content，即由AI创作的内容，是继UGC(User Generated Content用户创造内容，如抖音b站等平台)、PGC(Professional Generated Content专业生产内容，如腾讯视频等)之后的新型内容生产方式。由于AIGC生成内容版权可以属于用户，在后续二创、不同平台内容分发方面优势明显。

up主们纷纷使用AIGC进行短视频内容创作，能绘画天马行空的场景、栩栩如生的人物。如此精细的ai绘画和去年Stable Diffusion、MidJourney、DALL-E 2的横空出世息息相关，技术革新带来了令人震撼的效果。这些新技术可以提高创意的效率，缩短创意到实现的周期，并且能够在艺术设计、电影、游戏等领域产生巨大的影响。对于普通人来说，这些新技术可以提供更好的创意平台和更丰富的视觉体验，使个人更容易创建和分享自己的艺术作品，从而激发更多的创意和想象力。

下面就来给大家实战试试modelscope的文生图模型通义文生图1.0，请访问链接：https://modelscope.cn/studios/damo/ai_artist/summary。通义文生图1.0是一种非常强大的生成模型，它可以根据给定的文本描述生成高质量、多样性的图像，这种能力在以前的模型中是不具备的。通义文生图1.0利用了深度学习技术和大规模数据训练，具有强大的生成能力和创造力，能够生成出许多人类难以想象的图像，如一个人在手持一个巨大的鳄鱼等。

对于普通人来说，通义文生图1.0可以提供更好的快速创意验证平台和提供精细而丰富的视觉体验，使个人更容易创建和分享自己的艺术作品，不止是单张图像，可以通过后处理扩展到生成短视频、插画等不同艺术形式，从而激发更多的创意和想象力。相对于传统的绘画、设计等方式，通义文生图1.0可以更快地生成图像，减少时间成本和技能门槛。此外，通义文生图1.0可以为用户提供更多的灵感和创意方向，有助于开拓用户的思维和想象空间。

1.交互界面

操作界面十分简单:如上图选择生成图数量填2意味着输入一段文字（后面代称为prompt）会从服务器返回两张图像以供挑选，调整分辨率可以选择生成不同尺寸的图像。若生成数量越大，生成图像分辨率越大则等待结果的时间会延长。

2.Prompt调试

Prompt的一般写法：主体描述，细节描述，修饰词，艺术风格，艺术家，比如这样：

具体技巧我们用画兔子来举例，假设我们只输入简单的词条为：兔子”，来看看生成结果：

略微有点写实。若要使用通义文生图1.0生成更符合预期、细节丰富、精致具有美感的图像可以这样做：

a.）文本描述：文本描述应尽可能准确地描述你想要生成的图像。要避免使用模糊的、不具体的、多义的语言，这些描述往往会让文生图模型难以理解你的意图。同时，可以尝试使用具有情感色彩或个性化的语言，这可以让生成的图像更加具有个性化和独特性。比如想要一个更偏向中国国画或者日本浮世绘风格兔子可以这样：

艺术风格示例可以包括：包括古典主义、浪漫主义、象征主义、表现主义、立体派、后印象派、新古典主义、立体主义、分析立体主义、抽象表现主义、形而上艺术等。

b.）prompt中增加画面描述词：prompt中可以增加对画面的描述词，例如图像的景深、色彩的深浅、图像的清晰度等等。不同的描述词设置会影响生成图像的质量和外观，需要通过尝试和调整来达到最优的效果。比如我可以这样画兔子：

在中景部分是一只兔子，采用3d渲染风格，画面是体积光，背景是浩瀚的星空

c.）参考知名作家的风格：脑海中的画面可能难以用语言描述的面面俱到，这时候可以使用知名画家的风格进行修饰：

使用毕加索风格进行绘画，在中景部分是一只兔子，采用3d渲染风格，画面是体积光，背景是浩瀚的星空

知名画家可以包括：莫奈、毕加索、梵高、马克斯·梅勒、米开朗基罗、德加、凡·高、拉斐尔、斯美塔那、布鲁诺·毕加索、马蒂斯、布列松、杜尚等。通义文生图1.0训练集数据庞大，只要中外知名的画家皆可。

d.）经验积累：使用通义文生图1.0生成图像需要一定的经验积累，这需要多次尝试和反复调整才能得到最好的结果。同时，可以参考其他人的作品或者学习相关的绘画、设计知识，以提高自己的创作水平和美学素养。

3.常见prompt风格

需要注意的是，通义文生图1.0是一种生成模型，生成的图像可能不具有真实感，也不一定能够完全满足个人的想象，但它可以为我们提供更多的想象空间和灵感，帮助我们发现和探索更多的美学可能性。

诶，看到这里你会说“怎么这就画完了？我还没学会！！”此外怎么从好看的aigc画图反推他的prompt呢？或者怎么让prompt画出的画作更加精细自然呢？这些内容就稍显硬核，不急我们下一期马上来，敬请关注。

大家如果想要稳定调用及效果更好的API，详见视觉开放智能平台（https://vision.aliyun.com/）链接：

https://vision.aliyun.com/experience/detail?spm=a2cvz.27717767.J_7524944390.23.66cd28d0p10xUI&tagName=imageenhan&children=GenerateImageWithText

https://vision.aliyun.com/experience/detail?spm=a2cvz.27717767.J_7524944390.8.66cd28d0p10xUI&tagName=imageenhan&children=GenerateImageWithTextAndImage

【OpenVI】AIGC纪元，兔年AI绘画实践

【OpenVI】AIGC纪元，兔年AI绘画实践

1.交互界面

2.Prompt调试

3.常见prompt风格

Recommend

Dogecoin jumps more than 30% after Twitter changes logo to doge symbol

Launch HN: OutSail (YC W23) – Wingsails to reduce cargo ship fuel consumption

Apple’s Swift 5.8 previews Swift 6 features

特斯拉股价下跌6% 市值蒸发2758亿元

What Should We Design Next? — Calculating User Value

Flecs: Flecs

Perth VC Purpose Ventures raised $37 million in 6 weeks to address chronic under...

Design Like a Boss: Conquering Enterprise Software Design Challenges with Limite...

Mastering React's useEffect Hook: A Comprehensive Guide

映宇宙宣布已经接入GPT3.5 turbo

About Joyk