5

【OpenVI】AIGC纪元,兔年AI绘画实践

 1 year ago
source link: https://blog.csdn.net/sunbaigui/article/details/129397801
Go to the source link to view the article. You can view the picture content, updated content and better typesetting reading experience. If the link is broken, please click the button below to view the snapshot at that time.
neoserver,ios ssh client

【OpenVI】AIGC纪元,兔年AI绘画实践

团队模型、论文、博文、直播合集,点击此处浏览

AIGC指的是AI Generated Content,即由AI创作的内容,是继UGC(User Generated Content用户创造内容,如抖音b站等平台)、PGC(Professional Generated Content专业生产内容,如腾讯视频等)之后的新型内容生产方式。由于AIGC生成内容版权可以属于用户,在后续二创、不同平台内容分发方面优势明显。

up主们纷纷使用AIGC进行短视频内容创作,能绘画天马行空的场景、栩栩如生的人物。如此精细的ai绘画和去年Stable Diffusion、MidJourney、DALL-E 2的横空出世息息相关,技术革新带来了令人震撼的效果。这些新技术可以提高创意的效率,缩短创意到实现的周期,并且能够在艺术设计、电影、游戏等领域产生巨大的影响。对于普通人来说,这些新技术可以提供更好的创意平台和更丰富的视觉体验,使个人更容易创建和分享自己的艺术作品,从而激发更多的创意和想象力。

下面就来给大家实战试试modelscope的文生图模型通义文生图1.0,请访问链接:https://modelscope.cn/studios/damo/ai_artist/summary。通义文生图1.0是一种非常强大的生成模型,它可以根据给定的文本描述生成高质量、多样性的图像,这种能力在以前的模型中是不具备的。通义文生图1.0利用了深度学习技术和大规模数据训练,具有强大的生成能力和创造力,能够生成出许多人类难以想象的图像,如一个人在手持一个巨大的鳄鱼等。

对于普通人来说,通义文生图1.0可以提供更好的快速创意验证平台和提供精细而丰富的视觉体验,使个人更容易创建和分享自己的艺术作品,不止是单张图像,可以通过后处理扩展到生成短视频、插画等不同艺术形式,从而激发更多的创意和想象力。相对于传统的绘画、设计等方式,通义文生图1.0可以更快地生成图像,减少时间成本和技能门槛。此外,通义文生图1.0可以为用户提供更多的灵感和创意方向,有助于开拓用户的思维和想象空间。

1.交互界面

9778c7fe7292456a8cf43ab8ecd96c0b.png

操作界面十分简单:如上图选择生成图数量填2意味着输入一段文字(后面代称为prompt)会从服务器返回两张图像以供挑选,调整分辨率可以选择生成不同尺寸的图像。若生成数量越大,生成图像分辨率越大则等待结果的时间会延长。

2.Prompt调试

Prompt的一般写法:主体描述,细节描述,修饰词,艺术风格,艺术家,比如这样:

d20d7e5d9d3f4cbf9806985aec6f6cc3.png

具体技巧我们用画兔子来举例,假设我们只输入简单的词条为:兔子”,来看看生成结果:

82db0c7da6d0419a9bec59b70b4dc876.png

略微有点写实。若要使用通义文生图1.0生成更符合预期、细节丰富、精致具有美感的图像可以这样做:

a.)文本描述:文本描述应尽可能准确地描述你想要生成的图像。要避免使用模糊的、不具体的、多义的语言,这些描述往往会让文生图模型难以理解你的意图。同时,可以尝试使用具有情感色彩或个性化的语言,这可以让生成的图像更加具有个性化和独特性。比如想要一个更偏向中国国画或者日本浮世绘风格兔子可以这样:

389ada81e8a54ed5924831f8572dab9c.png
9fd9c7c1d9034638a6fbe8af7a2231e7.png

艺术风格示例可以包括:包括古典主义、浪漫主义、象征主义、表现主义、立体派、后印象派、新古典主义、立体主义、分析立体主义、抽象表现主义、形而上艺术等。

b.)prompt中增加画面描述词:prompt中可以增加对画面的描述词,例如图像的景深、色彩的深浅、图像的清晰度等等。不同的描述词设置会影响生成图像的质量和外观,需要通过尝试和调整来达到最优的效果。比如我可以这样画兔子:

b76ca9f0114b405b88de4f4b07461e66.png

在中景部分是一只兔子,采用3d渲染风格,画面是体积光,背景是浩瀚的星空

c.)参考知名作家的风格:脑海中的画面可能难以用语言描述的面面俱到,这时候可以使用知名画家的风格进行修饰:

94077a0cd9764bc2b05f2fb9a823a535.png

使用毕加索风格进行绘画,在中景部分是一只兔子,采用3d渲染风格,画面是体积光,背景是浩瀚的星空

知名画家可以包括:莫奈、毕加索、梵高、马克斯·梅勒、米开朗基罗、德加、凡·高、拉斐尔、斯美塔那、布 鲁诺·毕加索、马蒂斯、布列松、杜尚等。通义文生图1.0训练集数据庞大,只要中外知名的画家皆可。

d.)经验积累:使用通义文生图1.0生成图像需要一定的经验积累,这需要多次尝试和反复调整才能得到最好的结果。同时,可以参考其他人的作品或者学习相关的绘画、设计知识,以提高自己的创作水平和美学素养。

3.常见prompt风格

be051b1321d141b68ba7cf9635127437.png
e0e54dc58e76428d94c1948d399d85f9.png

需要注意的是,通义文生图1.0是一种生成模型,生成的图像可能不具有真实感,也不一定能够完全满足个人的想象,但它可以为我们提供更多的想象空间和灵感,帮助我们发现和探索更多的美学可能性。

诶,看到这里你会说“怎么 这就画完了?我还没学会!!”此外怎么从好看的aigc画图反推他的prompt呢?或者怎么让prompt画出的画作更加精细自然呢?这些内容就稍显硬核,不急我们下一期马上来,敬请关注。

大家如果想要稳定调用及效果更好的API,详见视觉开放智能平台(https://vision.aliyun.com/)链接:

https://vision.aliyun.com/experience/detail?spm=a2cvz.27717767.J_7524944390.23.66cd28d0p10xUI&tagName=imageenhan&children=GenerateImageWithText

https://vision.aliyun.com/experience/detail?spm=a2cvz.27717767.J_7524944390.8.66cd28d0p10xUI&tagName=imageenhan&children=GenerateImageWithTextAndImage


About Joyk


Aggregate valuable and interesting links.
Joyk means Joy of geeK