4

4000字干货!帮你掌握AI绘画神器「WHEE」的基础操作

 6 months ago
source link: https://www.uisdc.com/whee-4
Go to the source link to view the article. You can view the picture content, updated content and better typesetting reading experience. If the link is broken, please click the button below to view the snapshot at that time.
neoserver,ios ssh client
4000字干货!帮你掌握AI绘画神器「WHEE」的基础操作

今天给大家带来一个新的宝藏国产 AI「WHEE」,下面我们通过“介绍 WHEE——基础教程”来讲解。感兴趣的小伙伴我们可以在评论区讨论。

一、MiracleVision

说到「WHEE」就不得不提「MiracleVision」,「MiracleVision」是美图公司自主研发的视觉大模型,其核心部分为“创新认知”和“智能创造”。

  1. 创新认知:MiracleVision的关键词关联功能根据输入的关键词自动应用灯光、纹理、风格、图像质量等元素,简化了用户体验,让所有用户都能更轻松地使用。此外,关键词识别能力使MiracleVision能够满足专业设计要求,如中特写、远景、顺光和逆光等。
  2. 智能创作:MiracleVision 通过详细开发功能增强视觉效果的细节和表现力。AI图像扩展,扩展图像,细节自然丰富。局部调整允许精确和精细的修改。质量增强器可展现图像细节、颜色和物体的活力和清晰度。
4000字干货!帮你掌握AI绘画神器「WHEE」的基础操作

美图创始人曾表示“MiracleVision 将服务电子商务、广告、游戏、动漫、影视等五个主要行业”

  1. 电商:MiracleVision全程协助,包括素描、着色、生成产品照片、试穿效果以及最终输出出售。
  2. 广告:MiracleVision的服务包括提供灵感、增强创意、协助构图、动态调整尺寸、简化制作流程。
  3. 游戏:MiracleVision可以处理场景设计、角色设计、道具设计、UI设计、宣传物料等各种流程,扩大设计师的创作空间,同时帮助降低成本。
  4. 动画:MiracleVision 集成了概念设计、故事板生成、草图着色、帧插值、视频到动画转换的流程,支持想法快速落实为成品。
  5. 影视:MiracleVision可以充分满足场景设计、分镜设计、人物造型、道具设计、宣传物料的要求。
4000字干货!帮你掌握AI绘画神器「WHEE」的基础操作

当然「MiracleVision」在「WHEE」中还支持大家熟悉的“文生图、图生图”的创作模式,不管是那种创作模式都可以进行“多种风格、丰富可调参数、精准控制画面、多尺寸可选、低延迟”等选项丰富创作画面。

「MiracleVision」我们简单介绍过了,那么接下来我们进行「WHEE」的基础教程部分。

二、基础教程

关于「WHEE」的使用技巧,官方提供了“6+1”模式(6 种方法+1 个创作词库),“6 种方法”分别为“文生图、图生图、风格模型训练、AI 模特图、AI 改图、AI 阔图”那么我们下面一一讲解。

1. 文生图

「文生图」分为“快捷创作”和“高级创作”,我们先从“快捷创作”开始,快捷创作分为三个模块“提示词——创作风格——参数设定”

4000字干货!帮你掌握AI绘画神器「WHEE」的基础操作

今年是龙年,那么我们就将目标设定为“龙”,通过对“龙”的描述。通过官方的提示我们可以知道,在描述时我们需要简洁的描述,通过逗号隔开。描述时我们的技巧通过“前——中——后”三个阶段进行描述:

  1. 前:描述场景构造
  2. 中:人物与环境细节
  3. 后半段:补充艺术的描述

根据官方词库提炼,我们得到以下描述词

“一只红色的龙,穿着红色唐装,在天空中翱翔,祥云,喜庆,烟花,暖色的天空,鲜艳色彩,自然光,梦幻雾气,中景,8k,高分辨率,高细节,Q 版,卡通风格,OC,3D 渲染,光线追踪,卡通风格”

为了帮助用户更加方便生图以及控制画面的准确性在“词库”和“智能联想”,“智能联想”就是根据现有描述词优化或者扩展,更准确引导正确生图,以下是在使用“智能联想”优化前后对比

2. 智能联想

“Q 版卡通,红色龙,龙身、唐装、祥云,天空、烟花、喜庆氛围,8K 高分辨率,卡通风格,3D 渲染、光线追踪、卡通风格,自然光、暖色天空、梦幻雾气,鲜艳色彩、卡通质感”

创作风格:这里选择“MiracleVision 4.0”

参数设定:3:4 768*1024(根据需求尺寸进行参数调整“、1:1、2:3、3:4、9:16、3:2、4:3、16:9、自定义”)

生成张数:4(生成张数越多,耗时越久)

4000字干货!帮你掌握AI绘画神器「WHEE」的基础操作

由此可见通过“智能联想”所生成的图片画面更加饱满,如果生成的图片需要调整那么右侧工具栏提供“分辨率提升、AI 改图、AI 扩图”等功能,那我们首先尝试一下效果,这里我们看到这只龙多了个脚,我们就选择 AI 改图,直接上传我们修改的图片,选中多余部分在描述中“消除”即可。

4000字干货!帮你掌握AI绘画神器「WHEE」的基础操作

3. 高级创作

接下来我们就在“高级创作”尝试,“高级创作”分为“提示词——模型——风格模型——参数设定——画面控制”五个模块。

4000字干货!帮你掌握AI绘画神器「WHEE」的基础操作

还是上述关键词:

“Q 版卡通,红色龙,龙身、唐装、祥云,天空、烟花、喜庆氛围,8K 高分辨率,卡通风格,3D 渲染、光线追踪、卡通风格,自然光、暖色天空、梦幻雾气,鲜艳色彩、卡通质感”

这里可以选择“不希望呈现的内容”,添加“风格模型”这里可以进行“WHEE”的风格模型添加

关于参数设定:在“参数设定”中画面尺寸根据自己需要可以调节“自适应、1:1、2:3、3:4、9:16、3:2、4:3、16:9、自定义”

创意相关性:控制图片生成过程中遵循提示词的程度,值越高,图像就越贴合描述内容。但较高的值会降低创意性与质量。

生成张数:越多消耗时间越多

这里特别说明一下“采样器”,这里包含四个采样:

  1. Euler(基础采样,适合范围广)
  2. Euler A(生成结果多样性)
  3. DPM 2M Karras(适合二次元风格)
  4. DPM SDE Karras(增强颜色与光影,提升质感,但生成时间较久)

采样步骤:生成图片所需的步骤,步骤越多耗时越久,通常 25 个步骤足以获得高质量的图片。

面部修复:开启可优化人像面部的五官细节,但会增加生成时间。

接下来模块是画面控制的官方解释:

  1. 控制可以在改变风格的基础上增加与参考图的相似,例如动作(姿势检测)、环境背景(边缘、深度检测)、文字(融合控制)等
  2. 因为控制模型可以最大增加至3个配置使用,但增加越多运行越久,建议优先在1个控制模型内进行调整

这里我们就用由快捷创作的“龙”

这样看起来这个小龙的画面融合度会看起来更加舒适一点,以下是“龙”的元素合集。

4. 图生图

进入“图生图”模式分为六个模块“上传原图——提示词——模型——风格模型——参数设定——画面控制”。

这里我们用尝试“插画风格”,我们通过筛选找到目标的图片将目标图像拖入选区。下方会出现图片识别与人脸相似度,这里存在的作用是:

图片识别:开启后会自动识别原图内的人像,自动优化创意结果。

人脸相似度:强度越高结果越接近原始图的人脸,建议强度适中。(官方建议 20%——50%)

提示词:建筑,植物,大师作品,暗调,电影感,错综复杂的细节,完美的画面,干净背景,室外,星空,扁平插画,插画,建构主义

风格模型:这里我们初次通过模型选择与相似的插画风格“CityPop”

在“参数设定”中画面尺寸根据自己需要可以调节“自适应、1:1、2:3、3:4、9:16、3:2、4:3、16:9、自定义”

重绘幅度:强度越低结果越接近原始图,但较低的强度会影响风格创意与质量。

以下是生成的图片

再“图生图”中尝试了几个模型效果并不理想,画面灰蒙蒙的可能与垫图风格与画面的相似度有关。这里建议选择与参考图相似度较高的模型这样相似度会高,否则会导致结果与期望相反。这里我们将模型去处再看一下效果。

这里我们会发现效果会好很多、“黑、白、灰”都体现了出来,经过长时间的训练,我会得出这样一个结论“模型风格与垫图相似度在 80%左右才会做到锦上添花,否则可能与原图在颜色的会有区别”。

5. AI 模特图

这里我们尝试一下 AI 模特图,这里分为六个模块“模型(默认)——基础设定——场景设定——提示词——比例——姿态控制(敬请期待)”

①基础设定

性别:男/女

年龄段:分为六个年龄段(婴儿——儿童——青少年——青年——中青年——老年人)

②场景设定

这里氛围三大场景(预设场景——职业——发型)

预设场景:简约背景——证件照——韩式照片——形象照片

职业:医生——教师——白领——职场精英——护肤模特——彩妆模特——健身教练——运动达人

发型:短发——直发——羊毛卷发——大波浪——学生头——单马尾——双马尾——麻花辫

③提示词:输入目标提示词即可

④比例:1:1、2:3、3:4、9:16、3:2、4:3、16:9

⑤姿态控制还没开放我们敬情期待!

这里我们选择一个“女青年形象照”为目标

模型:MiracleVision

基础设定:女——年龄(青年)——肤色(第一个)——场景设定(形象照片、白领职业、大波浪发型)

提示词:漂亮的女青年,职业,精致的妆容,大眼睛,精致的五官

通过产生的照片我们可以看出质量还是相当可以,可以直接拿去使用。

6. 风格模型训练

接下来就开始最令人惊喜的“风格模型训练”阶段。我们通过“风格模型训练”可以生成相同风格的图片,那么我们进入“风格模型训练”页面,这里分为三个模块“风格模型名称——模型——高级设置”

这里需要说明的是“高级设置”中的“训练次数、迭代周期”,次数和周期越长,训练等待时间越久。这里建议大家使用默认参数就好。

那么实操环节,我们的目标是生成“B 端图标模型”。那么我们选择 15—20张相关参考图丢入右侧(图片张数越多训练时长越长,图片数量少于15张则风格效果不稳定,当然需要风格相似的图片)接下来我们等30——120分钟即可应用。

在我的模型中可以查看已经生成的模型,接下来我们可以选择“文生图”、“图生图”进行应用

这里我们选择“文生图”

输入关键词:数据服务图标,高细节节,8k,OC,Blender,C4d,3D 渲染,由玻璃制成,全局照明,干净背景,单一色调背景

除了采样器还是选择了“Euler A”其他均为默认。

这里的文生图与纯文生图一致,只需要加上“B 端模型”即可

这里图标我们采用关于 B 端科技感的图标去生成一组 banner,操作方法在训练模型中一致,我们只需要将其抠出即可,(那么这里强烈推荐“美图秀秀”的抠图功能堪称强大)

关于本次的模型我已经替大家训练完毕上传至模型商店名字“B 端图标”,欢迎大家使用。

「WHEE」基础教程操作我们就讲完了记得关注,我们下一篇开始实战操作。


About Joyk


Aggregate valuable and interesting links.
Joyk means Joy of geeK