4000字干货！帮你掌握AI绘画神器「WHEE」的基础操作

今天给大家带来一个新的宝藏国产 AI「WHEE」，下面我们通过“介绍 WHEE——基础教程”来讲解。感兴趣的小伙伴我们可以在评论区讨论。

用3个实战教程，帮你掌握AI绘画神器「WHEE」的用法

面对需求增加，一定会疯狂加班，这次主角还是我们的「WHEE」，我们继续探究通过「WHEE」我们还会得到哪些产出。

阅读文章 >

一、MiracleVision

说到「WHEE」就不得不提「MiracleVision」，「MiracleVision」是美图公司自主研发的视觉大模型，其核心部分为“创新认知”和“智能创造”。

创新认知：MiracleVision的关键词关联功能根据输入的关键词自动应用灯光、纹理、风格、图像质量等元素，简化了用户体验，让所有用户都能更轻松地使用。此外，关键词识别能力使MiracleVision能够满足专业设计要求，如中特写、远景、顺光和逆光等。
智能创作：MiracleVision 通过详细开发功能增强视觉效果的细节和表现力。AI图像扩展，扩展图像，细节自然丰富。局部调整允许精确和精细的修改。质量增强器可展现图像细节、颜色和物体的活力和清晰度。

美图创始人曾表示“MiracleVision 将服务电子商务、广告、游戏、动漫、影视等五个主要行业”

电商：MiracleVision全程协助，包括素描、着色、生成产品照片、试穿效果以及最终输出出售。
广告：MiracleVision的服务包括提供灵感、增强创意、协助构图、动态调整尺寸、简化制作流程。
游戏：MiracleVision可以处理场景设计、角色设计、道具设计、UI设计、宣传物料等各种流程，扩大设计师的创作空间，同时帮助降低成本。
动画：MiracleVision 集成了概念设计、故事板生成、草图着色、帧插值、视频到动画转换的流程，支持想法快速落实为成品。
影视：MiracleVision可以充分满足场景设计、分镜设计、人物造型、道具设计、宣传物料的要求。

当然「MiracleVision」在「WHEE」中还支持大家熟悉的“文生图、图生图”的创作模式，不管是那种创作模式都可以进行“多种风格、丰富可调参数、精准控制画面、多尺寸可选、低延迟”等选项丰富创作画面。

「MiracleVision」我们简单介绍过了，那么接下来我们进行「WHEE」的基础教程部分。

二、基础教程

关于「WHEE」的使用技巧，官方提供了“6+1”模式（6 种方法+1 个创作词库），“6 种方法”分别为“文生图、图生图、风格模型训练、AI 模特图、AI 改图、AI 阔图”那么我们下面一一讲解。

1. 文生图

「文生图」分为“快捷创作”和“高级创作”，我们先从“快捷创作”开始，快捷创作分为三个模块“提示词——创作风格——参数设定”

今年是龙年，那么我们就将目标设定为“龙”，通过对“龙”的描述。通过官方的提示我们可以知道，在描述时我们需要简洁的描述，通过逗号隔开。描述时我们的技巧通过“前——中——后”三个阶段进行描述：

前：描述场景构造
中：人物与环境细节
后半段：补充艺术的描述

根据官方词库提炼，我们得到以下描述词

“一只红色的龙,穿着红色唐装,在天空中翱翔,祥云，喜庆，烟花，暖色的天空,鲜艳色彩,自然光,梦幻雾气,中景,8k,高分辨率,高细节,Q 版,卡通风格,OC,3D 渲染,光线追踪,卡通风格”

为了帮助用户更加方便生图以及控制画面的准确性在“词库”和“智能联想”，“智能联想”就是根据现有描述词优化或者扩展，更准确引导正确生图，以下是在使用“智能联想”优化前后对比

2. 智能联想

“Q 版卡通，红色龙，龙身、唐装、祥云，天空、烟花、喜庆氛围，8K 高分辨率，卡通风格，3D 渲染、光线追踪、卡通风格，自然光、暖色天空、梦幻雾气，鲜艳色彩、卡通质感”

创作风格：这里选择“MiracleVision 4.0”

参数设定：3:4 768*1024（根据需求尺寸进行参数调整“、1:1、2:3、3:4、9:16、3:2、4:3、16:9、自定义”）

生成张数：4（生成张数越多，耗时越久）

由此可见通过“智能联想”所生成的图片画面更加饱满，如果生成的图片需要调整那么右侧工具栏提供“分辨率提升、AI 改图、AI 扩图”等功能，那我们首先尝试一下效果，这里我们看到这只龙多了个脚，我们就选择 AI 改图，直接上传我们修改的图片，选中多余部分在描述中“消除”即可。

3. 高级创作

接下来我们就在“高级创作”尝试，“高级创作”分为“提示词——模型——风格模型——参数设定——画面控制”五个模块。

还是上述关键词：

这里可以选择“不希望呈现的内容”，添加“风格模型”这里可以进行“WHEE”的风格模型添加

关于参数设定：在“参数设定”中画面尺寸根据自己需要可以调节“自适应、1:1、2:3、3:4、9:16、3:2、4:3、16:9、自定义”

创意相关性：控制图片生成过程中遵循提示词的程度，值越高，图像就越贴合描述内容。但较高的值会降低创意性与质量。

生成张数：越多消耗时间越多

这里特别说明一下“采样器”，这里包含四个采样：

Euler（基础采样，适合范围广）
Euler A（生成结果多样性）
DPM 2M Karras（适合二次元风格）
DPM SDE Karras（增强颜色与光影，提升质感，但生成时间较久）

采样步骤：生成图片所需的步骤，步骤越多耗时越久，通常 25 个步骤足以获得高质量的图片。

面部修复：开启可优化人像面部的五官细节，但会增加生成时间。

接下来模块是画面控制的官方解释：

控制可以在改变风格的基础上增加与参考图的相似，例如动作（姿势检测）、环境背景（边缘、深度检测）、文字（融合控制）等
因为控制模型可以最大增加至3个配置使用，但增加越多运行越久，建议优先在1个控制模型内进行调整

这里我们就用由快捷创作的“龙”

这样看起来这个小龙的画面融合度会看起来更加舒适一点，以下是“龙”的元素合集。

4. 图生图

进入“图生图”模式分为六个模块“上传原图——提示词——模型——风格模型——参数设定——画面控制”。

这里我们用尝试“插画风格”，我们通过筛选找到目标的图片将目标图像拖入选区。下方会出现图片识别与人脸相似度，这里存在的作用是：

图片识别：开启后会自动识别原图内的人像，自动优化创意结果。

人脸相似度：强度越高结果越接近原始图的人脸，建议强度适中。（官方建议 20%——50%）

提示词：建筑,植物,大师作品,暗调,电影感,错综复杂的细节,完美的画面,干净背景,室外,星空,扁平插画,插画,建构主义

风格模型：这里我们初次通过模型选择与相似的插画风格“CityPop”

在“参数设定”中画面尺寸根据自己需要可以调节“自适应、1:1、2:3、3:4、9:16、3:2、4:3、16:9、自定义”

重绘幅度：强度越低结果越接近原始图，但较低的强度会影响风格创意与质量。

以下是生成的图片

再“图生图”中尝试了几个模型效果并不理想，画面灰蒙蒙的可能与垫图风格与画面的相似度有关。这里建议选择与参考图相似度较高的模型这样相似度会高，否则会导致结果与期望相反。这里我们将模型去处再看一下效果。

这里我们会发现效果会好很多、“黑、白、灰”都体现了出来，经过长时间的训练，我会得出这样一个结论“模型风格与垫图相似度在 80%左右才会做到锦上添花，否则可能与原图在颜色的会有区别”。

5. AI 模特图

这里我们尝试一下 AI 模特图，这里分为六个模块“模型（默认）——基础设定——场景设定——提示词——比例——姿态控制（敬请期待）”

①基础设定

性别：男/女

年龄段：分为六个年龄段（婴儿——儿童——青少年——青年——中青年——老年人）

②场景设定

这里氛围三大场景（预设场景——职业——发型）

预设场景：简约背景——证件照——韩式照片——形象照片

职业：医生——教师——白领——职场精英——护肤模特——彩妆模特——健身教练——运动达人

发型：短发——直发——羊毛卷发——大波浪——学生头——单马尾——双马尾——麻花辫

③提示词：输入目标提示词即可

④比例：1:1、2:3、3:4、9:16、3:2、4:3、16:9

⑤姿态控制还没开放我们敬情期待！

这里我们选择一个“女青年形象照”为目标

模型：MiracleVision

基础设定：女——年龄（青年）——肤色（第一个）——场景设定（形象照片、白领职业、大波浪发型）

提示词：漂亮的女青年,职业,精致的妆容,大眼睛,精致的五官

通过产生的照片我们可以看出质量还是相当可以，可以直接拿去使用。

6. 风格模型训练

接下来就开始最令人惊喜的“风格模型训练”阶段。我们通过“风格模型训练”可以生成相同风格的图片，那么我们进入“风格模型训练”页面，这里分为三个模块“风格模型名称——模型——高级设置”

这里需要说明的是“高级设置”中的“训练次数、迭代周期”，次数和周期越长，训练等待时间越久。这里建议大家使用默认参数就好。

那么实操环节，我们的目标是生成“B 端图标模型”。那么我们选择 15—20张相关参考图丢入右侧（图片张数越多训练时长越长，图片数量少于15张则风格效果不稳定，当然需要风格相似的图片）接下来我们等30——120分钟即可应用。

在我的模型中可以查看已经生成的模型，接下来我们可以选择“文生图”、“图生图”进行应用

这里我们选择“文生图”

输入关键词：数据服务图标,高细节节,8k,OC,Blender,C4d,3D 渲染,由玻璃制成,全局照明,干净背景,单一色调背景

除了采样器还是选择了“Euler A”其他均为默认。

这里的文生图与纯文生图一致，只需要加上“B 端模型”即可

这里图标我们采用关于 B 端科技感的图标去生成一组 banner，操作方法在训练模型中一致，我们只需要将其抠出即可，（那么这里强烈推荐“美图秀秀”的抠图功能堪称强大）

关于本次的模型我已经替大家训练完毕上传至模型商店名字“B 端图标”，欢迎大家使用。

「WHEE」基础教程操作我们就讲完了记得关注，我们下一篇开始实战操作。

用3个实战教程，帮你掌握AI绘画神器「WHEE」的用法

一、MiracleVision

二、基础教程

Recommend

中兴通讯将携多项重磅数智新品亮相MWC2024

Egypt announces $35B deal with UAE to buy premium Mediterranean area

客户端需求界面设计原型用这3个工具轻松搞定！

30 条原则，帮你认清这个世界

qq浏览器怎么删书签

红米 K70 及 HyperOS 的使用感受

Sales Objections Trainer

Saner.AI

A Retrospective on Requests

HMD to unveil Barbie flip phone and new Nokia phone this Summer

About Joyk