6

AI免费设计LOGO效果惊艳,雷军200万花早了

 1 year ago
source link: https://www.qbitai.com/2023/03/42599.html
Go to the source link to view the article. You can view the picture content, updated content and better typesetting reading experience. If the link is broken, please click the button below to view the snapshot at that time.
neoserver,ios ssh client

AI免费设计LOGO效果惊艳,雷军200万花早了

head.jpg萧箫 2023-03-07 14:12:10 来源:量子位

Stable Diffusion:特意保留了字体的一部分味道

萧箫 发自 凹非寺
量子位 | 公众号 QbitAI

很快啊,Stable Diffusion又被发掘新用途了——

设计LOGO最关键的“形意结合”,被它拿捏得明明白白。看见Cat秒画猫猫头:

05c7b0acd42741cd91db960c6ac366b7~noop.image?_iz=58558&from=article.pc_detail&x-expires=1678773879&x-signature=XOqoC0s29Gm3xv%2B04LIWvAFeG5c%3D

瑜伽店YOGA几个字母用人体形态一转换,风格完全不出错:

2e6c20409a394619953599e2bf9eca8e~noop.image?_iz=58558&from=article.pc_detail&x-expires=1678773879&x-signature=me4ZO7ekCMI6mwwqwtUDpKKFPaA%3D

只设计其中一个字也没问题,例如将Dog的D画成一个狗子:

fb944ceefa114b5a9e7d21942d0622a5~noop.image?_iz=58558&from=article.pc_detail&x-expires=1678773879&x-signature=bIURGCRmDA%2FJuO%2BURyqclNvZR2M%3D

属实简洁又传神了有木有!

哪怕是面对中文字体,AI也能很好地理解其中的意思,快速画出甲方想要传达的LOGO形象:

b984a2b7866a4a2c8040a2b9590dc052~noop.image?_iz=58558&from=article.pc_detail&x-expires=1678773879&x-signature=crdgxGYZTf5JU2qdUhkgNRXoTgc%3D

要是开店用上这个,哪里还需要花几十上百块专门设计一个LOGO出来?(doge)

虽然之前也有不少设计LOGO的AI了,不过从这次生成的效果来看,还真有点不太一样。

保留一部分原有字体的味道

事实上,在这次研究之前,已经有不少研究在考虑如何用AI设计LOGO。

从效果来看,主要可以分成三类:

一是以字体为形状限制,将图片风格迁移上去(如图AB);二是以图片风格为基底,将字体迁移到图片中去(图D);三是将不同图片的形状和字体关联起来,生成或彩色或黑白的“图像拼接”风格LOGO设计(图CE)。

dfdf738c4e6745bc99a96cc8fef0f840~noop.image?_iz=58558&from=article.pc_detail&x-expires=1678773879&x-signature=07doBCh8mj6Fqsd%2F9fre0Rz2wKc%3D

然而,与下面人类手工设计的LOGO比起来,上面AI设计的效果不能说不好看,但似乎还差那么点意思:

a49c36d9808b4710b011e30e787af2d1~noop.image?_iz=58558&from=article.pc_detail&x-expires=1678773879&x-signature=vi3bp7RGlycp1Zx0QRDxD2Vdsh0%3D

作者们经过一通探查,发现人类手工设计的LOGO并不“喧宾夺主”。

人类设计师会在保留原本字体特色、让人们能一眼认出单词的基础上,再加入一点创新之处,例如将Jazz中的J改成乐器,但其他人一眼仍然能认出“JAZZ”字体的形状。

整体来说,就是在保留一部分字体“味道”的同时,加入一定的设计感。

fc7e3540ac48492080f4fd0264e3b948~noop.image?_iz=58558&from=article.pc_detail&x-expires=1678773879&x-signature=evYFLVRiaSEF5YAeDRqSAKMaZyY%3D

例如这是Stable Diffusion生成的“FROG”设计,FRO仍然是原本字体的形状,只有G变成一只跳出去的小青蛙:

b7d5131e85bc4179b9da0b7c8d2b430e~noop.image?_iz=58558&from=article.pc_detail&x-expires=1678773879&x-signature=yHavToKPqISXDwcFcM2aTo8fh7U%3D

如果用Stable Diffusion 2进一步进行后期处理的话,还能进一步实现上色功能,显得更加生动:

50646efefbc64fa585a6d0286a504638~noop.image?_iz=58558&from=article.pc_detail&x-expires=1678773879&x-signature=1LygJkArny6L05MCJYUBWzNidt4%3D

生成LOGO的风格也能随着原本设计字体的变化,而产生不一样的变化。

例如这是8种字体下生成的不同瑜伽LOGO,每种风格都不一样:

acffb66befbd43eca345f1fc0bc2ef84~noop.image?_iz=58558&from=article.pc_detail&x-expires=1678773879&x-signature=OIEME%2FhI2HFJZQ%2BHYIftHx5VNR0%3D

相比之下,其他AI模型在生成字体的时候,倒是更喜欢保留自己的风格(手动狗头):

9d4136276d634fa4b4d9561e59b8f265~noop.image?_iz=58558&from=article.pc_detail&x-expires=1678773879&x-signature=DuvjU%2F7XinQOG2QgyIakVsEEAAE%3D

那么,这种神奇的字体设计AI是怎么做出来的?

用贝塞尔曲线调整字母形状

为了一定程度上保留原本字体的风格、以及只改变单词中的某几个字母,作者们想出一种“微调”字母形状的方法——

那就是让AI学会用贝塞尔曲线,对不同字体的字母进行小幅度变形。

(用过PS中“钢笔”的小伙伴们应该对贝塞尔曲线不陌生,用它能控制鼠标画出一些神奇的曲线)

bd6d84847d5942ee9b487d71236c0578~noop.image?_iz=58558&from=article.pc_detail&x-expires=1678773879&x-signature=PbTve%2B1ZErJBIxMEBS9G3uwCkgU%3D

具体控制点数量,则根据字母复杂度和字体风格进行迭代变换,直到设计出来的字母符合要求,其中橙色是初始点,蓝色是后续增加的控制点:

cd5a918de0324bf0a43ff4a9a686356c~noop.image?_iz=58558&from=article.pc_detail&x-expires=1678773879&x-signature=tiqibfHifQw%2F1v01sv3HG3h3I7g%3D

控制点数量对生成效果影响有多大?

例如这是不同数量的控制点生成字母的效果,如果数量太少,会看不清设计的图像形状;但数量过多又容易扭曲字体原本的形状:

27d9eeb891134a0d8fca4c41e2a12427~noop.image?_iz=58558&from=article.pc_detail&x-expires=1678773879&x-signature=61f6LF6dQ3SUb7Lp7HKQ%2BDzJHbk%3D

基于这种核心设计思路,作者们结合Stable Diffusion和CLIP,设计出了一整个字体设计AI模型:

3ecb7984069c498dbe227ccf7f383867~noop.image?_iz=58558&from=article.pc_detail&x-expires=1678773879&x-signature=AR%2FOqfVWBVzKJeN0FrIUgtxfzHg%3D

其中,ACAP(as conformal as possible)损失函数基于德劳内三角形剖分算法,对字母形状进一步进行了约束。

例如这是PANTS(裤子)在变形前和变形之后的形态,可以看见ACAP在保留裤子形态的同时,也保留了字体的效果:

f9709c977e6d4a59ae7a317de7ef891a~noop.image?_iz=58558&from=article.pc_detail&x-expires=1678773879&x-signature=cQgpNEtnbAJNioKbpCOi5eSuZyE%3D

与此同时,为了进一步保留字体形态,作者们采用了一个低通滤波器,保证调整后的字母不与原始字母偏离太多。例如这是Bear(熊)中的B调整后的形态:

10003cb5c7594969b7d66a00807abbb5~noop.image?_iz=58558&from=article.pc_detail&x-expires=1678773879&x-signature=jiwi%2FPkk97QlLNJ7npW12tF4Vi0%3D

应用这套模型,生成每个字母的速度也还不错。

在一块RTX 2080 GPU上,生成单个字母的LOGO设计大约需要5分钟

虽然作者们放到项目主页上的论文是匿名的:

01c4c0b0e4f1455c907c86629996b2cc~noop.image?_iz=58558&from=article.pc_detail&x-expires=1678773879&x-signature=Y2nwWfmaP%2F3o%2B0nsHdSMxN900bo%3D

不过在arXiv上,作者们的名字倒是已经公开了,他们分别来自以色列特拉维夫大学、Reichman University(莱希曼大学),以及伦敦大学金史密斯学院:

8e30eac2cfaf4c4f9a4887d2d7c2a586~noop.image?_iz=58558&from=article.pc_detail&x-expires=1678773879&x-signature=qiN%2BkeCCgXqq27J5JQ05Z25c4QU%3D

共同一作Shir Iluz,特拉维夫大学电子与电气工程理学硕士,目前的研究方向是生成AI,感兴趣的方向是深度学习与计算机视觉。

f5926b41090240209c9df1d5917b9e64~noop.image?_iz=58558&from=article.pc_detail&x-expires=1678773879&x-signature=xMMov3h5IAqhnTV45J6l7BBTTSo%3D

共同一作Yael Vinker,特拉维夫大学计算机视觉博士生,曾经在以色列希伯来大学获得计算机科学本科与硕士学位,目前研究方向同样是深度学习与计算机视觉。

6ba72825d69c48f4b335a291dee72dd9~noop.image?_iz=58558&from=article.pc_detail&x-expires=1678773879&x-signature=F49dFGq4q%2F2WmrWsa6BiU0No3GI%3D

这么看来,雷军当年设计小米LOGO的200万元花早了啊(手动狗头)

论文地址:
https://arxiv.org/abs/2303.01818

项目地址:
https://wordasimage.github.io/Word-As-Image-Page/

版权所有,未经授权不得以任何形式转载及使用,违者必究。

About Joyk


Aggregate valuable and interesting links.
Joyk means Joy of geeK