3

伯俊CTO洞察:AI模特换装背后的隐忧和挑战有哪些?-品玩

 11 months ago
source link: https://www.pingwest.com/a/285027
Go to the source link to view the article. You can view the picture content, updated content and better typesetting reading experience. If the link is broken, please click the button below to view the snapshot at that time.

伯俊CTO洞察:AI模特换装背后的隐忧和挑战有哪些?-品玩

top-ad_1db2933.png

业界动态

伯俊CTO洞察:AI模特换装背后的隐忧和挑战有哪些?

article-thumb-lg

今年伊始,ChatGPT的东风不仅吹向了国内科技圈,也吹向了包括零售电商在内的许多细分领域。

ChatGPT是AI行业发展的一个里程碑,正在引发一场生产力变革。它在市场营销等方面已多有应用:设计师用它快速生成图像和视频,文案人员用它帮助自己写文章、写文案、写脚本……甚至已经有不少领域在用ChatGPT“搞钱”了。

我们也从各种新闻报道中可以看到,曾经数万元成本才能拿下的假发模特实拍,如今依靠ChatGPT和Midjourney,仅用10分钟就能生成好几版,而且实测模拟显示,AI绘图会比实拍更加真人化,渲染完成之后绝对要比人工拍的好。

AI模特换装真的有这么好吗?现在遇到的问题有哪些?

article-body

AI模特换装带来的隐忧

正所谓“外行看热闹、内行看门道”。作为CTO,我认为把一项新技术注入产品,去赋能业务的时候,要考虑很多因素。当前这个阶段,大模型进步非常快,但还是有很多问题没有解决。

另外,用户场景的需求本身也不完全一样,应用程序的运行环境也不一样。比如知识更新需要重新训练大模型,费时费力,所以它的时效性有缺陷,无法做到对最新消息的知晓,对信息时效性要求高的场景并不适合。大模型是千亿级参数的,需要设备端和云端实时连接,所以对于网络通讯能力较弱、低功耗的设备不太适用。

因此,大模型虽然在很多地方适用,但也有一些场景不适用,作为企业,要去考虑如何调整,如何去抓住机会。

区别于以往的人工智能产品,ChatGPT不单单是文本生产的工具,其强大的语言处理和生存能力也增加了很多的用户体验,同时也为我们降低了生产经营、交易的成本,同时也提高了企业的经营效率,而这种大规模的适配器以及迭代的能力也是ChatGPT的特点,它在特定的领域、专业语言以及自动化的客户服务等各方面都做出了巨大的成就。

article-body

我个人认为ChatGPT在零售行业,未来有非常广阔的发展空间。

随着数字化、智能化时代的到来,消费者对于购物体验和个性化需求的要求越来越高。尤其在服装电商领域,消费者更加注重对服装的直观了解和购买体验。因此,对于电商商家来说,如何降低营销成本、提高营销质量,成为亟待解决的问题。

以模特换装为例,目前市场上服务的商家均表示,通过AI模特换装,能够为电商商家提供更好的营销解决方案,可以降低商家的营销成本,还可以提高商家的竞争力和展示效果,让消费者更直观地了解服装。

我们了解到目前AI模特换装从技术和实际情况都带来一些问题和隐忧。

我了解到,一位电商从业者在AI技术上投入了约200多万,打算从此不再雇用真人模特;一位淘宝服装店主正在培训技术人员,等夏季上新时就换上AI模特;一位模特经纪公司老板正在学习AI绘画工具,打算不再聘用签约模特。

种种做法,让很多人觉得真人模特会失业。事实上,这种担忧目前还是多虑,以现在的技术而言,AI模特换装还不能做到完全自动化。

article-body

目前AI生成的人物图已经较为成熟,海量的人物照片已经被喂进AI的大模型中,在此基础上,可以通过自定义训练集对模型进行微调,比如脸、衣服的部分。据了解,目前做AI模特的同行,大多是直接使用已训练好的模型。

一般来说,只要输入相应的文本关键字,AI就能生成相应图片。如果商家想要一位棕色长发的女性模特形象,那么输入“棕色”“长头发”“女性”的关键词,AI就会生成不同样貌的棕色长发女性。在此基础上,如果商家偏好其中某一个,可以固定参数,在之后的换衣步骤中使用同一位AI模特。

不过AI图看多了之后,还是能分辨出不是真人,比如AI的脸都长得差不多、身材也类似,有些腰细得不太合理。目前,许多训练好的AI模特模型都使用了来自日本、韩国的数据,长相带有明显的日韩风。这也是为什么很多用AI做模型的小公司,训练了数个自定义模型,再混到原先的模型里,生成的脸还是带有原来模型的感觉。

其实,很难去校准一个完全脱离AI味的东西。这个局限性当然可以解决,比如你再去训练,但是每一次训练,成本又上去了。

article-body

再比如,即便使用AI生成的图片可以多达每秒30余张,甚至更多,但是从真人视角去看,可以使用的可能一张都没有。

对于使用AI模特的商家而言,换装试衣的技术非常关键。目前商家的做法主要有两种方式可以实现:一种是拍摄衣服各个角度的照片,借助LoRA模式训练这些照片,生成模特穿上这条裙子后的各个姿势图像;另一种方式是重绘,需要把衣服套在石膏假人上并拍照,将衣服部分固定下来,再生成AI模特和仿真背景。

不过这样还是存在很多问题。前者生成的图像不能保证百分之百地还原衣服,可能有10%的细节会丢失。比如,原本衣服上的一朵小花,生成后可能会变成一个圆点,这种情况下,需要再进行细调或人工后期。而后者,每次将衣服套上模型并拍照,也会增加时间成本。从你拍下来的照片,到直接一张成品的图,没有那么自动。

article-body

机遇和挑战

实际上,AI模特仍有局限,目前AI模特的繁琐之处在于生成之后仍需人工筛图,比如AI生成10张图,其中可能有几张质量不高,或细节画错,这时候就需要人工筛选出更好的图,再进行后续操作。

据我观察,AI模特的技术已经具备,但能否大规模商用,取决于成本和效率。假如说成本还不够,或者成本不合算,即使有技术也没用,但是大家都看到这个前景了。

围绕着ChatGPT和AI,国内已经有不少厂商早已开始投入研发和进行相关业务场景的布局,这也是当下最火热的赛道。

article-body

以科大讯飞为例,前不久,科大讯飞星火认知大模型正式上线,这也意味着科大讯飞正式加入类ChatGPT模型的竞争。

众所周知,科大讯飞可以说是智能语音领域的王者。虽然已经有多家平台推出了类ChatGPT模型,但是主打“AI+行业”模式的科大讯飞可以更好的将人工智能运用在各个行业之中。这在目前国内的人工智能市场中,是独特的存在。

科大讯飞的星火AI可以很好的将企业结合在一起,围绕着知识问答、代码编程、数理推算、创意联想、言翻译等多个使用场景,通过海量的文本代码和知识学习,通过自然对话的方式,理解用户需求,并有效执行任务。

这一切的背后都是服务用户和消费者。

事实上,早在2021年,科大讯飞便与我们伯俊科技进行了合作,共同探索私域经营。

作为伯俊的战略客户,科大讯飞和伯俊科技再次联手,伯俊科技将通过构建商品统一服务能力、一方数据沉淀能力、全渠道联合库存能力、全渠道订单服务能力、全渠道信息敏捷响应能力、数智化分析评估能力,助力科大讯飞实现数字化转型。

在星火AI加持下,伯俊科技将为科大讯飞提供可靠支持,为其消费者业务的数字化转型打下坚实基础,共同推动零售行业技术进步和业务协同发展。

(作者系伯俊CTO陈雨陆)

article-body

About Joyk


Aggregate valuable and interesting links.
Joyk means Joy of geeK