2

数字人技术是“元宇宙”的任督二脉

 3 years ago
source link: https://www.lieyunwang.com/archives/477889
Go to the source link to view the article. You can view the picture content, updated content and better typesetting reading experience. If the link is broken, please click the button below to view the snapshot at that time.
neoserver,ios ssh client
阅读时间大约10分钟(3664字)

15小时前 数字人技术是“元宇宙”的任督二脉

关于元宇宙我们能做的,就是先搭建好组成宇宙中各个元素的基础。

本文来自合作媒体:NPCgank(ID:NPCgank),作者:NPC。猎云网经授权发布。

1982年7月9日,好莱坞上映了一部对后世影响极大的科幻电影,《电子世界争霸战》。

影片讲述的是一个黑客程序员,进入电子世界中,在自己所开发的游戏里作战。这个故事在《头号玩家》、《失控玩家》遍地的当下,并没有什么好稀奇的,但在当时,它准确地开启了一个时代。

从技术上来说,《电子世界争霸战》是全世界范围内第一部采用“CG+真人结合”的方式完成特效的电影,被认为是开创了CG制作电脑的新纪元。而从文本或者说哲学的角度来看,这部影片的影响更为深远,自此之后,电影对世界本源的追溯从未停止。

《电子世界争霸战》之后的第7年,日本漫画师士郎正宗创作出了《攻壳机动队》,并在1995年由押井守搬上了大荧幕,名声大噪。

1999年,深受《电子世界争霸战》和《攻壳机动队》影响的沃卓斯基兄弟如今已是姐弟创作出了《黑客帝国》,这部作品是以“现实+虚拟”为世界观构架的集大成作品,至今无人能望其项背。

所以,从电影史的历程来看,今年以来大火的“元宇宙”,其文本虽然是1992的尼奥·斯蒂文森在小说《雪崩》中提出来的,但具体的概念,应该是更遥远的1982年。

《电子世界争霸战》的影像风格如今看来非常“五毛”,是一种典型的像素风。当时的CG技术,仅仅只能支撑对人体关节部位的动作替代,没有办法对脸部进行特效处理,否则就将成为彻彻底底的卡通片。因此只能够使用“CG+真人结合”的方式。

而在2010年,这部影片进行了重拍,重拍之后的《创:战纪》视听效果获得了极大的提升,还获得了当年奥斯卡最佳音效奖,但仍然延续的是“CG+真人结合”的拍摄模式。

与近年来上映的《头号玩家》和《失控玩家》对比,影像技术近十年来获得了很大的提升。随着互联网技术的不断发展,看似遥远的“元宇宙”世界,其实并非海市蜃楼般遥远,而要实现它,虚拟世界中的数字成像技术是最需要攻克的难题。

数字人,则可能是开启元宇宙时代的“任督二脉”。

从最基础的文本交互,到语音互动,再到融合了视觉、语音及语义技术的多模态数字人交互,我们对虚拟世界中的交流需求越来越高,数字人的概念随之逐渐火热。

那么,数字人技术的实现有哪些难点呢?

作为“数字新物种”,数字人的真实感来源于形象的表现力。相比文字、语音交互产品,数字人加入了视觉元素,这就需要一个更加逼真、更具表现力的形象来满足用户的视觉需求,让用户能够有充足的交互沉浸感。这样的表现力需要做到数字人的声音、形象、嘴型、表情的一致性。

此外,相关的运算和处理需要在与用户对话的过程中实时生成,对于AI算法和计算机的性能也要求较高。当传递的信息从简单的文字信息,变成复杂的音视频信息,只有同时具备自然语言理解(NLP)、语音识别和生成,视觉合成这样的整体AI能力,才能给用户一个自然逼真的体验。

举个例子,“捏脸”是每个数字人诞生的过程中最为重要的环节,也是长期以来数字人的诞生过程中最耗时的部分。关于这道题的解法,Epic Games提供了一套解法。通过工具实现从嘴唇伸缩到眼睛距离、皮肤颜色、牙齿形状、皱纹形态、毛细血管和胡须的自定性,创作者可以自定义所有内容,自由地“捏”出想要的人脸,例如抬起或放下眉毛,改变颌骨的形状和耳朵的高度,甚至睫毛的长度也是可以改变的。并且,随着光影变化,光线在不同肤色、不同年龄、不同性别的角色上均会呈现出不同的效果。

而数字人如何表现得像个“人类”,提供更为合适的交互手段,也是亟待解决的问题。尽管现在人工智能已经越来越普遍地被运用在互联网上,包括人工智能客服、自动化流程、自动化工具,甚至是像AlphaGo这样的人工智能玩家。可以说,人工智能技术的发展,已经可以基本满足用户的需求。但人工智能长期以来被用户所诟病的就在于:始终呈现的是冷冰冰的文字形象,这样偏二维世界的体验并没有与网络技术和人工智能的发展相匹配,这种体验和我们现在看《电子世界争霸战》是一样的。

因此实现数字人的人格化、让数字人的行为动作“像个人类”至关重要。

关于这点,行业内也有众多失败案例。2018年,瑞典一家银行就曾经“开除”了一名“表现不佳”的数字人。最直接的理由就是Amelia的业绩表现没能达到预期。尽管Amelia被认为是世界上最好的AI系统之一,并被广泛地应用于医疗和金融行业,但其中欠缺的人格化,也是众多用户摒弃数字人的原因。

8月,芯片巨头NVIDIA的真假“皮衣教主事件”,将数字人推向热度至高点。部分媒体当时称“NVIDIA欺骗了全世界”,英伟达CEO黄仁勋某次两个小时线上演讲,全程数字人出面,从家居背景到人物、服装等均是虚拟AI能力展示。尽管黄仁勋的“数字人”只出现了14秒,其他部分均为真人演讲,但仍向外界传递了数字人技术未来具有无限的可能性。

其实,数字人距离生活已不遥远,虚拟主播、虚拟教师、虚拟明星、虚拟客服……数字人的形象正在愈发立体和全面地展示在我们的生活中,让以商业和技术为导向的数字经济多了些温情和烟火气。

据量子位智库发布的《虚拟数字人深度产业分析报告》显示,截至2030年,围绕虚拟数字人我国将会形成一个高达2700亿的蓝海市场。而这个市场也并不单一,将围绕着包括游戏/影视、服务平台、媒体平台、医学等更丰富的领域展开。

用户对于数字体验“真实化”的需求永不止步,在数字文化产业领域,数字人最基本的应用就在于对游戏、影视作品沉浸感的提升。Epic Game的虚幻引擎被广泛应用,在虚幻引擎的官网,Epic Games是这样定义数字人技术对于游戏行业的影响的:A world of possibilities。通过技术,Epic Games实现了游戏人物的“高保真化”。随着近几年人工智能技术的不断演进,游戏行业中涌现的一些新技术让数字人的制作过程得到了有效地简化,使得数字人成功地进入了公众的视野之中。

数字人甚至已经被运用至众多非娱乐产业,展现出了其强大的“功能性”价值。

虚拟互动技术的扩展,让数字人已经可以发挥一些常人无法企及的作用,例如医学、矿产、航空航天等领域。此外,通过定制主持人形象,也可以实现内容快速、自动化的生产,优化观看体验。例如,在神州十二号成功发射三位航天员顺利抵达空间站后不久,由新华社和腾讯联合打造、专门面向航天主题和场景研发的数字航天员、国内首个进入多场景运营的数字人“小诤”亮相,带用户漫游三大空间站。截至目前“小诤”已经完成了多次太空报道,涵盖了“天问一号”火星探测任务和中国空间站。这种效率从侧面说明了当前数字人技术的成熟度已经到达了一定的水平。

除了功能性的应用以外,数字人同样具有“人文关怀”的功用。通过基于真人形象,打造出具有高度关怀感和真实感的多模态AI助手型虚拟数字人。这种虚拟数字人在特定关怀类场景乃至通用化交互中,可以提供顾问、关怀、陪伴,以及事务处理等服务。国外厂商已有的落地场景包括个性化理财顾问、心理咨询顾问和购物助理等。

《电子世界争霸战》发布后的近四十年,外界对于“现实和虚拟”的二元对立讨论,几乎从未停止,并在《黑客帝国》上映后达到巅峰。但此前讨论更多聚焦的是哲学层面,而技术层面能否实现,以及如何实现,还是近段时间被行业所关注。

2020年,马化腾提到了“全真互联网”的概念,他认为互联网的下一步就是虚拟世界和真实世界的大门完全敞开。一个由游戏和虚拟空间组成的经济崛起。

从相关技术的匹配和发展路径而言,游戏公司在元宇宙的崛起中将起到至关重要的作用。而最关键的一步就是持续拓展元宇宙的内容生态,即把握数字人的发展。

换句话说,如果把元宇宙当做一款3A大作,再强大的3A游戏也跟不上玩家的消耗,只有这样源源不断地创新,才能保持新鲜感,进而推动整个社会进入全真互联网时代。

现在,互联网和社交平台的超高速发展已经极大地拓展了人们的社会关系。现有形式的社交平台的发展和用户增长已经触及天花板,急需新的增长路径,才能帮助互联网行业重新找回快速增长的节奏。元宇宙和数字人技术就是这样的路径关键点。只不过,而要想真正实现类似《失控玩家》和《头号玩家》电影中的游戏世界,元宇宙还有一段很长的路要走。

但现在我们做出的关于元宇宙的投资和决策,都将决定元宇宙的未来面貌。一篇来自Medium的文章提到,元宇宙的构成与“硬件”“内容”以及“构成世界的底层框架”息息相关,涵盖了元宇宙的体验层、发现层、创作者经济层、空间计算层、去中心化层、人机界面层以及基础设施层七大要素。在目前的发展阶段下,尽管各大互联网巨头入局,但元宇宙的硬件层面尚未取得质变;因此内容和构成世界的底层框架就成为了当下进军元宇宙的发力点。

毫无疑问,元宇宙的“沉浸感”是体验的至高标准。想要创造这种“沉浸感”,需要“高保真”的游戏环境。因此,数字人技术+突破性的硬件是进入元宇宙时代的先决条件,数字人技术可以赋能组成元宇宙的各种元素,突破性的硬件能够将人的意识从外部世界和虚拟世界进行串联,二者结合才可搭建出一个与现实世界别无二致的虚拟世界。

截至目前,数字人的高保真技术日渐成熟。从数字人的外形构造来看,不论是Epic Game还是NExT Studios均已经在数字人面部的细节还原方面取得众多进展,且达到了实用的水平。随着拍照式相机阵列扫描重建得到飞速发展,目前可实现毫秒级高速拍照扫描,成为当前人物建模主流方式,并成功应用于游戏、电影、传媒等行业。同时,通过实时动作捕捉系统将人物动作还原,也使得各类型互动体验成为了可能。

数字人的“高保真”,也体现在整体环境和交互体验的深度还原:运用虚幻引擎、实时光线追踪技术等等,创作出更为真实、沉浸感更强的模拟效果和视觉体验。

作为新生事物,数字人虽然进入实用阶段,但仍尚属“稚嫩”。关于数字人未来发展的方向,也需要更多地思考。谁也无法预测数字人和元宇宙最后的发展结果。我们目前对于元宇宙的众多想象,也只是基于影视作品的天马行空。

元宇宙的实现,需要人工智能来进行源源不断的内容供给,利用AI推动各行各业完成现实世界和虚拟世界的链接;也需要VR/AR技术的持续进步,不断加强用户的沉浸感和体验感;需要心理学知识,让元宇宙超脱出“数字组成的冰冷世界”的概念,数字也同样具有温度;甚至,元宇宙的实现也需要区块链,保障新世界中的身份、资产、社会关系,以建立元宇宙的公信力。

就目前而言,关于元宇宙我们能做的,就是先搭建好组成宇宙中各个元素的基础。

但总有一天,我们会在《电子世界争霸战》所描绘的那个世界中相见。


About Joyk


Aggregate valuable and interesting links.
Joyk means Joy of geeK