1

全民声音克隆时代将到来!30分钟克可完成声音克隆,家人都无法分辨真假

 2 years ago
source link: http://www.mittrchina.com/news/detail/9901
Go to the source link to view the article. You can view the picture content, updated content and better typesetting reading experience. If the link is broken, please click the button below to view the snapshot at that time.
neoserver,ios ssh client
麻省理工科技评论-全民声音克隆时代将到来!30分钟克可完成声音克隆,家人都无法分辨真假
全民声音克隆时代将到来!30分钟克可完成声音克隆,家人都无法分辨真假
在过去的几十年里,许多经典的 TVB 影视片都离不开配音,如果你认为周星驰也可以讲一口流利的普通话,那就太幼稚了。
280

在过去的几十年里,许多经典的 TVB 影视片都离不开配音,如果你认为周星驰也可以讲一口流利的普通话,那就太幼稚了。

另外,如动漫等影视中最逼真的声音合成,也大多通过配音演员的声音录制来实现的,然后将他们的声音剪切成不同的片段,像做拼图一样,将这些声音“拼接”在一起,形成一整段声音。

图|繁琐的录音、配音工作(来源:Pixabay)

近年来,随着黑科技产品不断迭代升级,更多有趣的应用逐渐被发掘并实现。在语音合成领域,由于人工智能克隆技术的出现,昔日繁琐且枯燥的配音工作有望被取代。

配音将不再是专业人士的标配,任何人都可以自主且简单地克隆自己的声音,而克隆出来的声音近乎逼真。

现在,神经网络可以对目标声音的未排序数据进行训练,最终以简单快速、容易的方式,生成一段完整的音频。当人们将克隆的音频从设备中导出时,音色和音质几乎不会受到压缩和影响。尽管有部分环节还需要手动调整,但不久的将来将会更加完善。

这标志着,全民声音“克隆时代”的到来。

30 分钟克隆出的声音,家人和朋友都无法分辨真假

这种声音克隆技术使用起来并不复杂,人们只需要拿着事先准备好的台词,对着麦克风仔细录制 30 分钟左右,即可完成第一步克隆工序。录制的过程中难免会读错字,或者有发音没有很清晰等情况,这不用太担心,只要停下来重新录制这部分即可。

全部录制完之后,将生成的音频文件导出并做一定的处理,几个小时以后你克隆的声音就做好了。此刻,你可以互动界面中输入各种你想表达话语,人工智能克隆技术就可以在较短的时间内生成专属你自己的“逼真声音”。

当你将这段语音发给家人或朋友时,他们在短时间内根本无法分辨真假,这个克隆技术令许多人感到兴奋。

声音克隆技术可让经典再现

2014 年,电影《永远的蝙蝠侠》中知名演员瓦尔·基尔默(Val Kilmer),因患喉癌被迫做气管切开手术,导致声音受损。至此,瓦尔·基尔默与许多优秀影片擦肩而过,演艺生涯近乎跌入谷底。

今年 8 月,一家名为奏鸣曲(Sonantic)的初创公司声称,他们已经通过人工智能语音克隆技术创造出了瓦尔·基尔默的“原声”。Sonantic 公司的这一举动得到了市场普遍称赞,因为它为演员提供了其他解决方案无法提供的技术。

然而,社会中也有一些质疑的声音,有人认为:“这项技术有违社会道德。”另外一位艺人的经历,就是最好的反例。

在前几年,对于社会大众来说,人工智能声音克隆技术既陌生又遥远,在一些艺术品中被用于生产赝品。

今年 7 月,一部关于安东尼·波登(Anthony Bourdain)的纪录片引发了争议,据制片人向有关人士透露,他们使用人工智能声音克隆技术,为安东尼·波登制作了一段台词音频,但是当时并没有多少人注意。

该“声音门”被曝光后,许多人谴责安东尼·波登这一做法。

网红、演员和名人等声音商业化热潮将来临

毫无疑问,人工智能声音克隆技术具有很好的商业化前景。

今年年初,维睿通(Veritone)公司就推出了类似的声音克隆服务,该公司将网红、运动员和演员的在录音棚里录制好的声音,通过人工智能克隆技术获得其“逼真声音”,然后再获得网红等人的声音授权,就可以从事代言、广播节目等活动。之后网红、运动员和演员无需真人出镜即可实现同样的效果。

图|无明星出镜的音乐厅现场(来源:Pixabay)

Veritone 公司执行副总裁肖恩·金(Sean King)表示:“将一个人的声音克隆得形象逼真,以及如何对其应用场景进行扩展只是时间的问题,我们对很多不同行业带来的新机会,感到非常兴奋。”

网红、演员和名人的“声音”可以毫不费力地被出租出去,经纪公司希望能够通过克隆和出租公司旗下艺人的声音,以最小的努力轻松获得不菲的收入。

网红、演员和明星等角色的声音克隆技术,可能是未来几年最为明显的商业化应用。随着这些克隆技术的成熟,加之克隆出声音的技术壁垒较低,将会有许多初创公司可以提供类似服务。


About Joyk


Aggregate valuable and interesting links.
Joyk means Joy of geeK