4

火山引擎首发“会表演”的有声内容创作平台-品玩

 1 year ago
source link: https://www.pingwest.com/a/286587
Go to the source link to view the article. You can view the picture content, updated content and better typesetting reading experience. If the link is broken, please click the button below to view the snapshot at that time.
neoserver,ios ssh client

火山引擎首发“会表演”的有声内容创作平台-品玩

top-ad_1db2933.png

业界动态

火山引擎首发“会表演”的有声内容创作平台

article-thumb-lg

近日,火山引擎正式推出有声内容创作平台。该平台历经2年研发,相较传统平台,其具备多情感演绎和自动化预测两大优势。

据了解,多情感演绎上,有声内容创作平台的“声音超市”不仅提供70余款适配不同题材的精品音色,还可通过丰富的情感实现更精彩的演绎;自动化预测层面,平台的AI自动区分文本中的对话和旁白、识别对话的情感,整体合理率高达90%以上。

目前,火山引擎也针对新用户开展了5折限时特惠活动,感兴趣的用户可前往火山引擎官网获取优惠。

70余款精品音色,情感更丰富的听觉体验

火山引擎的AI配音家族已拥有70余款精品音色,覆盖各年龄段不同风格的精品音色,可适配各类题材,满足不同企业和用户的有声创作需求。

article-body

火山引擎精品“声音超市”

“副语言”也称“类语言”,是指伴随话语出现的某些声音现象,例如停顿、重音、语速、语调等,以及言语的功能性发声,例如笑声、哭腔、咳嗽等。在有声内容创作过程中,仅有音色数量上的积累并不够,为了让AI主播像专业配音演员一样演绎出更深层次的“人类情感”,火山引擎为AI音色赋予了多样的声音情绪和“副语言”

自动化预测工具,为业务降本增效

在精品AI有声内容制作中,需要人工对文本进行标注制作,尤其是长文本中,需要区分人物角色的台词以及对应情感。这一过程耗时耗力,是造成精品AI有声内容很难大规模批量生产的原因。

针对这一痛点,火山引擎自研「AI 文本理解」模型 ,自动预测人物和情感,包括提取文本中对话人物、自动判定情感等能力。

在整体听感与纯人工标注的效果齐平的前提下,AI文本理解模型可以解放大部分的标注人力,大幅缩减标注的时间和成本,为企业降本增效。

article-body

「AI 文本理解」模型

在火山引擎「AI有声内容创作平台」中,

● 用户只需将目标文本导入,由平台自动完成人物的抽取、并判定对话所属的人物和情感;

● 在配音环节,用户可以自主选择配置AI音色来匹配人物,也可选择简单标定角色人设,依据平台内置策略一键配音;

● 配音完成后,平台会根据自动预测的信息完成音频的自动合成和拼接。

article-body

AI有声内容创作平台

未来,火山引擎会持续投入有声内容创作平台的建设与创新,在底层技术和实际应用层面不断探索从“文本”到“有声作品”全流程的一体化智能创作方式,为用户打造更好的使用体验。(作者:郑远桥)


About Joyk


Aggregate valuable and interesting links.
Joyk means Joy of geeK