9

文生音频新贵融资5亿,半年估值涨10倍,2年跑出一个AI独角兽

 7 months ago
source link: https://www.36kr.com/p/2638097755111680
Go to the source link to view the article. You can view the picture content, updated content and better typesetting reading experience. If the link is broken, please click the button below to view the snapshot at that time.
neoserver,ios ssh client

文生音频新贵融资5亿,半年估值涨10倍,2年跑出一个AI独角兽

新智元·2024-02-07 07:21
ElevenLabs宣布B轮8000万刀融资,估值超过10亿美元,跻身独角兽行列。

AI初创公司里又跑出了一个独角兽!

最近,成立刚满两年的AI音频公司ElevenLabs宣布,他们获得了8000万美元的B轮融资,估值超过10亿美元!

这轮融资由Andreessen Horowitz、Nat Friedman、Daniel Gross 联合领投,红杉资本、Smash Capital、SV Angel、BroadLight Capital 和 Credo Ventures 跟投。

interlace,1

而去年6月份,他们的A轮融资,估值还只有1亿美元,半年多一点的时间估值暴增10倍!

ElevenLabs由前Google机器学习工程师Piotr Dabkowski和前Palantir策略分析师Staniszewski于2022年1月共同创立,大约一年前才推出了自己第一个测试版产品。

然后再过了一年,这个40人的团队已经成了AI音频赛道上绝对的领导者。

interlace,1

公司全体成员合影

而且绝大多数员工都处于在远程办公的状态,以至于公司到现在为止都没有正式的办公地点。媒体在报道他们融资的新闻时,关于总部的位置都没有一个明确的说法。

interlace,1
interlace,1

ElevenLabs最主要的产品,就是文生语音工具。

用户只用提供文本,ElevenLabs就能用AI生成非常逼真的语音,不论是视频,游戏,有声读物,AI伴侣,都能用上他们家的产品。

interlace,1

包括像网易,Paradox Interactive这样的游戏开发商,《华盛顿邮报》这样的传统媒体,都已经在大量使用他们的技术。

根据ElevenLabs自己的说法,世界500强的企业已经有超过40%成为了他的客户了。

产品用户超100万,未来将打破语言的界限

ElevenLabs目前的功能主要是3大块,Speech就是使用最多的就是文生音频功能,可以支持丰富的声音元素的调节和重构。

Voices可以让用户用AI建立一个自己专有的声音,或者是复制自己的声音,再生成新的内容。

Dubbing可以直接给现成的视频进行AI配音和翻译。

interlace,1

我们先来看看音频的生成。

interlace,1

在这个功能中,用户只需要将自己想要讲述的内容写在文本框中,配合非常多的定制化选项,就能生成一段非常自然的语音了。

interlace,1

而在Dubbing配音功能中,它可以支持将一段视频直接翻译为其他29国的语言。

interlace,1

任何一个没有经验的用户,几乎只要10分钟就能上手,生成效果非常好的语音内容。

这种易用性,加上产品的自然流畅的效果,在短时间内吸引如此多的付费用户也就不足为奇了。

打造一个独角兽只用两年

ElevenLabs创始人Staniszewski说,他和在波兰长大的Dabkowski从小看了很多配音很差的美国电影,这启发了他们用AI来做一个配音工具,后来就成为了现在的ElevenLabs。

interlace,1

Piotr Dabkowski

interlace,1

Staniszewski

他们在英国求学期间就是非常好的朋友,两人分别在帝国理工学院和牛津大学读完本科,Dabkowski接着去剑桥读了硕士,然后去到谷歌工作。

Staniszewski本科毕业就一直工作,一直到从Palantir离职创业。

interlace,1

Staniszewski的教育和工作经历

interlace,1

Piotr Dabkowski的教育和工作经历

ElevenLabs刚上线的时候,它的主打功能是通过用户提供的英语语音文本,合成自然的英语语音。

因为语音的效果和其他类似的产品相比非常好,公司一下子就破圈了。

短时间就积累的大量的用户,于是他们进一步加快了新功能的集成。

然后,ElevenLabs将服务扩展到11种语言,包括波兰语、德语、西班牙语、法语、意大利语、葡萄牙语和印地语。

同时,该公司还开发了一个语音实验室,用户可以在其中克隆自己的声音,或者通过生成全新随机采样声音参数来合成声音。

这使他们能够将自己选择的文本(例如播客的脚本)转换为他们喜欢的语音和语言的音频内容。

现在,随着用户群的不断增长,ElevenLabs 也在寻求产品方面的创新,为用户提供最好的功能合集。

在宣布此次融资的同时,他们也宣布未来将Dubbing功能进一步扩展,将简单的视频翻译扩展成一个完整的视频工作室。

配音工作室工作流程使用户能够配音整个电影,以及生成和编辑其转录本、翻译和时间码,从而提供对内容制作的额外控制。这些功能补充了现有的 AI 配音功能,可实现跨29种语言的自动化端到端视频翻译。

参考资料:

https://arc.net/l/quote/tjopbbdw

本文来自微信公众号“新智元”(ID:AI_era),编辑:润,36氪经授权发布。

该文观点仅代表作者本人,36氪平台仅提供信息存储空间服务。


Recommend

About Joyk


Aggregate valuable and interesting links.
Joyk means Joy of geeK