脸书通过无文本 NLP 实现真正语音翻译

3 years ago

source link: https://fanyi.news/textless-nlp-generating-expressive-speech-from-raw-audio
Go to the source link to view the article. You can view the picture content, updated content and better typesetting reading experience. If the link is broken, please click the button below to view the snapshot at that time.

Sep 15, 2021

脸书通过无文本 NLP 实现真正语音翻译

Facebook正在研究自己的方法，以实现真正的语音（到语音）翻译（S2ST）：他们从一开始就取消了文本翻译的步骤，只用音频。

如前所述，常见的S2ST流程包括自动语音识别（ASR）、转录、文本机器翻译（MT）和文本到语音合成为目标语言。

虽然谷歌一直在努力通过Translatotron（Google在2019年春天首次公开的项目）消除文本-机器翻译这一步骤，苹果也一直在进行类似的探索，尽管是通过更内省的方式。

正如苹果的科学家所指出，直到最近，使用文本-机器翻译的步骤仍是唯一可行的方法；任何的进展绝大部分都要归功于ASR和MT的改进（并受到其局限性的阻碍）。

所有这些先前的技术仍然依赖于文本，不过Facebook认为他们的新模型 “突破”了这一点。

Except where otherwise noted, content on this page is copyrighted.

Recommend

脸书通过无文本 NLP 实现真正语音翻译

脸书通过无文本 NLP 实现真正语音翻译

Recommend

数字人技术是“元宇宙”的任督二脉

犀有数科获超亿元A轮融资，致力于做纺织印染产业ODM的领军者和赋能者

魔方互动获5000万Pre-A轮融资，聚焦打造私域营销数智化“大脑”

擎朗智能完成2亿美元D轮融资，软银愿景基金领投

GitHub - phoboslab/q1k3: A tiny FPS for js13k

Kong 网关之资源对象详解

每一幕都精彩，2021华硕秋季新品发布

文件(数据)同步工具 : Sync Folders Pro 3.5.3 多国语言特别版

世俗化的苹果，没有创新！

一文带你深入理解 Go 语言的垃圾回收机制

About Joyk