5

Meta 开源多感官人工智能模型 ImageBind,整合文本、音频等数据

 1 year ago
source link: http://vr.sina.com.cn/news/hot/2023-05-10/doc-imythncx0301826.shtml
Go to the source link to view the article. You can view the picture content, updated content and better typesetting reading experience. If the link is broken, please click the button below to view the snapshot at that time.
neoserver,ios ssh client

新浪VR >

正文页

Meta 开源多感官人工智能模型 ImageBind,整合文本、音频等数据

2023-05-10 14:17:02   来源:新浪VR

  近日,Meta 公开一个新的开源人工智能模型ImageBind,该模型能够将六种类型的数据整合在一起,包括视觉(以图像和视频形式呈现);热量(红外图像);文本;音频;深度信息;以及最有趣的——由惯性测量单元(IMU)生成的运动读数。

4dd6-179d37f945367df35d7706a243e5f745.png

  该模型目前只是研究项目,还没有直接的消费者或实际应用,但它展示了未来生成式人工智能系统的可能性,这些系统能创造出沉浸式、多感官的体验。

dc7e-0ebde8e1da820ce47cf6d41f8c40575b.png

  同时,该模型也表明了 Meta 公司在人工智能研究领域的开放态度,而其竞争对手如 OpenAI 和谷歌则变得越来越封闭。

23d5-dfa52153cecedcab95456da7abb0368f.jpg
新浪声明:新浪网登载此文出于传递更多信息之目的,并不意味着赞同其观点或证实其描述。
0条评论|0人参与网友评论

About Joyk


Aggregate valuable and interesting links.
Joyk means Joy of geeK