4

微软最新视觉语言预训练(VLP)综述:基础知识、最新进展和未来趋势,适合所有阶段读者...

 1 year ago
source link: https://www.6aiq.com/article/1691634730142
Go to the source link to view the article. You can view the picture content, updated content and better typesetting reading experience. If the link is broken, please click the button below to view the snapshot at that time.
neoserver,ios ssh client

AIWeekly

via Mac OS
实时周报:https://github.com/cbamls/AI_Tutorial
微软  •  0 回帖  •  12 浏览  •  11 小时前

微软最新视觉语言预训练(VLP)综述:基础知识、最新进展和未来趋势,适合所有阶段读者阅读

image-1787a241aa504eb5af2ff752eb6c7639.png-imageStyle
本文调查了 过去几年开发的多模态智能视觉语言预训练(VLP)方法 。我们将这些方法分为三类: 用于图像文本 任务的 VLP,例如图像字幕、图像文本检索、视觉问答和视觉基础;用于核心计算机视觉 任务的 VLP,例如(开放集)图像分类、对象检测和分割;用于视频

微软最新视觉语言预训练(VLP)综述:基础知识、最新进展和未来趋势,适合所有阶段读者阅读


About Joyk


Aggregate valuable and interesting links.
Joyk means Joy of geeK