深度学习(三十九)——视频处理
source link: http://antkillerfarm.github.io/dl/2018/03/29/Deep_Learning_39.html
Go to the source link to view the article. You can view the picture content, updated content and better typesetting reading experience. If the link is broken, please click the button below to view the snapshot at that time.
视频目标分割
视频目标分割任务和语义分割有两个基本区别:
1.视频目标分割任务分割的是一般的、非语义的目标;
2.视频目标分割添加了一个时序模块:它的任务是在视频的每一连续帧中寻找感兴趣目标的对应像素。
上图是Segmentation的细分,其中的每一个叶子都有一个示例数据集。
基于视频任务的特性,我们可以将问题分成两个子类:
无监督(亦称作视频显著性检测):寻找并分割视频中的主要目标。这意味着算法需要自行决定哪个物体才是“主要的”。
半监督:在输入中(只)给出视频第一帧的正确分割掩膜,然后在之后的每一连续帧中分割标注的目标。
视频理解中的三大基础领域:动作识别(Action Recognition)、时序动作定位(Temporal Action Localization)和视频 Embedding。
https://mp.weixin.qq.com/s/ATKmdw50V50_gczEVfIZSw
视频理解综述:动作识别、时序动作定位、视频Embedding
http://mp.weixin.qq.com/s/pGrzmq5aGoLb2uiJRYAXVw
一文概览视频目标分割
https://www.zhihu.com/question/52185576
视频中的目标检测与图像中的目标检测具体有什么区别?
https://mp.weixin.qq.com/s/0NpTiwNRpd92mFCtXw1oQw
CVPR 2019视频描述(video caption)相关论文总结
https://mp.weixin.qq.com/s/nZVIVJ9z0AWA8VFouNpafg
深度学习之视频摘要简述
https://mp.weixin.qq.com/s/z1APyCxlOEPHn48OeJAHkQ
基于深度学习的视频内容识别
https://mp.weixin.qq.com/s/XFlcGZRrxmmUDZXg-ijFDA
视频识别SOTA模型都在这了—PySlowFast! Facebook AI Research开源视频理解前沿算法代码库
https://mp.weixin.qq.com/s/ovjoHCcR1xYb9N6kyFJUTg
视频广告段落检测——从一个偏门说计算机视觉的发展历史
https://mp.weixin.qq.com/s/iqLHjbmLOmvfEeEUB_SqSA
计算机视觉视频理解领域的经典方法和最新成果
https://mp.weixin.qq.com/s/lBu1q5Pyw9dZIxSYXUp2pw
视频语义分割介绍
https://mp.weixin.qq.com/s/qtRV9Sb54o8TnDEhLlB69Q
基于视频的目标检测的发展
https://zhuanlan.zhihu.com/p/59915784
Video Action Recognition的近期进展
https://mp.weixin.qq.com/s/k4Ilj11wbuj5oIXLHo-5ew
《视频目标分割与跟踪》最新39页综述论文
https://mp.weixin.qq.com/s/GCCqIm4Q7UfUhhiqFbBS3g
Pytorch视频分类教程
https://mp.weixin.qq.com/s/ua8V2g2uZAditKui-IcoKw
物体检测算法在视频中的应用
https://mp.weixin.qq.com/s/pfAVyS_JQLqsXLYdX2m8IQ
基于深度学习的视频目标检测综述
https://mp.weixin.qq.com/s/NcA178JxgZLrAE1efBG2dA
深度神经网络在视频编码中的应用
https://mp.weixin.qq.com/s?__biz=MzU2OTA0NzE2NA==&mid=2247515277&idx=1&sn=e6466ace50c46b66824747c79ea4d6f1
视频摘要最新综述文章
https://blog.csdn.net/sinat_35177634/article/details/89601950
CVPR 2019视频描述(video caption)相关论文总结
https://zhuanlan.zhihu.com/p/91986833
视频综合理解:行为识别、场景识别以及视频综述
https://mp.weixin.qq.com/s/noljXreGfoMfiZb_n90R3w
模仿人类的印象机制,商汤提出精确实时的视频目标检测方法
http://mp.weixin.qq.com/s/-Av3-ZNi6UGlKNv_jduAeQ
微软新论文:如何利用深度特征流提高视频识别准确率?
https://mp.weixin.qq.com/s/WMakTEN68KPi7X9kMQetiw
OpenAI:3段视频演示无人驾驶目标检测强大的对抗性样本!
https://mp.weixin.qq.com/s/j5YPHYEPioLiEIDc6lK3kA
在线视频衣物精确检索技术,开启刷剧败明星同款时代
https://mp.weixin.qq.com/s/CXKuSMi0Vd43BGDf5BgoqA
弱监督视频物体识别新方法:香港科技大学联合CMU提出TD-Graph LSTM
https://mp.weixin.qq.com/s/7ccEaDRngVo42OSU6FBlVg
从视频到语句,优必选获TRECVID 2017子任务冠军
https://mp.weixin.qq.com/s/XorPkuIdhRNI1zGLwg-55A
斯坦福新深度学习系统NoScope:视频对象检测快1000倍
https://mp.weixin.qq.com/s/7w5nYWfZO-YOJ4cA47kQXg
无监督视频物体分割新思路:实例嵌入迁移
https://mp.weixin.qq.com/s/PhMPa-e4sbzqWKmFzRZE4Q
实时替换视频背景:谷歌展示全新移动端分割技术
https://mp.weixin.qq.com/s/0JgwBizaCwvPP9TfLKTang
密歇根大学&谷歌提出TAL-Net:将Faster R-CNN泛化至视频动作定位中
http://mp.weixin.qq.com/s/LAgDobWyK0SOH08GCLXG7A
减少30%流量,增加清晰度:MIT提出人工智能视频缓存新算法
https://mp.weixin.qq.com/s/_ZmbwM-lmS0o2DjAAc_TWQ
美图云+中科院AAAI2018:视频语义理解的类脑智能NOASSOM
https://mp.weixin.qq.com/s/LzKsD_vFlA1n-TYOGJkDZg
商汤科技开源DAVIS2017视频目标分割冠军代码
https://mp.weixin.qq.com/s/FiAju9F_MWexstP7FrIquw
凭一张照片找到视频中你所有的镜头,包括背影
https://mp.weixin.qq.com/s/3H0ZJjnPsh1BzALmG0W7og
DAVIS2017视频目标分割冠军代码开源了
https://mp.weixin.qq.com/s/ZqnfSL6U5E9NzE15QMdxtg
腾讯AI Lab提出视频再定位任务,准确定位相关视频内容
https://mp.weixin.qq.com/s/6MXLtUDi_idMYqbHARkbcg
港中文林达华团队提出计算机视觉新方向:电影情节分析
https://mp.weixin.qq.com/s/Np4xyvPrncd7MJ9q1WShBA
Python视频深度学习:计算任意影片中所有演员出镜时间
https://mp.weixin.qq.com/s/Nt4QLX_lbHhszb8fFlmOLA
DeepVS:基于深度学习的视频显著性方法
https://mp.weixin.qq.com/s/NgsSQS6opjOsusTIr9Vx-w
腾讯AI Lab、MIT等机构提出TVNet:可端到端学习视频的运动表征
https://mp.weixin.qq.com/s/26OZ5sLK3floF8I1SNIKuA
时空建模新文解读:用于高效视频理解的TSM
https://mp.weixin.qq.com/s/TzNqZNEPBewR7neU7Or9nQ
更侧重工业的应用:PRCV2018美图短视频实时分类挑战赛冠军技术方案
https://mp.weixin.qq.com/s/MzVPesFK0vJ1UuQPPSSN2w
百度、MIT等提出StNet:局部+全局的视频时空联合建模
https://mp.weixin.qq.com/s/UeQc3orm2ooZ5zlvrSLzOw
视频内容理解在Hulu的应用与实践
https://mp.weixin.qq.com/s/syZObdxjPv6jq3B_mgP9Sw
拒绝“不可描述”!爱奇艺短视频软色情识别技术解析
https://mp.weixin.qq.com/s/8YpyfdhDypSZOP3dQegQdQ
谷歌大脑提出基于流的视频预测模型,可产生高质量随机预测结果
https://mp.weixin.qq.com/s/-FF3tuEB2V8RlQCjQhu5Bg
人大ML研究组提出新的视频测谎算法
https://mp.weixin.qq.com/s/T-Rg9xLfdYmV8bJESK0h8g
快速端到端嵌入学习用于视频中的目标分割
https://mp.weixin.qq.com/s/pKSrokV_j8Repa-JMloUHg
Google又发大招:高效实时实现视频目标检测
https://mp.weixin.qq.com/s/ySAfdII8291hvTxUBtE5qA
详解爱奇艺ZoomAI视频增强技术的应用
https://mp.weixin.qq.com/s/l6WMJnrGNNK4A1cTD2drcg
视频跟踪新思路,完全无需手工标注。这是一篇Visual Tracking和Optical Flow Estimation相互结合的论文
https://mp.weixin.qq.com/s/NQSJvlcjOAoIZjI2cgjhkw
谷歌AI:根据视频生成深度图,效果堪比激光雷达
https://mp.weixin.qq.com/s/fxKHMVRYCR9CycifjEnArQ
视频显著性目标检测
https://mp.weixin.qq.com/s/oSoCIAEF78iKIxLxj2H1mA
基于光流的视频目标检测系列文章解读
https://mp.weixin.qq.com/s/1tcoGGbJnnWARu-2wefWdQ
不同视角构造cycle-consistency,降低视频标注成本
https://mp.weixin.qq.com/s/pDMBnX3CeQbv8hr-79Mvvg
商汤EDVR算法获NTIRE 2019视频恢复比赛全部四项冠军
https://mp.weixin.qq.com/s/BtIYc7SSi0E6mT3muV6NhQ
视频编辑利器,不喜欢就框除!开源视频物体移除软件video object removal
https://mp.weixin.qq.com/s/YwZijgTbhd2ILiVxug1dWg
框一下就能从视频隐身,这是现实版的“隐身衣”?
https://zhuanlan.zhihu.com/p/73599727
基于深度学习的视频帧内插技术
https://mp.weixin.qq.com/s/PnDjXF_ZPYPJ3cgZ_w6v-g
视频分类/行为识别网络和数据集上新
https://mp.weixin.qq.com/s/cNvQy4MW9vHTbUPsrqnUdA
视频PS神器!人物隐身、水印去除,简直像重拍了一遍,这项登上CVPR的研究刚刚开源了
https://mp.weixin.qq.com/s/umLqkfSDCBUGaEa0yygAIw
有了这款DVD-GAN,DeepMind就生成了逼真视频
https://mp.weixin.qq.com/s/7ygF4zxZxp0Iz7KRDdWebg
R-C3D视频活动检测
https://mp.weixin.qq.com/s/N6nL9D1wjsBNzxedXX3qNQ
Hulu在视频内容理解上的应用和最佳实践
https://mp.weixin.qq.com/s/0z6jrEYTdIUSOYzW3gA9FQ
ActivityNet 挑战赛冠军方案—时序动作提名,边界匹配网络详解
https://mp.weixin.qq.com/s/r47N4HVAydNeBOTtP-iruQ
阿里文娱资深算法专家:视频物体分割算法的三个方向与最新应用
https://zhuanlan.zhihu.com/p/75444151
时序动作提名:边界匹配网络详解
https://mp.weixin.qq.com/s/8x1ne425aRb2aqP8dSrClg
玩王者荣耀用不好英雄?两阶段算法帮你精准推荐精彩视频
https://mp.weixin.qq.com/s/YL08krIuf0WOz8KsoBYhew
25个视频神同步,还能给视频声音移花接木,谷歌开源最新自监督算法
https://mp.weixin.qq.com/s/THUjd-wXI6_57mdw4XfYUQ
商汤-港中文MMLab开源图像视频超分辨率工具箱MMSR
https://zhuanlan.zhihu.com/p/209133135
基于深度学习的视频超分辨率技术:全面调研(2015-2020)
https://mp.weixin.qq.com/s/9YSO1RW8mgyihrZWbEe20w
视频超分辨率研究方法
https://mp.weixin.qq.com/s/XZ-fn_Xd7vVoLiVr6Esb3g
Ranking Attention-适用于视频分割的全新Attention机制
https://zhuanlan.zhihu.com/p/79719747
Super SloMo,基于光流和U-Net的视频插值
https://mp.weixin.qq.com/s/8uxeOqcUvnZcKHv7qXwWJQ
如何在视频里任意抠图?阿里工程师做到了!
https://mp.weixin.qq.com/s/HHS888HA0slvjkkkI8HU8w
字节实习生开发的AI,实现4K60帧视频实时抠图
https://zhuanlan.zhihu.com/p/83604007
Deep Burst Denoising/RFCN
https://mp.weixin.qq.com/s/dl8kbhKUCHzwJ-5lSv6VMw
高清彩色开国典礼将上映:技术加持之下,历史不会褪色
https://mp.weixin.qq.com/s/-lNM3bVxK8YtmPWdXpSf5A
UC信息流视频标签识别技术
https://mp.weixin.qq.com/s?__biz=MzI0ODcxODk5OA==&mid=2247508659&idx=1&sn=77bd5db94ffc7737d937e9b2cbda84cf
快手王华彦:端上视觉技术的极致效率及其短视频应用实践
https://mp.weixin.qq.com/s/JahD1ON5ym0_ldc7MiJz7A
让视频里的你完全消失,Adobe最新SOTA模型实现无痕修图,无需先验知识
https://mp.weixin.qq.com/s/xocs_UI5HzgFZtTPWABRKw
使用时间循环一致性学习(TCC)理解视频内容
https://mp.weixin.qq.com/s/xjQtVE-i-n1N9a0AsR6BWw
网络运行时间提高100倍,Google使用的AI视频理解架构有多强?
https://mp.weixin.qq.com/s/5qC70NoTBQ95vjI4cGl66g
通过未标记视频进行跨模态时间表征学习
https://mp.weixin.qq.com/s/Wn-5VD2-YWwVUWCMEy-lvw
AI碰撞短视频,从推荐到直播,快手探索了这些ML新思路
Recommend
About Joyk
Aggregate valuable and interesting links.
Joyk means Joy of geeK