9

【精华】计算机视觉研究方向综述

 2 years ago
source link: https://leezhao415.github.io/2022/07/26/%E3%80%90%E7%B2%BE%E5%8D%8E%E3%80%91%E8%AE%A1%E7%AE%97%E6%9C%BA%E8%A7%86%E8%A7%89%E7%A0%94%E7%A9%B6%E6%96%B9%E5%90%91%E7%BB%BC%E8%BF%B0/
Go to the source link to view the article. You can view the picture content, updated content and better typesetting reading experience. If the link is broken, please click the button below to view the snapshot at that time.
neoserver,ios ssh client

【精华】计算机视觉研究方向综述


文章目录


1 目标检测

img
1 PP-YOLOE

高精度云边一体 SOTA 目标检测模型 PP-YOLOE,分 s/m/l/x 版本,l 版本 COCO test2017 数据集精度 51.6%,V100 预测速度 78.1 FPS,支持混合精度训练,训练较 PP-YOLOv2 加速 33%,全系列多尺度模型,满足不同硬件算力需求,可适配服务器、边缘端 GPU 及其他服务器端 AI 加速卡。

优化过程

PP-YOLO( 45.9% /V100 72.9FPS ) ----> PP-YOLOv2( 49.5% /V100 68.9FPS ) ----> PP-YOLOE( 51.6% /V100 78.1FPS )

2 PP-PicoDet 增强版 (PicoDet-XS)

边缘端和 CPU 端超轻量 SOTA 目标检测模型 PP-PicoDet 增强版精度提升2% 左右,CPU 预测速度提升63% ,新增 参数量0.7M 的 PicoDet-XS 模型,提供模型稀疏化和量化功能,便于模型加速,各类硬件无需单独开发后处理模块,降低部署门槛。

3 Transformer 检测系列模型
1 DETR

DETR

2 Deformable DETR

Deformable DETR

3 Sparse RCNN

Sparse RCNN

4 YOLOv5
5 YOLOX

YOLOX 目标检测模型,支持 nano/tiny/s/m/l/x 版本,x 版本 COCO val2017 数据集精度 51.8%。

6 YOLOv6
7 YOLOv7
在这里插入图片描述
7 旋转框检测 S2ANet

S2ANet

2 实例分割

1 Mask RCNN
2 SOLOv2

3 多目标跟踪

1 PP-Tracking

实时跟踪系统 PP-Tracking,覆盖单、多镜头下行人、车辆、多类别跟踪,对小目标、密集型特殊优化,提供人、车流量技术解决方案。

2 DeepSORT

DeepSORT

JDE

4 FairMOT

FairMOT

5 ByteTrack

ByteTrack

4 关键点检测

1 PP-TinyPose

PP-TinyPose

轻量级关键点特色模型 PP-TinyPose,单人场景 FP16 推理可达 122FPS、51.8AP,具有精度高速度快、检测人数无限制、微小目标效果好的优势。

2 HigherHRNet
3 HRNet

5 语义分割

img
1 PP-HumanSeg v2

实时人像分割模型 PP-HumanSeg v2,推理速度提升 45.5%,移动端达到 64.26 FPS,分割精度更高、通用型更强、零成本开箱即用。

2 PP-LiteSeg

超轻量级语义分割模型 PP-LiteSeg

3 OCRNet

OCRNet

6 交互式分割

1 EISeg

EISeg

2 RITM
3 EdgeFlow

7 Matting

1 PP-Matting

高精度抠图模型 PP-Matting

DIM

3 MODNet

MODNet

4 PP-HumanMatting

PP-HumanMatting

8 全景分割

1 Panoptic-DeepLab

Panoptic-DeepLab

img
1 PP-OCRv3

速度可比情况下,PP-OCRv3 中文场景效果相比于 PP-OCRv2 再提升 5%,英文场景提升 11%,80 语种多语言模型平均识别准确率提升 5% 以上;

2 PP-OCRv2

PP-OCRv2 在 CPU 推理速度相比于 PP-OCR server 提升 220%;效果相比于 PP-OCR mobile 提升 7%。

3 PP-Structure

文档结构分析 PP-Structure 工具包,支持版面分析与表格识别(含 Excel 导出)

10 图像分类

img

11 应用案例

1 PaddleDetection
1 行人分析工具 PP-Human v2
  • 四大产业特色功能:高性能易扩展的五大复杂行为识别、闪电级人体属性识别、一行代码即可实现的人流检测与轨迹留存以及高精度跨镜跟踪
  • 底层核心算法性能强劲:覆盖行人检测、跟踪、属性三类核心算法能力,对目标人数、光线、背景均无限制
  • 极低使用门槛:提供保姆级全流程开发及模型优化策略、一行命令完成推理、兼容各类数据输入格式
2 基于 PP-PicoDet 增强版的路面垃圾检测

基于 PP-PicoDet 增强版的路面垃圾检测

3 基于 PP-PicoDet 的通信塔识别及 Android 端部署

基于 PP-PicoDet 的通信塔识别及 Android 端部署

4 基于 Faster-RCNN 的瓷砖表面瑕疵检测

基于 Faster-RCNN 的瓷砖表面瑕疵检测

5 基于 PaddleDetection 的 PCB 瑕疵检测

基于 PaddleDetection 的 PCB 瑕疵检测

6 基于 FairMOT 实现人流量统计

基于 FairMOT 实现人流量统计

7 基于 YOLOv3 实现跌倒检测

基于 YOLOv3 实现跌倒检测

8 基于 PP-PicoDetv2 的路面垃圾检测

基于 PP-PicoDetv2 的路面垃圾检测

9 基于人体关键点检测的合规检测

基于人体关键点检测的合规检测

2 PaddleSeg
1 10 分钟上手 PaddleSeg

10 分钟上手 PaddleSeg

2 PaddleSeg 实战之人像分割

PaddleSeg 实战之人像分割

3 PaddleSeg 实战之小数据集 3D 椎骨分割

PaddleSeg 实战之小数据集 3D 椎骨分割

4 PaddleSeg 实战之车道线图像分割

PaddleSeg 实战之车道线图像分割

5 PaddleSeg 动态图 API 使用教程

PaddleSeg 动态图 API 使用教程

3 PaddleOCR
行业 类别 亮点 文档说明 模型下载
制造 数码管识别 数码管数据合成、漏识别调优 光功率计数码管字符识别 下载链接
金融 通用表单识别 多模态通用表单结构化提取 多模态表单识别 下载链接
交通 车牌识别 多角度图像处理、轻量模型、端侧部署 轻量级车牌识别 下载链接
4 PaddleClas

PULC 超轻量图像分类方案快速体验:点击这里

PP-ShiTu 图像识别快速体验:点击这里


About Joyk


Aggregate valuable and interesting links.
Joyk means Joy of geeK