【精华】计算机视觉研究方向综述

文章目录

1 目标检测

1 PP-YOLOE

高精度云边一体 SOTA 目标检测模型 PP-YOLOE，分 s/m/l/x 版本，l 版本 COCO test2017 数据集精度 51.6%，V100 预测速度 78.1 FPS，支持混合精度训练，训练较 PP-YOLOv2 加速 33%，全系列多尺度模型，满足不同硬件算力需求，可适配服务器、边缘端 GPU 及其他服务器端 AI 加速卡。

优化过程

PP-YOLO( 45.9% /V100 72.9FPS ) ----> PP-YOLOv2( 49.5% /V100 68.9FPS ) ----> PP-YOLOE( 51.6% /V100 78.1FPS )

2 PP-PicoDet 增强版 (PicoDet-XS)

边缘端和 CPU 端超轻量 SOTA 目标检测模型 PP-PicoDet 增强版， 精度提升2% 左右，CPU 预测速度提升63% ，新增 参数量0.7M 的 PicoDet-XS 模型，提供模型稀疏化和量化功能，便于模型加速，各类硬件无需单独开发后处理模块，降低部署门槛。

3 Transformer 检测系列模型

4 YOLOv5

5 YOLOX

YOLOX 目标检测模型，支持 nano/tiny/s/m/l/x 版本，x 版本 COCO val2017 数据集精度 51.8%。

6 YOLOv6

7 YOLOv7

7 旋转框检测 S2ANet

S2ANet

2 实例分割

1 Mask RCNN

2 SOLOv2

3 多目标跟踪

1 PP-Tracking

实时跟踪系统 PP-Tracking，覆盖单、多镜头下行人、车辆、多类别跟踪，对小目标、密集型特殊优化，提供人、车流量技术解决方案。

2 DeepSORT

DeepSORT

JDE

4 FairMOT

FairMOT

5 ByteTrack

ByteTrack

4 关键点检测

1 PP-TinyPose

PP-TinyPose

轻量级关键点特色模型 PP-TinyPose，单人场景 FP16 推理可达 122FPS、51.8AP，具有精度高速度快、检测人数无限制、微小目标效果好的优势。

2 HigherHRNet

3 HRNet

5 语义分割

1 PP-HumanSeg v2

实时人像分割模型 PP-HumanSeg v2，推理速度提升 45.5%，移动端达到 64.26 FPS，分割精度更高、通用型更强、零成本开箱即用。

2 PP-LiteSeg

超轻量级语义分割模型 PP-LiteSeg

3 OCRNet

OCRNet

6 交互式分割

1 EISeg

EISeg

2 RITM

3 EdgeFlow

7 Matting

1 PP-Matting

高精度抠图模型 PP-Matting

DIM

3 MODNet

MODNet

4 PP-HumanMatting

PP-HumanMatting

8 全景分割

1 Panoptic-DeepLab

Panoptic-DeepLab

1 PP-OCRv3

速度可比情况下，PP-OCRv3 中文场景效果相比于 PP-OCRv2 再提升 5%，英文场景提升 11%，80 语种多语言模型平均识别准确率提升 5% 以上；

2 PP-OCRv2

PP-OCRv2 在 CPU 推理速度相比于 PP-OCR server 提升 220%；效果相比于 PP-OCR mobile 提升 7%。

3 PP-Structure

文档结构分析 PP-Structure 工具包，支持版面分析与表格识别（含 Excel 导出）

10 图像分类

11 应用案例

1 PaddleDetection

1 行人分析工具 PP-Human v2

四大产业特色功能：高性能易扩展的五大复杂行为识别、闪电级人体属性识别、一行代码即可实现的人流检测与轨迹留存以及高精度跨镜跟踪
底层核心算法性能强劲：覆盖行人检测、跟踪、属性三类核心算法能力，对目标人数、光线、背景均无限制
极低使用门槛：提供保姆级全流程开发及模型优化策略、一行命令完成推理、兼容各类数据输入格式

2 基于 PP-PicoDet 增强版的路面垃圾检测

基于 PP-PicoDet 增强版的路面垃圾检测

3 基于 PP-PicoDet 的通信塔识别及 Android 端部署

基于 PP-PicoDet 的通信塔识别及 Android 端部署

4 基于 Faster-RCNN 的瓷砖表面瑕疵检测

基于 Faster-RCNN 的瓷砖表面瑕疵检测

5 基于 PaddleDetection 的 PCB 瑕疵检测

基于 PaddleDetection 的 PCB 瑕疵检测

6 基于 FairMOT 实现人流量统计

基于 FairMOT 实现人流量统计

7 基于 YOLOv3 实现跌倒检测

基于 YOLOv3 实现跌倒检测

8 基于 PP-PicoDetv2 的路面垃圾检测

基于 PP-PicoDetv2 的路面垃圾检测

9 基于人体关键点检测的合规检测

基于人体关键点检测的合规检测

2 PaddleSeg

1 10 分钟上手 PaddleSeg

10 分钟上手 PaddleSeg

2 PaddleSeg 实战之人像分割

PaddleSeg 实战之人像分割

3 PaddleSeg 实战之小数据集 3D 椎骨分割

PaddleSeg 实战之小数据集 3D 椎骨分割

4 PaddleSeg 实战之车道线图像分割

PaddleSeg 实战之车道线图像分割

5 PaddleSeg 动态图 API 使用教程

PaddleSeg 动态图 API 使用教程

3 PaddleOCR

行业	类别	亮点	文档说明	模型下载
制造	数码管识别	数码管数据合成、漏识别调优	光功率计数码管字符识别	下载链接
金融	通用表单识别	多模态通用表单结构化提取	多模态表单识别	下载链接
交通	车牌识别	多角度图像处理、轻量模型、端侧部署	轻量级车牌识别	下载链接

4 PaddleClas

PULC 超轻量图像分类方案快速体验：点击这里

PP-ShiTu 图像识别快速体验：点击这里

赏

【精华】计算机视觉研究方向综述

【精华】计算机视觉研究方向综述

1 目标检测

1 PP-YOLOE

2 PP-PicoDet 增强版 (PicoDet-XS)

3 Transformer 检测系列模型

1 DETR

2 Deformable DETR

3 Sparse RCNN

4 YOLOv5

5 YOLOX

6 YOLOv6

7 YOLOv7

7 旋转框检测 S2ANet

2 实例分割

1 Mask RCNN

2 SOLOv2

3 多目标跟踪

1 PP-Tracking

2 DeepSORT

4 FairMOT

5 ByteTrack

4 关键点检测

1 PP-TinyPose

2 HigherHRNet

3 HRNet

5 语义分割

1 PP-HumanSeg v2

2 PP-LiteSeg

3 OCRNet

6 交互式分割

1 EISeg

2 RITM

3 EdgeFlow

7 Matting

1 PP-Matting

3 MODNet

4 PP-HumanMatting

8 全景分割

1 Panoptic-DeepLab

1 PP-OCRv3

2 PP-OCRv2

3 PP-Structure

10 图像分类

11 应用案例

1 PaddleDetection

1 行人分析工具 PP-Human v2

2 基于 PP-PicoDet 增强版的路面垃圾检测

3 基于 PP-PicoDet 的通信塔识别及 Android 端部署

4 基于 Faster-RCNN 的瓷砖表面瑕疵检测

5 基于 PaddleDetection 的 PCB 瑕疵检测

6 基于 FairMOT 实现人流量统计

7 基于 YOLOv3 实现跌倒检测

8 基于 PP-PicoDetv2 的路面垃圾检测

9 基于人体关键点检测的合规检测

2 PaddleSeg

1 10 分钟上手 PaddleSeg

2 PaddleSeg 实战之人像分割

3 PaddleSeg 实战之小数据集 3D 椎骨分割

4 PaddleSeg 实战之车道线图像分割

5 PaddleSeg 动态图 API 使用教程

3 PaddleOCR

4 PaddleClas

Recommend

About Joyk