2

深度学习(二十六)——OCR(1)

 2 years ago
source link: http://antkillerfarm.github.io/dl/2018/01/03/Deep_Learning_26.html
Go to the source link to view the article. You can view the picture content, updated content and better typesetting reading experience. If the link is broken, please click the button below to view the snapshot at that time.
neoserver,ios ssh client

人脸检测/识别

人脸关键点(续)

https://mp.weixin.qq.com/s/ZrnAqDJCLtMy_qTQ2RZT0A

级联MobileNet-V2实现人脸关键点检测

https://mp.weixin.qq.com/s/ymeJPUPRAGb1FltskqBs-A

人脸关键点检测汇总(上)

https://mp.weixin.qq.com/s/N6y-RDx7VszgCVhSiwP8jA

人脸关键点检测汇总(下)

https://mp.weixin.qq.com/s/D435jGsGPkCH5j-p8Zoksg

遮挡、光照等因素的人脸关键点检测

https://mp.weixin.qq.com/s/BV3xv8mH6K7dV1nik0X5aw

PFLD:简单、快速、超高精度人脸特征点检测算法

https://mp.weixin.qq.com/s/kWRW81aAMl18GIDQWqX1Ow

PFLD:简单高效的实用人脸关键点检测算法

https://mp.weixin.qq.com/s/HpgcPkAZb9R5jF-zsGcfcw

美图影像实验室(MTlab)10000点人脸关键点技术全解读

https://mp.weixin.qq.com/s/YsuvIB56OxS9IBMQYSUdUg

深度学习AI美颜系列——人像静态/动态贴纸特效算法实现

人脸表情识别

https://mp.weixin.qq.com/s/Pcc2tVfNEY_xPo0aIuDlSA

人脸表情识别不得不读的重要论文推荐(2015-2018篇)

https://mp.weixin.qq.com/s/Z06oUe7oExgkKZ8g2_PnPw

科普人脸表情识别技术

https://mp.weixin.qq.com/s/i4HdS-lCrsv9YR39Hja8ow

深度人脸表情识别技术综述,没有比这更全的了

https://mp.weixin.qq.com/s/Ht8kFTgIWASusfSUQqoaJA

人脸表情识别研究

https://mp.weixin.qq.com/s/UFOB2V12gQQ3mV-Kh9RTUw

高精度人脸表情识别

https://mp.weixin.qq.com/s/xKOVabHYCrcadhBmldjYAg

大规模人脸表情识别

https://mp.weixin.qq.com/s/AIg0HvgEIk4Ur35IwxxAWQ

基于图片的人脸表情识别,基本概念和数据集

https://mp.weixin.qq.com/s/kWoMh-rw3MSwB0KbCa9Axg

如何做好表情识别任务的图片预处理工作

https://mp.weixin.qq.com/s/HU8_T88KEwFMsrcXHnpfQQ

基于视频的人脸表情识别数据集与基本方法

https://mp.weixin.qq.com/s/i6AS7VzWbaxlImCmjEYvMQ

基于视频的人脸表情识别不得不读的论文

https://mp.weixin.qq.com/s/EuURGTFcLho_ATT4u0ph5w

基于回归模型的人脸表情识别方法

光学字符识别(Optical Character Recognition, OCR),是指对文本资料的图像文件进行分析识别处理,获取文字及版面信息的过程。

与之类似的还有手写文本识别(Handwritten Text Recognition, HTR)。

华中科大白翔教授的实验室算是目前国内OCR做的比较好的了。

白翔的个人主页:

http://cloud.eic.hust.edu.cn:8071/~xbai/

该主页上有一个OCR方面的综述,是入门的最好资料。

http://www.cnblogs.com/lillylin/

这是一个OCR方面的blog。对白翔的论文,几乎都有阅读笔记。

https://github.com/hwalsuklee/awesome-deep-text-detection-recognition

Github:深度学习文本检测识别(OCR)精选资源汇总

近年来场景文字检测工作主要分为两大类:

  • 自上而下的方法主要借鉴的是通用物体检测的思路,并且根据文字的特点设计相应的检测模型。这类方法通常难以处理不规则文本的检测问题。

  • 自下而上的方法,通常先学习文本行的基本组成单元,然后进行单元之间的组合得到文本行检测框。由于其灵活的表征方式,对不规则形状的文本检测有着天然的优势。

自下而上的方法按照组成单元的不同又分为两类:组成单元为像素的基于分割的方法,以及组成单元为文字块的基于单元组合的方法。但是,自下而上的方法通常很难区分密集文本。密集文本检测问题是文本检测中一个广泛存在的难点问题。

tesseract

linux下可以使用tesseract作为OCR工具。当然这个工具目前使用的还是传统算法。

安装方法:

sudo apt install tesseract-ocr libtesseract-dev

使用方法:

tesseract ./111.png 1 -l chi_sim+eng

https://github.com/liuruoze/EasyPR

一个开源的中文车牌识别系统。(使用传统算法)

https://blog.csdn.net/Relocy/article/details/78629441

HyperLPR:一个基于深度学习的支持多种车牌的中文开源车牌识别框架

https://blog.csdn.net/yang_daxia/article/details/90408160

车牌识别论文survey

https://mp.weixin.qq.com/s/6dsufEVsuEILa1gSOBt32w

用于提高车牌识别的单幅噪声图像去噪和校正

https://mp.weixin.qq.com/s/ynpqG7Vfu5b8lYNW6Y-TpA

快准狠!Intel论文揭示自家车牌识别算法:LPRNet

https://mp.weixin.qq.com/s/JIoTsadw4JBkr0e40RwVQQ

这篇论文开源的车牌识别系统打败了目前最先进的商业软件

https://mp.weixin.qq.com/s/fqpZ8EHgiNupXumvTMSecw

北大团队研发“车脸”识别系统,不看车牌看外观特征实现精确识别

https://mp.weixin.qq.com/s/Shz6BmsOrtbEFtoJRSkl9A

简单车牌检测

https://mp.weixin.qq.com/s/iwPI8g2JwabwiCO8kfw8Hw

用开源工具DIY车牌识别系统

https://mp.weixin.qq.com/s/0Lh8821SbDdmM7IZS3IEBg

构建自动车牌识别系统

https://mp.weixin.qq.com/s/plUxIatkBHd2jjnsMy2nmw

基于OpenCV的车牌识别

CRNN是白翔小组的作品。

《An End-to-End Trainable Neural Network for Image-based Sequence Recognition and Its Application to Scene Text Recognition》

https://github.com/bgshih/crnn

https://mp.weixin.qq.com/s/UEGvnNwKW315S68ye4QITQ

一文带你搞懂OCR识别算法CRNN:解析+源码

https://mp.weixin.qq.com/s/XFrgmdEz1d9vg6U0hYr7Qw

中英文文字检测与识别项目(CTPN+CRNN+CTC Loss原理讲解)

ASTER

ASTER也是白翔小组的作品。

《ASTER: An Attentional Scene Text Recognizer with Flexible Rectification》

https://github.com/bgshih/aster

https://www.cnblogs.com/lillylin/p/9315180.html

论文阅读笔记

https://mp.weixin.qq.com/s/Ai43GvLsEtFrfArHUvqLXg

Aster:具有柔性矫正功能的注意力机制场景文本识别方法

https://zhuanlan.zhihu.com/p/34757009

场景文字检测—CTPN原理与实现

https://mp.weixin.qq.com/s/lV2yjhvnRLDfNbZXOSjofg

ctpn:图像文字检测方法

https://mp.weixin.qq.com/s/yxNIw8WDkJZ782HSDyfniw

深度解析文本检测网络CTPN

https://mp.weixin.qq.com/s/h7HVyGbmtLmNVJp4p0rCRQ

字符识别(OCR)相关工具/库/教材/论文等资源整理

https://mp.weixin.qq.com/s/XvtmPUbS2KV0zNXTPgtgDA

史上最全端到端场景文本检测识别资源合集(14篇重要论文 + 5个开源代码 + 49个实验结果 + 222个统计信息)

https://mp.weixin.qq.com/s/qLPfs5nHCVn5J-q3CbeECg

史上最全场景文字识别资源汇集(56篇重要论文 + 20 个开源代码 + 330 个实验结果 + 1882个统计信息)

https://mp.weixin.qq.com/s/rsJZ3R71gSAC4T501-LSQA

史上最全场景文字检测资源合集(70篇重要论文 + 15个开源代码 + 176个实验结果 +

https://mp.weixin.qq.com/s/k_pYPq4QO1aR7DImLSCgoQ

OCR100篇相关论文与代码,从文本识别到验证码识别

https://mp.weixin.qq.com/s/KFgC8zHWS7ysb9GfbkfLRA

OCR技术简介

https://zhuanlan.zhihu.com/p/65707543

文字OCR方法整理

https://mp.weixin.qq.com/s/0ysaJGNslckesv21o752FA

图像OCR年度进展

https://mp.weixin.qq.com/s/VIEsfc4qKAGsi-O9LD4mng

深度学习在OCR中的应用

https://blog.csdn.net/linolzhang/article/details/82780071

OCR文字识别

https://mp.weixin.qq.com/s/TDlxB6F8wwkcTgqPuWJQPw

如何构建识别图像中字符的自动程序?一文解读OCR与HTR

https://www.cnblogs.com/skyfsm/category/1123384.html

一个OCR方面的blog

https://zhuanlan.zhihu.com/c_1261635421517598720

一个OCR方面的专栏

https://mp.weixin.qq.com/s/WmsHrTIMJhSt8MtFO7-yXA

证件全文本OCR技术,了解一下

https://zhuanlan.zhihu.com/p/21344595

端到端的OCR:验证码识别(LSTM+CTC)

http://www.jianshu.com/p/86489f1afd36

端到端的OCR:基于CNN的实现

http://www.jianshu.com/p/4fadf629895b

端到端的OCR:LSTM+CTC的实现

https://mp.weixin.qq.com/s/AGmxdVSw8F0z-NdkhFtPUg

一文全览,深度学习时代下,复杂场景下的OCR如何实现?

https://mp.weixin.qq.com/s/F1d_pZQoVeUd9Uy5Z0Hc1Q

深度学习时代的OCR

https://mp.weixin.qq.com/s/axpA7Y_Rhiols5bDIdc6jg

Tesseract-OCR 3.0.1训练自己的语言库之图像文字识别

http://mp.weixin.qq.com/s/n8C80a3B54FhrCe-GhhcDA

文档扫描:深度神经网络在移动端的实践

https://mp.weixin.qq.com/s/NT9dTaTvX8T-NTbtv4OWaQ

最新《自然场景中文本检测与识别》综述论文,26页pdf

https://mp.weixin.qq.com/s/MYhQt9uC16BadiZKWjPTzA

华中科技大学提出多向文本检测方法:基于角定位与区域分割

http://ilovin.me/2017-04-23/tensorflow-lstm-ctc-input-output/

tensorflow LSTM+CTC/warpCTC使用详解

https://mp.weixin.qq.com/s/k0dRu1wx49HTi_oJYJEGPw

阿里提出IncepText:全新多向场景文本检测模块

https://mp.weixin.qq.com/s/h3VaKs0Pc44n-hXYNlkALA

开源OCR文字识别软件Calamari

https://mp.weixin.qq.com/s/FjoJA0gF4LgsB8hw24I0EQ

华科白翔老师团队ECCV2018 OCR论文:Mask TextSpotter

https://mp.weixin.qq.com/s/SulL2Y83xUlkv8qFbu6K7w

Mask TextSpotter v3来了!最强端到端文本识别模型

https://mp.weixin.qq.com/s/x-_fuVPgDYnle23IDsYCTw

百度深度学习图像识别决赛代码分享

https://mp.weixin.qq.com/s/r7GaYsdKLELXPmW5u2ysPw

OpenCV深度学习文本检测示例程序(EAST text detector)

https://mp.weixin.qq.com/s/Twki3TeNWwj_SqP9chXuxw

AdvancedEAST高效场景文本检测

https://mp.weixin.qq.com/s/PyV0Ml9ppTx0HZvz5VTe-Q

ICPR图像识别与检测挑战赛冠军方案出炉,基于偏旁部首来识别Duang字

https://mp.weixin.qq.com/s/gxpDyd5Lf0fmNZwFrJJZzg

OCR大突破:Facebook推出大规模图像文字检测识别系统——Rosetta

https://mp.weixin.qq.com/s/zeN-QYXBZzVtWUH10DXjVw

Facebook的新AI“Rosetta”会识别表情包,还会删帖

https://mp.weixin.qq.com/s/lVRIy6DdwfRxdoVW3qFiNg

OCR如何读取皱巴巴的文件?深度学习在文档图像形变矫正的应用详解

https://mp.weixin.qq.com/s/-KdR3buxFOrPE-w-IMLQ9A

最强开源OCR!印刷体古籍文字识别超越著名商业软件ABBYY

http://mp.weixin.qq.com/s/rS4xCsytYGqBLMUzlyA12A

构建多层感知器神经网络对数字图片进行文本识别

https://mp.weixin.qq.com/s/qTnFQK0CkvdJfZaKj2wUtQ

海康威视联合提出注意力聚焦网络FAN:提升场景文本识别精确度

https://zhuanlan.zhihu.com/p/50521715

云从科技在自然场景OCR任务取得技术突破

https://zhuanlan.zhihu.com/p/51397423

SPCNet

https://mp.weixin.qq.com/s/9f158VM_FoNVuODNER-BUw

端到端的弯曲文本检测与识别

https://mp.weixin.qq.com/s/J5DGF3JRZxk1-fAQSQNvkQ

MORAN文本识别算法开源,刷新多个OCR数据集state-of-the-art

https://mp.weixin.qq.com/s/cLB2CPjLVJAuDVVmHRKHEA

弯曲文字检测之SPCNet


About Joyk


Aggregate valuable and interesting links.
Joyk means Joy of geeK