深度学习(二十六)——OCR(1)
source link: http://antkillerfarm.github.io/dl/2018/01/03/Deep_Learning_26.html
Go to the source link to view the article. You can view the picture content, updated content and better typesetting reading experience. If the link is broken, please click the button below to view the snapshot at that time.
人脸检测/识别
人脸关键点(续)
https://mp.weixin.qq.com/s/ZrnAqDJCLtMy_qTQ2RZT0A
级联MobileNet-V2实现人脸关键点检测
https://mp.weixin.qq.com/s/ymeJPUPRAGb1FltskqBs-A
人脸关键点检测汇总(上)
https://mp.weixin.qq.com/s/N6y-RDx7VszgCVhSiwP8jA
人脸关键点检测汇总(下)
https://mp.weixin.qq.com/s/D435jGsGPkCH5j-p8Zoksg
遮挡、光照等因素的人脸关键点检测
https://mp.weixin.qq.com/s/BV3xv8mH6K7dV1nik0X5aw
PFLD:简单、快速、超高精度人脸特征点检测算法
https://mp.weixin.qq.com/s/kWRW81aAMl18GIDQWqX1Ow
PFLD:简单高效的实用人脸关键点检测算法
https://mp.weixin.qq.com/s/HpgcPkAZb9R5jF-zsGcfcw
美图影像实验室(MTlab)10000点人脸关键点技术全解读
https://mp.weixin.qq.com/s/YsuvIB56OxS9IBMQYSUdUg
深度学习AI美颜系列——人像静态/动态贴纸特效算法实现
人脸表情识别
https://mp.weixin.qq.com/s/Pcc2tVfNEY_xPo0aIuDlSA
人脸表情识别不得不读的重要论文推荐(2015-2018篇)
https://mp.weixin.qq.com/s/Z06oUe7oExgkKZ8g2_PnPw
科普人脸表情识别技术
https://mp.weixin.qq.com/s/i4HdS-lCrsv9YR39Hja8ow
深度人脸表情识别技术综述,没有比这更全的了
https://mp.weixin.qq.com/s/Ht8kFTgIWASusfSUQqoaJA
人脸表情识别研究
https://mp.weixin.qq.com/s/UFOB2V12gQQ3mV-Kh9RTUw
高精度人脸表情识别
https://mp.weixin.qq.com/s/xKOVabHYCrcadhBmldjYAg
大规模人脸表情识别
https://mp.weixin.qq.com/s/AIg0HvgEIk4Ur35IwxxAWQ
基于图片的人脸表情识别,基本概念和数据集
https://mp.weixin.qq.com/s/kWoMh-rw3MSwB0KbCa9Axg
如何做好表情识别任务的图片预处理工作
https://mp.weixin.qq.com/s/HU8_T88KEwFMsrcXHnpfQQ
基于视频的人脸表情识别数据集与基本方法
https://mp.weixin.qq.com/s/i6AS7VzWbaxlImCmjEYvMQ
基于视频的人脸表情识别不得不读的论文
https://mp.weixin.qq.com/s/EuURGTFcLho_ATT4u0ph5w
基于回归模型的人脸表情识别方法
光学字符识别(Optical Character Recognition, OCR),是指对文本资料的图像文件进行分析识别处理,获取文字及版面信息的过程。
与之类似的还有手写文本识别(Handwritten Text Recognition, HTR)。
华中科大白翔教授的实验室算是目前国内OCR做的比较好的了。
白翔的个人主页:
http://cloud.eic.hust.edu.cn:8071/~xbai/
该主页上有一个OCR方面的综述,是入门的最好资料。
http://www.cnblogs.com/lillylin/
这是一个OCR方面的blog。对白翔的论文,几乎都有阅读笔记。
https://github.com/hwalsuklee/awesome-deep-text-detection-recognition
Github:深度学习文本检测识别(OCR)精选资源汇总
近年来场景文字检测工作主要分为两大类:
-
自上而下的方法主要借鉴的是通用物体检测的思路,并且根据文字的特点设计相应的检测模型。这类方法通常难以处理不规则文本的检测问题。
-
自下而上的方法,通常先学习文本行的基本组成单元,然后进行单元之间的组合得到文本行检测框。由于其灵活的表征方式,对不规则形状的文本检测有着天然的优势。
自下而上的方法按照组成单元的不同又分为两类:组成单元为像素的基于分割的方法,以及组成单元为文字块的基于单元组合的方法。但是,自下而上的方法通常很难区分密集文本。密集文本检测问题是文本检测中一个广泛存在的难点问题。
tesseract
linux下可以使用tesseract作为OCR工具。当然这个工具目前使用的还是传统算法。
安装方法:
sudo apt install tesseract-ocr libtesseract-dev
使用方法:
tesseract ./111.png 1 -l chi_sim+eng
https://github.com/liuruoze/EasyPR
一个开源的中文车牌识别系统。(使用传统算法)
https://blog.csdn.net/Relocy/article/details/78629441
HyperLPR:一个基于深度学习的支持多种车牌的中文开源车牌识别框架
https://blog.csdn.net/yang_daxia/article/details/90408160
车牌识别论文survey
https://mp.weixin.qq.com/s/6dsufEVsuEILa1gSOBt32w
用于提高车牌识别的单幅噪声图像去噪和校正
https://mp.weixin.qq.com/s/ynpqG7Vfu5b8lYNW6Y-TpA
快准狠!Intel论文揭示自家车牌识别算法:LPRNet
https://mp.weixin.qq.com/s/JIoTsadw4JBkr0e40RwVQQ
这篇论文开源的车牌识别系统打败了目前最先进的商业软件
https://mp.weixin.qq.com/s/fqpZ8EHgiNupXumvTMSecw
北大团队研发“车脸”识别系统,不看车牌看外观特征实现精确识别
https://mp.weixin.qq.com/s/Shz6BmsOrtbEFtoJRSkl9A
简单车牌检测
https://mp.weixin.qq.com/s/iwPI8g2JwabwiCO8kfw8Hw
用开源工具DIY车牌识别系统
https://mp.weixin.qq.com/s/0Lh8821SbDdmM7IZS3IEBg
构建自动车牌识别系统
https://mp.weixin.qq.com/s/plUxIatkBHd2jjnsMy2nmw
基于OpenCV的车牌识别
CRNN是白翔小组的作品。
《An End-to-End Trainable Neural Network for Image-based Sequence Recognition and Its Application to Scene Text Recognition》
https://github.com/bgshih/crnn
https://mp.weixin.qq.com/s/UEGvnNwKW315S68ye4QITQ
一文带你搞懂OCR识别算法CRNN:解析+源码
https://mp.weixin.qq.com/s/XFrgmdEz1d9vg6U0hYr7Qw
中英文文字检测与识别项目(CTPN+CRNN+CTC Loss原理讲解)
ASTER
ASTER也是白翔小组的作品。
《ASTER: An Attentional Scene Text Recognizer with Flexible Rectification》
https://github.com/bgshih/aster
https://www.cnblogs.com/lillylin/p/9315180.html
论文阅读笔记
https://mp.weixin.qq.com/s/Ai43GvLsEtFrfArHUvqLXg
Aster:具有柔性矫正功能的注意力机制场景文本识别方法
https://zhuanlan.zhihu.com/p/34757009
场景文字检测—CTPN原理与实现
https://mp.weixin.qq.com/s/lV2yjhvnRLDfNbZXOSjofg
ctpn:图像文字检测方法
https://mp.weixin.qq.com/s/yxNIw8WDkJZ782HSDyfniw
深度解析文本检测网络CTPN
https://mp.weixin.qq.com/s/h7HVyGbmtLmNVJp4p0rCRQ
字符识别(OCR)相关工具/库/教材/论文等资源整理
https://mp.weixin.qq.com/s/XvtmPUbS2KV0zNXTPgtgDA
史上最全端到端场景文本检测识别资源合集(14篇重要论文 + 5个开源代码 + 49个实验结果 + 222个统计信息)
https://mp.weixin.qq.com/s/qLPfs5nHCVn5J-q3CbeECg
史上最全场景文字识别资源汇集(56篇重要论文 + 20 个开源代码 + 330 个实验结果 + 1882个统计信息)
https://mp.weixin.qq.com/s/rsJZ3R71gSAC4T501-LSQA
史上最全场景文字检测资源合集(70篇重要论文 + 15个开源代码 + 176个实验结果 +
https://mp.weixin.qq.com/s/k_pYPq4QO1aR7DImLSCgoQ
OCR100篇相关论文与代码,从文本识别到验证码识别
https://mp.weixin.qq.com/s/KFgC8zHWS7ysb9GfbkfLRA
OCR技术简介
https://zhuanlan.zhihu.com/p/65707543
文字OCR方法整理
https://mp.weixin.qq.com/s/0ysaJGNslckesv21o752FA
图像OCR年度进展
https://mp.weixin.qq.com/s/VIEsfc4qKAGsi-O9LD4mng
深度学习在OCR中的应用
https://blog.csdn.net/linolzhang/article/details/82780071
OCR文字识别
https://mp.weixin.qq.com/s/TDlxB6F8wwkcTgqPuWJQPw
如何构建识别图像中字符的自动程序?一文解读OCR与HTR
https://www.cnblogs.com/skyfsm/category/1123384.html
一个OCR方面的blog
https://zhuanlan.zhihu.com/c_1261635421517598720
一个OCR方面的专栏
https://mp.weixin.qq.com/s/WmsHrTIMJhSt8MtFO7-yXA
证件全文本OCR技术,了解一下
https://zhuanlan.zhihu.com/p/21344595
端到端的OCR:验证码识别(LSTM+CTC)
http://www.jianshu.com/p/86489f1afd36
端到端的OCR:基于CNN的实现
http://www.jianshu.com/p/4fadf629895b
端到端的OCR:LSTM+CTC的实现
https://mp.weixin.qq.com/s/AGmxdVSw8F0z-NdkhFtPUg
一文全览,深度学习时代下,复杂场景下的OCR如何实现?
https://mp.weixin.qq.com/s/F1d_pZQoVeUd9Uy5Z0Hc1Q
深度学习时代的OCR
https://mp.weixin.qq.com/s/axpA7Y_Rhiols5bDIdc6jg
Tesseract-OCR 3.0.1训练自己的语言库之图像文字识别
http://mp.weixin.qq.com/s/n8C80a3B54FhrCe-GhhcDA
文档扫描:深度神经网络在移动端的实践
https://mp.weixin.qq.com/s/NT9dTaTvX8T-NTbtv4OWaQ
最新《自然场景中文本检测与识别》综述论文,26页pdf
https://mp.weixin.qq.com/s/MYhQt9uC16BadiZKWjPTzA
华中科技大学提出多向文本检测方法:基于角定位与区域分割
http://ilovin.me/2017-04-23/tensorflow-lstm-ctc-input-output/
tensorflow LSTM+CTC/warpCTC使用详解
https://mp.weixin.qq.com/s/k0dRu1wx49HTi_oJYJEGPw
阿里提出IncepText:全新多向场景文本检测模块
https://mp.weixin.qq.com/s/h3VaKs0Pc44n-hXYNlkALA
开源OCR文字识别软件Calamari
https://mp.weixin.qq.com/s/FjoJA0gF4LgsB8hw24I0EQ
华科白翔老师团队ECCV2018 OCR论文:Mask TextSpotter
https://mp.weixin.qq.com/s/SulL2Y83xUlkv8qFbu6K7w
Mask TextSpotter v3来了!最强端到端文本识别模型
https://mp.weixin.qq.com/s/x-_fuVPgDYnle23IDsYCTw
百度深度学习图像识别决赛代码分享
https://mp.weixin.qq.com/s/r7GaYsdKLELXPmW5u2ysPw
OpenCV深度学习文本检测示例程序(EAST text detector)
https://mp.weixin.qq.com/s/Twki3TeNWwj_SqP9chXuxw
AdvancedEAST高效场景文本检测
https://mp.weixin.qq.com/s/PyV0Ml9ppTx0HZvz5VTe-Q
ICPR图像识别与检测挑战赛冠军方案出炉,基于偏旁部首来识别Duang字
https://mp.weixin.qq.com/s/gxpDyd5Lf0fmNZwFrJJZzg
OCR大突破:Facebook推出大规模图像文字检测识别系统——Rosetta
https://mp.weixin.qq.com/s/zeN-QYXBZzVtWUH10DXjVw
Facebook的新AI“Rosetta”会识别表情包,还会删帖
https://mp.weixin.qq.com/s/lVRIy6DdwfRxdoVW3qFiNg
OCR如何读取皱巴巴的文件?深度学习在文档图像形变矫正的应用详解
https://mp.weixin.qq.com/s/-KdR3buxFOrPE-w-IMLQ9A
最强开源OCR!印刷体古籍文字识别超越著名商业软件ABBYY
http://mp.weixin.qq.com/s/rS4xCsytYGqBLMUzlyA12A
构建多层感知器神经网络对数字图片进行文本识别
https://mp.weixin.qq.com/s/qTnFQK0CkvdJfZaKj2wUtQ
海康威视联合提出注意力聚焦网络FAN:提升场景文本识别精确度
https://zhuanlan.zhihu.com/p/50521715
云从科技在自然场景OCR任务取得技术突破
https://zhuanlan.zhihu.com/p/51397423
SPCNet
https://mp.weixin.qq.com/s/9f158VM_FoNVuODNER-BUw
端到端的弯曲文本检测与识别
https://mp.weixin.qq.com/s/J5DGF3JRZxk1-fAQSQNvkQ
MORAN文本识别算法开源,刷新多个OCR数据集state-of-the-art
https://mp.weixin.qq.com/s/cLB2CPjLVJAuDVVmHRKHEA
弯曲文字检测之SPCNet
Recommend
About Joyk
Aggregate valuable and interesting links.
Joyk means Joy of geeK