2

深度学习(四十六)——OCR(2), AI可解释性, 第四范式

 2 years ago
source link: http://antkillerfarm.github.io/dl/2018/09/13/Deep_Learning_46.html
Go to the source link to view the article. You can view the picture content, updated content and better typesetting reading experience. If the link is broken, please click the button below to view the snapshot at that time.
neoserver,ios ssh client

OCR(续)

https://mp.weixin.qq.com/s/_znXs8pkfgmWsb26HIfhLQ

复杂环境文字识别技术研究及应用进展

https://mp.weixin.qq.com/s/JA6ey6N3Zho92L6jh_bRkg

EAST场景文字检测模型使用

https://mp.weixin.qq.com/s/uMzx_U-wx94GRTQtM11d8Q

OCR技术在携程业务中的应用

https://mp.weixin.qq.com/s/-zMVO47AL1iKFmF16KsfOw

文本检测算法PSENet解读与开源实现

https://mp.weixin.qq.com/s/UFfBoxQwsB_GUqTDRv3Asg

免费数学神器!再复杂的公式,只要有照片就能转成LaTeX

https://mp.weixin.qq.com/s/x8iyl4gwz31XOCw3oSHSwg

开源!基于TensorFlow/Keras/PyTorch实现对自然场景的文字检测及端到端的OCR中文文字识别

https://mp.weixin.qq.com/s/eVhId0OqKB-jNCg4j8qaNg

仅用200个样本就能得到当前最佳结果:手写字符识别新模型TextCaps

https://mp.weixin.qq.com/s/z5hRafxepA4Zj5pbbK8HzA

基于模板的文字识别结果结构化处理技术

https://mp.weixin.qq.com/s/Buv6m66kj3RjKq0LjqNAiA

mathAI手写拍照自动能解高数题,还不快试试?

https://mp.weixin.qq.com/s/bmJCLUlOA364AvK90sXE3Q

用于算术习题自动批改的结构文本精确识别方法

https://zhuanlan.zhihu.com/p/130855699

怎样构建一个端到端的文字识别系统(CTC Loss)

https://mp.weixin.qq.com/s/5eTugA70myKxDTZUby87Pw

任意形状文本检测:Look More Than Once

https://mp.weixin.qq.com/s/RuYZ-nmW2p7jMIJ7sbxbIw

任意形状文本检测的像素聚合网络

https://mp.weixin.qq.com/s/T0QeYbkmD4jwhWB47Fnn2w

基于深度学习的端到端在线手写数学公式识别

https://mp.weixin.qq.com/s/l1rmGxOVrXKAaf4yYUt4kQ

自然场景文字定位技术详解

https://mp.weixin.qq.com/s/rJ7guL-Hxxr2Ezl7LRhQrA

基于对抗学习的数据稀缺手写文本识别

https://mp.weixin.qq.com/s/YixrjGTU4p7LlyfQCEmmmQ

端到端任意形状场景文字识别

https://mp.weixin.qq.com/s/Lk_P74kJCjmQo1S2piTplA

针对不规则场景文字识别的对称约束矫正网络

https://mp.weixin.qq.com/s/ENvoZ4ZPKT1HXaQjD9VgSA

王晶:华为云OCR文字识别服务技术实践、底层框架及应用场景

https://mp.weixin.qq.com/s/sigPeclXz12NUk_nX8TZ-A

文档分析与识别技术回顾与反思

https://mp.weixin.qq.com/s/4WXb6igvxZP_XoIHl4AiQA

ESIR:一种基于迭代矫正的端到端场景文本识别方法

https://mp.weixin.qq.com/s/MDxltLKP-SQf_31Zp1RL8A

文本识别新王者CharNet:卷积字符网络

https://mp.weixin.qq.com/s/H8ECjqEcIjcm5YNFu6ONdw

开源OCR文本检测器,基于TextBoxes++和RetinaNet

https://mp.weixin.qq.com/s/CwLN2SRyN7RTEFtNx3u8Pg

基于图卷积网络的视觉富文本数据中文档图像信息抽取

https://mp.weixin.qq.com/s/2wxZSWCfwl_z502MjisdzQ

ICDAR 2019表格识别论文与竞赛综述(上)

https://mp.weixin.qq.com/s/wD7UNeLfCOaOzrSdzMB5qA

ICDAR 2019表格识别论文与竞赛综述(下)

https://mp.weixin.qq.com/s/L_Rz1yHR0Q3L3y32WAYjkg

从边界到文本—一种任意形状文本的检测方法

https://mp.weixin.qq.com/s/CcPhmxCFWYddaQgfJmO9UQ

最新图文识别技术综述

https://mp.weixin.qq.com/s/-XPlEnszjBc_NCCIvD9zHg

手写签名认证的逆鉴别网络

https://mp.weixin.qq.com/s/LS_8424jn_3ksemKBgg88w

SegLink++:基于实例感知与组件组合的任意形状密集场景文本检测方法

https://mp.weixin.qq.com/s/vuRRcnlTugsUcfW5D5uYyA

旷视研究院提出TextScanner:确保字符阅读顺序,实现文字识别新突破

https://mp.weixin.qq.com/s/huvQszaBcVOxUEz0tJ_Psg

基于OCR的身份证要素提取​​

https://mp.weixin.qq.com/s/hVjTz3ofg3NsvZwAB53_eQ

PRN:面向不规则文字识别的渐进矫正网络

https://mp.weixin.qq.com/s/T6GlweGUguUAYIjfsabPHQ

徒手素描的深度学习:综述论文,Deep Learning for Free-Hand Sketch

https://mp.weixin.qq.com/s/QR53KZwIpQbCqX4TJAhAlQ

面向场景文本识别的带聚焦注意力机制的convLSTM

https://mp.weixin.qq.com/s/dg3ydVozTN1wJB-SnjkPGQ

GNN手绘草图识别新架构:Multi-Graph Transformer网络

https://mp.weixin.qq.com/s/enVx8sLoxmaSM8NlUL5IMQ

实测超轻量中文OCR开源项目,总模型仅17M

https://mp.weixin.qq.com/s/vNYG6vq_LAotj_21PG_P9w

扫描式SSD用于公式检测,代码已开源

https://mp.weixin.qq.com/s/5M9AIjEs6i1tPMVXA2a2Zg

TE141K:用于文字风格转换的大规模艺术文字数据库

https://mp.weixin.qq.com/s/nsZ64_7jgugvDlBZoiJ1ZA

UnrealText:基于虚拟场景的真实场景文本图像合成

https://mp.weixin.qq.com/s/Fku4chvC9VX0p7NI8yYc0Q

OCR光学字符识别方法汇总

https://mp.weixin.qq.com/s/cKR3B6Av_C4nBzMeAoDYEA

截屏、文字提取一气呵成,超实用OCR开源小工具

https://mp.weixin.qq.com/s/t5LdXMHW3SyBzMST-3ZtgQ

比OCR更强大的PPT图片一键转文档重建技术

https://mp.weixin.qq.com/s/rm7G6MqMjSyy8oGjSOWk3A

CV赛题总结:人民币面值与编码识别

https://mp.weixin.qq.com/s/5rny9_oF2-urF2JUp13fUw

OpenCV实现银行卡号识别,字符识别算法你知多少?

https://mp.weixin.qq.com/s/P8TiEk482o2Mye76_YC0rg

EasyOCR: 支持40+语言的OCR模块

https://mp.weixin.qq.com/s/i1Dm18qp93jzWnMoqRU2gA

8.6M超轻量中英文OCR模型开源,训练部署一条龙

https://mp.weixin.qq.com/s/RqsjyYwvbj41cMCXkFj6sg

B站UP主自制的开源OCR翻译器走红Github

https://mp.weixin.qq.com/s/K_qAWYTA9fBTAeNRR7s82A

文字识别在高德地图数据生产中的演进

https://mp.weixin.qq.com/s/x-HE-86T5SK6Y_SVX_ZJBA

使用神经网络提取PDF表格工具来了,支持图片

https://mp.weixin.qq.com/s/4lRwiR-3devARVX1rQLzEQ

文档智能:通用文档预训练模型与数据集,推动NLP落地升级

https://mp.weixin.qq.com/s/xuJxpJ970uoFNva-45y2eA

微信OCR(1)——公众号图文识别中的文本检测

https://mp.weixin.qq.com/s/KpEJYs6ANLqUbVz1CazF6Q

微信OCR(2)——深度序列学习助力文字识别

https://mp.weixin.qq.com/s/6IGXof3KWVnN8z1i2YOqJA

三年磨一剑——微信OCR图片文字提取

https://mp.weixin.qq.com/s/6STRTuKdrM0OP3qrVArfCg

OCR in the Wild:文本检测和识别的SOTA

https://mp.weixin.qq.com/s/TcjaK7dzU44_EA6Hp1oc0g

日漫迷有福了!这个系统可以全自动翻译日漫,再也不用啃生肉了

https://mp.weixin.qq.com/s/gd86GgUxsWCKn6NihuHzZw

58安全-证件识别之版面分析实践

https://mp.weixin.qq.com/s/749JZKSrQnlvrcbbS23Njw

MMOCR:OpenMMLab全流程的文字检测识别理解工具箱

https://mp.weixin.qq.com/s/HvOn8SZ2uPjekkDd4VB-9A

一行代码从PDF提取Excel文件

https://zhuanlan.zhihu.com/p/453513716

大白话Benchmarking Chinese Text Recognition

AI可解释性

XAI(Explainable Artificial Intelligence)

https://github.com/pbiecek/xai_resources

AI可解释性资源汇总

https://mp.weixin.qq.com/s/XVl6voP5cwdC7DcvTMQvVQ

机器学习可解释性工具箱XAI

https://github.com/jphall663/awesome-machine-learning-interpretability

最全的机器学习可解释性资料

https://mp.weixin.qq.com/s/OV4vXu7TAuyV7qU9BAMF6g

机器学习模型的“可解释性”到底有多重要?

https://mp.weixin.qq.com/s/33VQNVvb7JGlk10Jc3mmeg

从可视化到新模型:纵览深度学习的视觉可解释性

https://github.com/ModelOriented/DrWhy

可解释AI(XAI)工具集—DrWhy

https://mp.weixin.qq.com/s/1OODeAFaRLFK3elECyZcng

机器学习模型可解释性的详尽介绍

https://mp.weixin.qq.com/s/Ax_Iv8IbDWid7EIO5usTbw

可解释人工智能(XAI): 工业界挑战与经验教训,180页ppt

https://mp.weixin.qq.com/s/-ZhYXTIiEFHd-G-NZEqlcA

深度学习可解释性!深度taylor分解

https://mp.weixin.qq.com/s/yzCTQvjeyyF2IFORzrTBVg

黑盒模型实际上比逻辑回归更具可解释性

https://mp.weixin.qq.com/s/gAidXX4YrezZcSa6Jpl8nQ

万字长文概览深度学习的可解释性研究

https://mp.weixin.qq.com/s/OpnDHf5r2j-D962eMurx9w

SHAP值:用博弈论的概念解释一个模型

https://zhuanlan.zhihu.com/p/238202269

初探Explainable AI

第一范式,是指以实验为基础的科学研究模式。例如以伽利略为代表的文艺复兴时期的科学发展初级阶段。

第二范式,即理论研究为基础的科学研究模式。在这个阶段,科学家们会将无法用实验模拟的科学原理用模型简化,去掉一些复杂的因素,只留下关键因素,然后通过演算得到结论。例如,牛顿三大定律和爱因斯坦相对论。

第三范式,即利用电子计算机对科学实验进行模拟仿真的模式。

第四范式,数据密集型科学发现(Data-Intensive Scientific Discovery)。由James Gray于2007年提出。

James Gray,1944~2007,美国数据库专家。UCB博士(1969)。图灵奖得主(1998)。先后供职于IBM、Tandem Computers、DEC、MS等公司。提出了ACID、Two-tier transaction commit semantics、OLAP等概念。2007年独自驾船出海后失踪。

https://mp.weixin.qq.com/s/5U4iH1n3kqUCAodUVKGTNQ

从经验到理论、从数据到网络——脑科学研究的四次范式转移

https://zhuanlan.zhihu.com/p/30608976

第四范式:大数据对于科研的意义

多任务学习+

https://blog.csdn.net/CoderPai/article/details/80087188

利用TensorFlow一步一步构建一个多任务学习模型

https://mp.weixin.qq.com/s/mm9bXXTEzd8DwyYlMgGMZg

NLP多任务学习:一种层次增长的神经网络结构

https://mp.weixin.qq.com/s/fcFb6WkJVP8TYpoxkQgiWQ

CMU提出“十字绣网络”,自动决定多任务学习的最佳共享层

https://mp.weixin.qq.com/s/i7WAFjQHK1NGVACR8x3v0A

自然语言十项全能:转化为问答的多任务学习

https://zhuanlan.zhihu.com/p/362330594

深度学习多目标优化的多个loss应该如何权衡

https://mp.weixin.qq.com/s/ZyokVuCLHNbt7aXWzoJTFA

多任务学习在推荐系统和自然语言处理领域的总结


About Joyk


Aggregate valuable and interesting links.
Joyk means Joy of geeK