深度学习(四十六)——OCR(2), AI可解释性, 第四范式
source link: http://antkillerfarm.github.io/dl/2018/09/13/Deep_Learning_46.html
Go to the source link to view the article. You can view the picture content, updated content and better typesetting reading experience. If the link is broken, please click the button below to view the snapshot at that time.
OCR(续)
https://mp.weixin.qq.com/s/_znXs8pkfgmWsb26HIfhLQ
复杂环境文字识别技术研究及应用进展
https://mp.weixin.qq.com/s/JA6ey6N3Zho92L6jh_bRkg
EAST场景文字检测模型使用
https://mp.weixin.qq.com/s/uMzx_U-wx94GRTQtM11d8Q
OCR技术在携程业务中的应用
https://mp.weixin.qq.com/s/-zMVO47AL1iKFmF16KsfOw
文本检测算法PSENet解读与开源实现
https://mp.weixin.qq.com/s/UFfBoxQwsB_GUqTDRv3Asg
免费数学神器!再复杂的公式,只要有照片就能转成LaTeX
https://mp.weixin.qq.com/s/x8iyl4gwz31XOCw3oSHSwg
开源!基于TensorFlow/Keras/PyTorch实现对自然场景的文字检测及端到端的OCR中文文字识别
https://mp.weixin.qq.com/s/eVhId0OqKB-jNCg4j8qaNg
仅用200个样本就能得到当前最佳结果:手写字符识别新模型TextCaps
https://mp.weixin.qq.com/s/z5hRafxepA4Zj5pbbK8HzA
基于模板的文字识别结果结构化处理技术
https://mp.weixin.qq.com/s/Buv6m66kj3RjKq0LjqNAiA
mathAI手写拍照自动能解高数题,还不快试试?
https://mp.weixin.qq.com/s/bmJCLUlOA364AvK90sXE3Q
用于算术习题自动批改的结构文本精确识别方法
https://zhuanlan.zhihu.com/p/130855699
怎样构建一个端到端的文字识别系统(CTC Loss)
https://mp.weixin.qq.com/s/5eTugA70myKxDTZUby87Pw
任意形状文本检测:Look More Than Once
https://mp.weixin.qq.com/s/RuYZ-nmW2p7jMIJ7sbxbIw
任意形状文本检测的像素聚合网络
https://mp.weixin.qq.com/s/T0QeYbkmD4jwhWB47Fnn2w
基于深度学习的端到端在线手写数学公式识别
https://mp.weixin.qq.com/s/l1rmGxOVrXKAaf4yYUt4kQ
自然场景文字定位技术详解
https://mp.weixin.qq.com/s/rJ7guL-Hxxr2Ezl7LRhQrA
基于对抗学习的数据稀缺手写文本识别
https://mp.weixin.qq.com/s/YixrjGTU4p7LlyfQCEmmmQ
端到端任意形状场景文字识别
https://mp.weixin.qq.com/s/Lk_P74kJCjmQo1S2piTplA
针对不规则场景文字识别的对称约束矫正网络
https://mp.weixin.qq.com/s/ENvoZ4ZPKT1HXaQjD9VgSA
王晶:华为云OCR文字识别服务技术实践、底层框架及应用场景
https://mp.weixin.qq.com/s/sigPeclXz12NUk_nX8TZ-A
文档分析与识别技术回顾与反思
https://mp.weixin.qq.com/s/4WXb6igvxZP_XoIHl4AiQA
ESIR:一种基于迭代矫正的端到端场景文本识别方法
https://mp.weixin.qq.com/s/MDxltLKP-SQf_31Zp1RL8A
文本识别新王者CharNet:卷积字符网络
https://mp.weixin.qq.com/s/H8ECjqEcIjcm5YNFu6ONdw
开源OCR文本检测器,基于TextBoxes++和RetinaNet
https://mp.weixin.qq.com/s/CwLN2SRyN7RTEFtNx3u8Pg
基于图卷积网络的视觉富文本数据中文档图像信息抽取
https://mp.weixin.qq.com/s/2wxZSWCfwl_z502MjisdzQ
ICDAR 2019表格识别论文与竞赛综述(上)
https://mp.weixin.qq.com/s/wD7UNeLfCOaOzrSdzMB5qA
ICDAR 2019表格识别论文与竞赛综述(下)
https://mp.weixin.qq.com/s/L_Rz1yHR0Q3L3y32WAYjkg
从边界到文本—一种任意形状文本的检测方法
https://mp.weixin.qq.com/s/CcPhmxCFWYddaQgfJmO9UQ
最新图文识别技术综述
https://mp.weixin.qq.com/s/-XPlEnszjBc_NCCIvD9zHg
手写签名认证的逆鉴别网络
https://mp.weixin.qq.com/s/LS_8424jn_3ksemKBgg88w
SegLink++:基于实例感知与组件组合的任意形状密集场景文本检测方法
https://mp.weixin.qq.com/s/vuRRcnlTugsUcfW5D5uYyA
旷视研究院提出TextScanner:确保字符阅读顺序,实现文字识别新突破
https://mp.weixin.qq.com/s/huvQszaBcVOxUEz0tJ_Psg
基于OCR的身份证要素提取
https://mp.weixin.qq.com/s/hVjTz3ofg3NsvZwAB53_eQ
PRN:面向不规则文字识别的渐进矫正网络
https://mp.weixin.qq.com/s/T6GlweGUguUAYIjfsabPHQ
徒手素描的深度学习:综述论文,Deep Learning for Free-Hand Sketch
https://mp.weixin.qq.com/s/QR53KZwIpQbCqX4TJAhAlQ
面向场景文本识别的带聚焦注意力机制的convLSTM
https://mp.weixin.qq.com/s/dg3ydVozTN1wJB-SnjkPGQ
GNN手绘草图识别新架构:Multi-Graph Transformer网络
https://mp.weixin.qq.com/s/enVx8sLoxmaSM8NlUL5IMQ
实测超轻量中文OCR开源项目,总模型仅17M
https://mp.weixin.qq.com/s/vNYG6vq_LAotj_21PG_P9w
扫描式SSD用于公式检测,代码已开源
https://mp.weixin.qq.com/s/5M9AIjEs6i1tPMVXA2a2Zg
TE141K:用于文字风格转换的大规模艺术文字数据库
https://mp.weixin.qq.com/s/nsZ64_7jgugvDlBZoiJ1ZA
UnrealText:基于虚拟场景的真实场景文本图像合成
https://mp.weixin.qq.com/s/Fku4chvC9VX0p7NI8yYc0Q
OCR光学字符识别方法汇总
https://mp.weixin.qq.com/s/cKR3B6Av_C4nBzMeAoDYEA
截屏、文字提取一气呵成,超实用OCR开源小工具
https://mp.weixin.qq.com/s/t5LdXMHW3SyBzMST-3ZtgQ
比OCR更强大的PPT图片一键转文档重建技术
https://mp.weixin.qq.com/s/rm7G6MqMjSyy8oGjSOWk3A
CV赛题总结:人民币面值与编码识别
https://mp.weixin.qq.com/s/5rny9_oF2-urF2JUp13fUw
OpenCV实现银行卡号识别,字符识别算法你知多少?
https://mp.weixin.qq.com/s/P8TiEk482o2Mye76_YC0rg
EasyOCR: 支持40+语言的OCR模块
https://mp.weixin.qq.com/s/i1Dm18qp93jzWnMoqRU2gA
8.6M超轻量中英文OCR模型开源,训练部署一条龙
https://mp.weixin.qq.com/s/RqsjyYwvbj41cMCXkFj6sg
B站UP主自制的开源OCR翻译器走红Github
https://mp.weixin.qq.com/s/K_qAWYTA9fBTAeNRR7s82A
文字识别在高德地图数据生产中的演进
https://mp.weixin.qq.com/s/x-HE-86T5SK6Y_SVX_ZJBA
使用神经网络提取PDF表格工具来了,支持图片
https://mp.weixin.qq.com/s/4lRwiR-3devARVX1rQLzEQ
文档智能:通用文档预训练模型与数据集,推动NLP落地升级
https://mp.weixin.qq.com/s/xuJxpJ970uoFNva-45y2eA
微信OCR(1)——公众号图文识别中的文本检测
https://mp.weixin.qq.com/s/KpEJYs6ANLqUbVz1CazF6Q
微信OCR(2)——深度序列学习助力文字识别
https://mp.weixin.qq.com/s/6IGXof3KWVnN8z1i2YOqJA
三年磨一剑——微信OCR图片文字提取
https://mp.weixin.qq.com/s/6STRTuKdrM0OP3qrVArfCg
OCR in the Wild:文本检测和识别的SOTA
https://mp.weixin.qq.com/s/TcjaK7dzU44_EA6Hp1oc0g
日漫迷有福了!这个系统可以全自动翻译日漫,再也不用啃生肉了
https://mp.weixin.qq.com/s/gd86GgUxsWCKn6NihuHzZw
58安全-证件识别之版面分析实践
https://mp.weixin.qq.com/s/749JZKSrQnlvrcbbS23Njw
MMOCR:OpenMMLab全流程的文字检测识别理解工具箱
https://mp.weixin.qq.com/s/HvOn8SZ2uPjekkDd4VB-9A
一行代码从PDF提取Excel文件
https://zhuanlan.zhihu.com/p/453513716
大白话Benchmarking Chinese Text Recognition
AI可解释性
XAI(Explainable Artificial Intelligence)
https://github.com/pbiecek/xai_resources
AI可解释性资源汇总
https://mp.weixin.qq.com/s/XVl6voP5cwdC7DcvTMQvVQ
机器学习可解释性工具箱XAI
https://github.com/jphall663/awesome-machine-learning-interpretability
最全的机器学习可解释性资料
https://mp.weixin.qq.com/s/OV4vXu7TAuyV7qU9BAMF6g
机器学习模型的“可解释性”到底有多重要?
https://mp.weixin.qq.com/s/33VQNVvb7JGlk10Jc3mmeg
从可视化到新模型:纵览深度学习的视觉可解释性
https://github.com/ModelOriented/DrWhy
可解释AI(XAI)工具集—DrWhy
https://mp.weixin.qq.com/s/1OODeAFaRLFK3elECyZcng
机器学习模型可解释性的详尽介绍
https://mp.weixin.qq.com/s/Ax_Iv8IbDWid7EIO5usTbw
可解释人工智能(XAI): 工业界挑战与经验教训,180页ppt
https://mp.weixin.qq.com/s/-ZhYXTIiEFHd-G-NZEqlcA
深度学习可解释性!深度taylor分解
https://mp.weixin.qq.com/s/yzCTQvjeyyF2IFORzrTBVg
黑盒模型实际上比逻辑回归更具可解释性
https://mp.weixin.qq.com/s/gAidXX4YrezZcSa6Jpl8nQ
万字长文概览深度学习的可解释性研究
https://mp.weixin.qq.com/s/OpnDHf5r2j-D962eMurx9w
SHAP值:用博弈论的概念解释一个模型
https://zhuanlan.zhihu.com/p/238202269
初探Explainable AI
第一范式,是指以实验为基础的科学研究模式。例如以伽利略为代表的文艺复兴时期的科学发展初级阶段。
第二范式,即理论研究为基础的科学研究模式。在这个阶段,科学家们会将无法用实验模拟的科学原理用模型简化,去掉一些复杂的因素,只留下关键因素,然后通过演算得到结论。例如,牛顿三大定律和爱因斯坦相对论。
第三范式,即利用电子计算机对科学实验进行模拟仿真的模式。
第四范式,数据密集型科学发现(Data-Intensive Scientific Discovery)。由James Gray于2007年提出。
James Gray,1944~2007,美国数据库专家。UCB博士(1969)。图灵奖得主(1998)。先后供职于IBM、Tandem Computers、DEC、MS等公司。提出了ACID、Two-tier transaction commit semantics、OLAP等概念。2007年独自驾船出海后失踪。
https://mp.weixin.qq.com/s/5U4iH1n3kqUCAodUVKGTNQ
从经验到理论、从数据到网络——脑科学研究的四次范式转移
https://zhuanlan.zhihu.com/p/30608976
第四范式:大数据对于科研的意义
多任务学习+
https://blog.csdn.net/CoderPai/article/details/80087188
利用TensorFlow一步一步构建一个多任务学习模型
https://mp.weixin.qq.com/s/mm9bXXTEzd8DwyYlMgGMZg
NLP多任务学习:一种层次增长的神经网络结构
https://mp.weixin.qq.com/s/fcFb6WkJVP8TYpoxkQgiWQ
CMU提出“十字绣网络”,自动决定多任务学习的最佳共享层
https://mp.weixin.qq.com/s/i7WAFjQHK1NGVACR8x3v0A
自然语言十项全能:转化为问答的多任务学习
https://zhuanlan.zhihu.com/p/362330594
深度学习多目标优化的多个loss应该如何权衡
https://mp.weixin.qq.com/s/ZyokVuCLHNbt7aXWzoJTFA
多任务学习在推荐系统和自然语言处理领域的总结
Recommend
About Joyk
Aggregate valuable and interesting links.
Joyk means Joy of geeK