2

复旦博士开发小程序,2 分钟核对 800 幅核酸截图助力防控,疫情中你在哪个瞬间体会到...

 2 years ago
source link: https://www.zhihu.com/question/526743020
Go to the source link to view the article. You can view the picture content, updated content and better typesetting reading experience. If the link is broken, please click the button below to view the snapshot at that time.
neoserver,ios ssh client

复旦博士开发小程序,2 分钟核对 800 幅核酸截图助力防控,疫情中你在哪个瞬间体会到了知识的力量?

人工核查核酸报告费时费力又易出错?@复旦大学 信息科学与工程学院博士生李小康用一个多小时写出130行代码,快速开发了一项小程序。800幅核酸截图,原来…
292
378,743

144 个回答

编程话题下的优秀答主

这真的不太好意思能感受到知识的力量,更让我感受到了无知的力量。

一个OCR识别都能吹成这样。

我在百度上找了一个核酸检测报告的截图,时间比较早,但是也能凑合用。

v2-260fb9d8b60480c6c82db9899fa6c86b_720w.jpg?source=1940ef5c

可以看到,这上面有姓名,身份证号,检测机构,检测时间还有检测结果。

为什么可以识别呢,就是因为用了OCR识别库。

OCR的全称叫作“Optical Character Recognition”,即光学字符识别。它的作用就是识别并获取图像里的文字信息。

我们平时的拍照取照片里面的字用的就是这个技术。

那么问题回来了,如果我们要做这个「小程序」的话该怎么办。

如果是我的话:

第一步:调用需要的库,比如图像读取库,OCR库,文档处理库(比如pandas)

第二步:批量读取图片

第三步:把图片里面的文字读出来

第四步:用正则表达式把文字切分好,并保存在表格中

第五步:用一些纠错机制,检查下excel文档有没有常识性错误,比如位数不对的身份证号,错误的日期等等。

提交文档,结束。

这些东西交给一个大三的计算机本科生应该问题不大,因为都是现成的工具,只需要会查找,并复制粘贴就可以了。


往期回答推荐:

为什么国外小孩词汇只有2000个就能正常交流,而国内大学生4000个词汇量却是哑巴英语?

如何正确的从零开始学英语?

平凡:怎样自学雅思? 万字长文/雅思备考保姆式攻略

这算啥,上次领导半夜打电话喊我加班说有个很重要的工作。 到了办公室才发现领导喊了十几个人,给了我们发了个excel表,上边有全县所有居民的身份证号,说需要把表里所有大于60岁和小于5岁的人挑出来,大约十几万人,每人负责1万人,然后给我们每人一台计算器,让我们一个一个根据身份证号里的年份计算年龄把不符合的删掉…… 我当时就傻了,领导是真的让我们用计算器一个一个去算………然后我说:领导,其实还有更简便的方法,就是今年是2022年,大于60岁的人出生年份在1962年之前,小于5岁的人出生年份在2017年之后,只要身份证号码符合这两个特点就可以了,不需要每个都用计算器去算。 领导说:恩有道理,这是个好办法。 大家也都附和说是好办法。 然后一屋子愉快的干了起来……………………………

有关部门真的睿智。

随便哪个大学,计算机类专业,大二以上,都能搞定吧?

媒体还争相报道?

魔都乱象丛生的操作似乎也不奇怪了。


又让我回忆起这个哭笑不得的“技术攻关”。有关部门人傻钱多也就算了,还拿来宣传

中国科学技术大学 计算机技术工程硕士

第1层反应是:啊?就这?好意思吹牛?

固定位置大小截图印刷体汉字的OCR,网上免费的API,开放的源代码一堆,知乎本地搜索就有gitee源代码可以复制。

假如叫个软件工程师给一天搞定,估计工程师苦干两小时,摸鱼六小时。。。开森。

第二层反应是:嗯嗯,此记者的技术素养一言难尽

这种难度的题目,本科生拿来当毕业设计估计会被老师打,专科生做毕业设计也得不到优秀:技术难度真没有,工作量还不足。。。苦逼被复旦,博士,人工智能,图像识别几个高大上的名词一唬就迷糊了。

第三层反应是:记者好职业,会抓流量赢麻了

当今社会流量是王道。本来一个毫无难度的小程序,扔到网上木有人看的水平,可记者妙笔生花,结合抗疫大局,博士头衔加持,人工智能增色,图像识别加分,马上感觉不一样了。再来点争议,流量原地垂直起飞。

我帮防疫人员写的vba小程序分类红黄码,可以把眼花缭乱干两小时的活缩短到5分钟内完成。可惜我不是名校博士,工具是破破的VBA,木有人工智能概念看点,根本不可能有人报道。

记者传播学满分,流量绩效满分。

第四层反应是:记者眼光远大 ,我的批评草率了

没错,他如老鹰般锐利的眼光一眼看出了基层信息化应用水平不足的短板:明明几行代码就能解决的事情,却要靠人力堆积。

他妙笔生花的新闻报道积极弘扬知识技能的力量,赞颂信息化赋能的威力,无论在鼓励小朋友学习、推进信息化在基层的普及还是治理能力赋能上都颇有眼光。

关键是人家报道弘扬科技服务抗疫,无论如何不该批评,确实草率了。

迷途小书童有诗赞曰:

博士扬名立万,
A I 还看复旦;
防疫科技闪闪,
信息技术要赞:
流量成千上万,
技术不忍细看。

记者同志,过马路的老奶奶我都不扶,就服你。嘿嘿嘿。

看到这个,你还相信之前上海吹的高科技精准防疫是真的吗?


About Joyk


Aggregate valuable and interesting links.
Joyk means Joy of geeK