6

核酸结果统计难?复旦博士生的操作火了

 2 years ago
source link: https://mp.weixin.qq.com/s?__biz=MjM5MjAxNDM4MA%3D%3D&mid=2666511010&idx=1&sn=2f11e8bcb91c8504f329547ba7f998ea&chksm=bdb7d3e18ac05af7fa92b40a1971c51892b59662e9f731ae5c85e7687c8b5f26b27d83a2ce3c
Go to the source link to view the article. You can view the picture content, updated content and better typesetting reading experience. If the link is broken, please click the button below to view the snapshot at that time.
neoserver,ios ssh client

核酸结果统计难?复旦博士生的操作火了

人民日报 2022-04-07 23:27

人工核查核酸报告费时费力又易出错,怎么办?4月7日,复旦大学官微发文,自3月初以来,学校启动常态化核酸筛查工作,要求班级辅导员必须核查学生“健康云”核酸完成截图,确保“不漏一人”。学校信息科学与工程学院博士生李小康的操作火了,几分钟就能快速核查数百人的核酸完成截图,大大提高核查效率和精度!

640?wx_fmt=jpeg
从1小时到2分钟,一串代码搞定据了解,李小康目前担任学院2019级信息1班辅导员。对于核查核酸报告的工作,他表示:“听起来好像很简单,但实际做的时候,一个班级的截图可能就需要花上半小时核查,如果是人数多的院系可能需要更久,还可能会看错看漏。”
640?wx_fmt=jpeg
李小康正在做志愿者作为生物医学工程专业博士生,他的研究方向是医学影像与人工智能,平常会接触很多图像处理方法。李小康第一时间想到以前学到过的OCR (Optical Character Recognition,光学字符识别)技术。

“OCR可以把图像中的文字识别出来,转换为文本信息,就方便用来核查了。而且因为核酸截图是打印字体,识别率非常高,几乎可以做到100%准确。”

他还想到了Python语言中的正则表达式——可以搜索到字符串中的特定模式内容。

“使用正则表达式就可以把想要的信息从OCR识别的文本中筛选出来。最后,确认好每张截图里的姓名、检测时间和是否已采样等信息后,再把所有人的结果输出到Excel文件中,方便人工确认。”

最后,李小康确定了“OCR文字识别+正则表达式筛选”的程序思路。3月15日晚,他花了一个多小时就写出了初始代码,共130行,发现确实能够跑通,且运行效率很高。
640?wx_fmt=jpeg
李小康最初写程序时和学工同事的聊天程序一写好,李小康就在自己班级的核酸截图数据上进行验证,准确率果然很高,甚至检测出了之前人工核查没有发现的问题。并且,程序运行时间很短,80多张图只需要20多秒。复旦大学:有望全校覆盖目前,程序已在该学院服务两周。李小康曾让别的老师试用自己的程序进行核查。800幅截图,原来要几个人核对一个多小时,现在只需等2分钟就拿到结果。
640?wx_fmt=jpeg
他把这件事发到朋友圈之后,不少同事表示很感兴趣,他还把代码分享了出去。为了方便不会编程的老师使用,李小康最后还把程序进行了封装——用的时候,只要在命令行输入一行代码就可以运行。
640?wx_fmt=jpeg
程序输出的Excel文件
据了解,学校信息办也与李小康进行了对接。预计在不久的将来,师生们就可不用再手动收集核酸截图,而是通过小程序直接上传图片,就可在后台随时查看统计结果。
640?wx_fmt=jpeg
640?wx_fmt=jpeg
640?wx_fmt=jpeg
640?wx_fmt=jpeg
4月7日下午,记者与李小康取得联系时,他正在学校楼栋担任志愿者送饭。他说过:“原理也很简单,只要是会写代码的人第一时间就会明白是怎么回事,但是不做相关工作的感受不到这件事情的费时费力,自然也不会想出办法。我只是用我学到的知识解决实际工作中的困难。”用所学贡献青春力量!
为李小康点赞!

来源:中国青年报(见习记者:陈垠杉),综合复旦大学(作者:殷梦昊)

本期编辑:胡洪江、刘杰

640?wx_fmt=gif

觉得好看,请点这里


About Joyk


Aggregate valuable and interesting links.
Joyk means Joy of geeK