前段时间,复旦博士生编写的利用OCR自动检测学生核酸截图的新闻火了,南通开发区疫情数据专班的同志看到后深有感触:在疫情数据处理中,快速、准确的技术太重要了!如今幸运的是,在南通开发区新冠肺炎联防联控指挥部也拥有了这样一位技术“钻”家。
他,就是疫情期间,被南通开发区新冠肺炎联防联控指挥部借用的南通高等师范学校附属小学的副校长毛永峰。
自2月初以来,南通市启动常态化疫情重点人员筛查跟踪及管控工作,根据市指挥部要求,开发区要对公安、疾控每天大数据进行流转,并根据摸排结果,上报市网上系统,以确保重点人员“一个不漏”。
对于此项工作,每天基层人员要摸排居民、外来人员大量的健康监测数据,再用固定的统计表导入市级疾控系统。基层社区流动人口情况复杂,加上社区工作人员工作头绪繁杂,用于处理数据的力量不足,加之市级汇总表有近30个项目,面对每天社区人口大量数据录入,经常造成信息填写规范标准不一致,如出现身份证、管控状态等信息填写出错。最麻烦的有两个地方,一是根据管控时间要求,每天要更新管控人员的“集中隔离、居家健康监测、严格健康监测、自我健康监测”状态;二是处理外来人员对应地区的省、市、区地区码,需要查找市级对照表,再用对应代码表示。有时一条数据要花上数分钟处理,面对数千相关数据,基层更是加班加点,24小时轮班作战。
为提高基层疫情监测数据统计的质量和效率,在浙江大学读研期间就对数据分析比较擅长的毛永峰,马上利用自身专长,基于C#语言开发了“个案表转市系统导入表”软件,自动处理基层个案表,实现单元格合并取值、身份证有效性检测、年龄和性别自动处理、根据日期流逝对当前管控状态自动调整、根据来源地省市区地址模糊查询并自动生成对应地区代码,快速汇总人员信息,生成规范报表,使基层日常疫情监测统计工作实现自动化、及时化、高效化,大大减轻基层的数据处理工作量。
3月初,疫情形势变得严峻,对于隔离人员要进行相关双采双检核酸检测,根据密接、次密等情况又有所不同,每天手工更新费时费力,一不小心还有可能出错。毛永峰又研发了一款“管控人员核酸双采双检系列日期计算器”,根据人员性质和管控初始时间,计算出每个人员具体到日期的核酸采样节点,大大方便了工作人员。
随着流调数据的增加,来自南通各县(市、区)的相关人员核实信息多了起来,需要第一时间分派到各相关街道核查。发来的数据中人员地址有时是小区,有时是道路,还有时是工厂,外区来的数据中常常把“苏锡通”列为“开发区”,需要人工甄别,遇到不熟悉的道路和工厂,还需要用百度地图查找。听起来好像很简单,但实际做的时候,确定一个人员的分派街道需要不少时间。毛永峰想到了大家常用Excel,他确定了“用快速排序整理数据+用二分法模糊搜索”的快速查找思路,一个晚上收集整理出开发区所有街道、社区、小区、工厂、企业名,设计出基于Excel VBA的小工具,运行效率很高,搜索结果实时出现,往往一两个字就能确定所属街道,对于没有收录的地址,可以手工实时增补到Excel表格中。
目前,他开发的几个工具已在南通开发区新冠肺炎联防联控指挥部和开发区各街道服务,原来要几个小时核对的工作量,现在只需1分钟左右就能得到结果。
同事都称他为本土“技术专家”,他面带微笑,略带调侃地说:“我只是个搬砖的‘钻’家,集中集体的智慧结合我的专业知识帮助大家解决实际工作中的一些困难而已,相信疫情会很快过去,我们一起加油!”钱咸华