摘 要:探讨基于多源数据融合的基层医务人员传染病感染预防方法。对于已知和新型的传染病,综合运用互联网不同类型信息、已发表的研究成果等数据,构建传染病知识库及传染病态势感知系统。以2019-nCoV肺炎疫情及2020年7月鼠疫疫情为例,此方法可以使预警时间较大幅度提前,并较为准确地实现病因、发源地及类似病种的锁定。进而,基层医务人员可以直接提取已构建知识库中传染性非典型肺炎的相关内容,采取针对性的传染病感染预防措施。采用多源数据融合的方法,可以提升对未知传染病预警能力,使传染病相关知识获取更为便利,进而提高基层医务人员传染病感染防控水平。
关键词:多源数据融合 传染病 基层医务人员
新型冠状病毒(2019-nCoV)肺炎疫情感染范围广、传播速度快、防控难度大,是重大突发公共卫生事件。2020年9月8日,总书记明确指出要针对此次疫情暴露的问题,抓紧补短板、堵漏洞、强弱项,提高应对重大突发公共卫生事件的能力和水平[1]。在此次疫情中,一方面随着我国不同城市及城乡之间人员流动性增强,疫情极短时间内散播全国各地;另一方面由于不同地区、不同科室、不同医务人员对于传染病相关信息的掌握能力存在较大差距。因此,在2019-nCoV疫情快速大范围传播时,由于通报信息滞后、传染病相关知识不足、防范意识不强产生的医务人员感染问题凸显。截至2020年1月23日(全国各地陆续启动突发公共卫生事件一级应急响应时间),仅武汉市就已有15名非传染科的脑神经外科医务人员确诊为2019-nCoV感染的肺炎,其中危重症1例。基层医务人员作为基层医疗的主要承担者,在疫情预警通报信息滞后及传染病相关知识储备不足等方面的问题尤为突出。
多源数据融合技术旨在将不同来源的数据进行融合处理,得到比单一数据来源更加准确的信息及更加广泛的用途。多源数据融合技术起源于军事、情报领域,并逐渐在其他领域得以应用[2]。现有研究结果表明,该方法已应用于辅助医疗诊断,实现智慧医疗方面[3]。感染防控的本质与军事、情报的本质相同,都侧重于信息的提前获取,以及对策的准确制定。因此,多源数据融合技术与感染防控具有先天的匹配性。本文重点从提升对于不明发源地、不明病因传染病的预警能力,以及降低非传染专业医务人员在传染病相关知识获取及使用难度两个方面进行分析,探讨基于多源数据融合的基层医务人员传染病感染预防方法,现报告如下。
基于多源数据融合的传染病态势感知系统
现存问题:现有研究结果表明,无论是2003年SARS肺炎疫情,还是当前的2019-nCoV肺炎疫情,都暴露出我国在新发传染病侦测能力方面仍存在显著的差距[4-5]。钟南山院士指出:“针对此次2019-nCoV疫情最有效的防控手段为早发现、早隔离。尽可能减少传播,传播的患者减少,出现超级传播者的概率就减少。”“早发现、早隔离”不仅仅是2019-nCoV疫情最有效的防控手段,同时也是基层医务人员防控的最有效手段。传统的工作模式主要依赖于上级通报。为了确保通报信息的准确性,避免造成社会不必要的恐慌,需要经过缜密的核实后,再按照相关要求逐级完成上报及通报环节。这些环节必将导致基层医务人员对传染病发展态势认知具有滞后性,不便于传染病感染预防工作的开展。因此,在新型传染病快速大范围爆发时经常出现医务人员感染数量较大的情况。
基于多源数据融合的传染病态势感知系统:在大数据时代,人们已经日益习惯于在网络上随时获取自己需要的信息,并留下使用的痕迹[6]。根据中国互联网络信息中心(CNNIC)公布的第46次《中国互联网络发展状况统计报告》,截至2020年6月,我国互联网搜索引擎获取信息的用户规模达到7.66亿,占网民总体81.5%,并指出对搜索数据进行挖掘,可在突发事件态势研判等方面发挥积极作用。因此,通过充分挖掘运用互联网信息构建的传染病态势感知系统,将比主要依赖于上级通报的传统工作模式在内容上更加丰富,在时效上更加及时。基于多源数据融合的传染病态势感知系统,首先对中国疾控中心官网、中国知网等传染病相关内容进行梳理,并将传染病名称(中英文)、文献常用关键词,临床表现常用词、常用药品及物品等高频词汇作为关键词。然后,定期获取相关关键词的百度指数、微信指数、360指数、微博指数、阿里指数等网络指数。当关键词的城市搜索排行与城市人口排行出现明显差异,或者指数出现异常增长时,综合运用百度指数中“人群画像”及“需求图谱”等模块对发源地及病因进行预判,进而实现针对不明发源地、不明病因传染病的感染预警。
基于多源数据融合的传染病知识库
现存问题:一方面医疗人力资源分布不均衡。在近期中国医师协会全科医师分会的调查中显示,学历越高、职称越高、从事专业时间越长的基层医务工作者,对突发公共卫生事件应急救援能力越强[7]。但是,在大型综合医院中聚集了大量高学历人才,而在基层医院(社区卫生服务中心、乡镇卫生院、村卫生室)人员则以大专、中专学历为主[8]。另一方面基层医务人员相关学习培训中关于传染病的教材内容滞后问题较为严重,如教科书中列举的脊髓灰质炎等传染病现已大幅减少,冠状病毒肺炎、H7N9禽流感、埃博拉等新型传染病明显增加,但迄今对其防疫知识尚未被编入培训教材中[9]。
基于多源数据融合的传染病知识库:当前,相关医务人员已经对传染病开展了大量的研究工作,成果是丰富的、内容是详实的。目前缺少的是对医务人员感染预防研究成果、成功失败两方面经验的梳理,并使基层医务人员可以较为便利的获取相关知识的方法。基于多源数据融合的传染病知识库,主要是按照《中华人民共和国传染病防治法》规定的传染病分类,对中国疾控中心官网、中国知网等公开医务人员感染方面论文获取相关内容进行梳理,并按照传染病名称、传播途径、临床表现、使用药品、常规防控措施、医务人员感染原因、医务人员防控建议及成功经验、常用敏感词汇、流行病学调查方法等方面内容填入ACCESS数据库。常用敏感词汇与“基于多源数据融合的传染病态势感知系统”中提到的关键词选择方法一致。
讨论
2019-nCoV肺炎疫情:以2019-nCoV肺炎疫情为例,在2020年1月23日(全国各地陆续启动突发公共卫生事件一级应急响应的时间)前,传染病态势感知系统中传染性非典型肺炎相关大量关键词“SARS”“冠状病毒”“非典型肺炎”等,于2019年12月30日均出现3倍以上的激增,出现高危预警信号。以“SARS”为例,日常百度指数为900左右;2019年12月30日激增至5 532;武汉市为地域搜索排行的第1名,且搜索总量远大于排名第2名至第10名总搜索量之和。该情况与武汉市在全国人口数量排行情况严重不符,存在爆发聚集性传染性疾病的可能。同时,关键词的相关词搜索度排名靠前的为“SARS”“非典”“SARS病毒”“武汉”“肺炎”;相关词搜索变化率增幅靠前的为“SARS”“SARS病毒”“SARS冠状病毒”“武汉SARS”“不明原因肺炎”。因此,预测病因疑为冠状病毒、发源地疑为武汉市、类似病种为乙类传染病中传染性非典型肺炎(SARS)。
2020年7月鼠疫疫情:以2020年7月我国突发的鼠疫疫情为例,由于内蒙古巴彦淖尔市出现腺鼠疫病例,内蒙古于2020年7月5日发布鼠疫防控Ⅲ级预警信息。传染病态势感知系统中鼠疫相关关键词“鼠疫”,于2020年6月30日出现近3倍的激增,出现高危预警信号。“鼠疫”为关键词,日常百度指数为1 500左右;2020年6月30日激增至4 439;并在后期长期处于5 000浮动,在7月4日激增至22 690。同时,关键词的相关词搜索度排名靠前的为“黑死病”“天花”“巴彦淖尔”“腺鼠疫”“旱獭”;相关词搜索变化率增幅靠前的为“腺鼠疫”“内蒙古鼠疫”“鼠疫疫苗”“鼠疫能治好吗”“旱赖”。因此,预测病因疑为腺鼠疫,发源地疑为内蒙古巴彦淖尔市,类似病种为甲类传染病中鼠疫。
综上所述,采用基于多源数据融合的基层医务人员感染预防方法,可以较大幅度提升预警能力。基层医务人员可以在传染病知识库中对关键词进行搜索,获得相关的防控信息,并采取针对性的感染预防措施,进而提高基层医务人员感染防控水平。
参考文献
[1].在全国抗击新冠肺炎疫情表彰大会上的讲话[J].国务院公报,2020(26):10-17.
[2]周群,化柏林.基于多元数据融合的科技决策需求主题识别研究[J].情报理论与实践,2019,42(3):107-113.
[3]杜保臻.多源数据融合系统框架与证据理论算法研究及其在智慧医疗中的应用[D].济南:山东大学,2019.
[4]丁蕾,蔡伟,丁健青,等.新型冠状病毒感染疫情下的思考[J].中国科学:生命科学,2020,50(3):247-257.
[5] Feng Z,Li W,Varma JK.Gaps remain in China's ability to detect emerging infectious diseases despite advances since the onset of SARS and Avian Flu[J].Health Affairs,2011(30):127-135.
[6]赵明珍,林鸿飞,徐博,等.面向社交网络的潜在药物不良反应发现[J].中文信息学报,2017,31(5):194-202.
[7]陈淑玲,吴苏伟,杜雪平,等.疫情下对全科专业住院医师规范化培训的思考与建议[J].中国全科医学,2020,23(28):3503-3507.
[8]王佳,路宁,崔曼莉,等.新型冠状病毒肺炎疫情防控给全科医学发展带来的思考[J].中国全科医学,2020,23(9):1090-1094.
[9]赵家义,沈璐,韩一平,等.网络自主学习平台结合案例教学在全科医学教学中的探索与研究[J].中国高等医学教育,2016(12):63-64.