第16期2023年8月无线互联科技WirelessInternetTechnologyNo.16August,2023作者简介:刘潇(1986—),男,山西长治人,工程师,硕士;研究方向:计算机技术应用。∗通信作者:季英凯(1971—),男,吉林吉林人,高级工程师,硕士;研究方向:疾控信息化建设。基于Flink的电子疾病档案数据处理模型设计与实现刘潇,季英凯∗(江苏省疾病预防控制中心公共卫生信息所,江苏南京210009)摘要:“十四五”期间,疾控面临着汇集各业务条线的数据以形成动态实时的电子疾病档案的任务。针对现阶段疾控信息化工作的现状,文章基于Flink构建了一个电子疾病档案的实时数据处理模型,使用消息中间件实现各个业务条线数据的发布与订阅。数据在Flink集群中实现了按主题目录的分流,检查与转换等操作,最终持久化写入HBase数据库,形成以个人信息为基础的各类业务数据的关联。实验与应用结果表明,该模型具有良好的数据处理能力,有效而可靠的实现了电子疾病档案的数据汇集。关键词:电子疾病档案;数据汇集;消息中间件;Flink中图分类号:TP391文献标志码:A0引言随着疾控信息化工作的不断深入,疾控的传染病、公共卫生突发事件、慢性病、免疫规划、精神卫生等业务条线的信息系统在不断地建立与完善,由于业务系统在建设之初缺乏总体规划,各自为政,各类数据难以支撑有效的业务协同服务,造成信息孤岛[1]。在当前各级疾控业务协作日渐紧密、内部一体化集成日渐成熟的大背景下[2],为了有效地对业务数据进行汇聚与利用,中国疾病预防控制中心制定的《疾病预防控制信息系统建设指导方案(2018年版)》要求,以国家和省统筹区域两级建设为重点,依托全员人口信息库等基础设施,构建实时共享的动态电子疾病档案(electronicdiseasesrecords,EDR)[3-4],以个人健康为核心,贯穿整个生命周期,以出生和死亡2个重要的生命节点为开始和结束,全程记录疾病发生、发展及转归的监测信息,形成以个人基础信息(人口学信息、出生登记、死亡登记)为基础,包含体检筛查史、疾病诊断史、检验检测史、治疗随访史、流行病学史和预防接种史等内容的主题数据目录[5],以支撑疾控各类业务的交互协同,为政府决策分析提供有效的支持。如何利用现有的业务系统实现各类业务数据的汇集,以形成实时共享的电子疾病档案成了疾控信息化建设面临的一个新的问题。当前,疾控的各类业务系统于不同的时间由不同的开发公司建设,所采用的技术架构、业务流程以及业务数据的格式各不相同,各业务数据与电子疾病档案的数据标准均存在一定程度的差异。基于这些问题,为...