面向淋巴水肿疾病的电子病历命名实体识别应用研究汤昊1苏万春2冀秀元1信建峰2夏松2孙宇光2徐毅1沈文彬2(1中国科学院自动化研究所北京1001902首都医科大学附属北京世纪坛医院北京100038)〔摘要〕目的/意义探讨人工智能技术应用于淋巴水肿患者电子病历非结构化文本数据的关键实体识别问题。方法/过程阐述样本稀缺背景下模型微调训练的解决方案,选取首都医科大学附属北京世纪坛医院淋巴外科既往收治患者594例为研究对象,依据临床医生标注的15种关键实体类别,微调GlobalPointer模型的预测层,借助其全局指针识别嵌套和非嵌套的关键实体。分析实验结果的准确性和临床应用可行性。结果/结论微调后模型总体精准率、召回率和Macro_F1均值分别为0795、0641和0697,为淋巴水肿电子病历数据精准挖掘奠定基础。〔关键词〕淋巴水肿;电子病历;命名实体识别;自然语言处理;医学〔中图分类号〕R-058〔文献标识码〕A〔DOI〕103969/jissn1673-6036202402009StudyontheApplicationofNamedEntityRecognitioninElectronicMedicalRecordsforLymphedemaDiseaseTANGHaocheng1,SUWanchun2,JIXiuyuan1,XINJianfeng2,XIASong2,SUNYuguang2,XUYi1,SHENWenbin21InstituteofAutomation,ChineseAcademyofSciences,Beijing100190,China;2BeijingShijitanHospital,CapitalMedicalUniversity,Beijing100038,China〔Abstract〕Purpose/SignificanceThepaperdiscussestheapplicationofartificialintelligencetechnologytothekeyentityrecognitionofunstructuredtextdataintheelectronicmedicalrecordsoflymphedemapatientsMethod/ProcessItexpoundsthesolutiono...