投稿网址:www.stae.com.cn2023年第23卷第17期2023,23(17):07436⁃08科学技术与工程ScienceTechnologyandEngineeringISSN1671—1815CN11—4688/T引用格式:蒋丽媛,吴亚东,王书航,等.融合笔画特征的命名实体识别方法[J].科学技术与工程,2023,23(17):7436⁃7443.JiangLiyuan,WuYadong,WangShuhang,etal.Namedentityrecognitionmethodincorporatingstrokefeatures[J].ScienceTechnologyandEngineering,2023,23(17):7436⁃7443.融合笔画特征的命名实体识别方法蒋丽媛,吴亚东∗,王书航,张巍瀚,李懿(四川轻化工大学计算机科学与工程学院,宜宾644000)摘要汉字是象形文字,其字形特征对于中文命名实体识别有着重要的作用。针对双向长短期记忆模型(bi⁃directionallongshort⁃termmemory,BiLSTM)提取部首,命名实体识别准确率不高的问题,提出笔画组成编码器,用于获取汉字的字形特征,并将笔画字形特征向量和预训练的语言表征模型(bidirectionalencoderrepresentationfromtransformers,BERT)输出的字向量进行拼接,将拼接后的向量放入双向长短期记忆模型与条件随机场(conditionalrandomfield,CRF)相连的标注模型(BiLSTM⁃CRF)中进行命名实体识别。实验表明,所提的方法在Resume数据集上命名实体识别准确率有显著提升。相较于用卷积神经网络做编码器提取汉字字形特征,准确率高出0.4%。相较于使用BiLSTM提取的部首特征模型和加入词典的长短期记忆模型(latticeLSTM),其准确率分别提升了4.2%、0.8%。关键词字形特征;中文命名实体识别;BiLSTM⁃CRF;笔画组成编码器;动态词向量中图法分类号TP391.1;文献标志码A收稿日期:2022⁃06⁃07;修订日期:2023⁃03⁃22基金项目:四川轻化工大学人才引进项目(2020RC20)第一作者:蒋丽媛(1997—),女,汉族,四川南充人,硕士研究生。研究方向:自然语言处理。E⁃mail...