20《电视技术》第47卷第1期(总第566期)PARTS&DESIGN器件与设计文献引用格式:孙文涵,王俊杰.基于BERT的施工安全事故文本命名实体识别方法[J].电视技术,2023,47(1):20-26.SUNWH,WANGJJ.NamedentityrecognitionmethodofconstructionsafetyaccidenttextbasedonBERT[J].VideoEngineering,2023,47(1):20-26.中图分类号:TP311.1文献标识码:ADOI:10.16280/j.videoe.2023.01.005基于BERT的施工安全事故文本命名实体识别方法孙文涵,王俊杰(中国海洋大学工程学院,山东青岛266400)摘要:为解决传统施工安全管理中对事故报告信息分析效率低的问题,利用自然语言处理(NaturalLanguageProcessing,NLP)技术,提出基于双向编码器表示(BidirectionalEncoderRepresentationsfromTransformers,BERT)的施工安全事故文本命名实体识别方法。以自建的施工安全事故领域实体标注语料数据集为研究对象,首先利用BERT预训练模型获取动态字向量,然后采用双向长短时记忆网络-注意力机制-条件随机场(BiLSTM-Attention-CRF)对前一层输出的语义编码进行序列标注和解码以获取最优文本标签序列。实验结果表明,该模型在自建数据集上的F1值分数为92.58%,较基准模型BiLSTM-CRF提升了4.19%;该方法对事故时间等5类实体识别F1值均可达到91%以上,验证了该方法对施工安全事故实体识别的有效性,说明模型可用于实际施工知识管理中并指导建筑安全管理的安全培训。关键词:双向编码器表示(BERT);施工安全管理;命名实体识别;知识图谱;知识管理NamedEntityRecognitionMethodofConstructionSafetyAccidentTextBasedonBERTSUNWenhan,WANGJunjie(SchoolofEngineering,OceanUniversityofChina,Qingdao266400,China)Abstract:Inordertosolvetheproblemoflowefficiencyofaccidentreportinformationanalysisintraditionalconstructionsafetymanagement,aBERT-basedconstructionsafetyaccidenttextnamedentityrecognitionmethodwasproposedusingNaturalLanguageProcessing(NLP)technology.Aself-builtcorpusdatasetofentityannotationinthefieldofconstructionsafetyaccidentswasusedasthere-searchobject.Firstly,BidirectionalEncoderRepresentationsfromTransformers(BERT)pre-trainingmodelwasusedtoobtaindynamicwordvectors,andthenusedBidirectionalLongShortTermMemory-Attention-ConditionalRandomField(BiLSTM-Attention-CRF)tosequentiallyannotateanddec...