分享
东北抗联历史人物事件知识图...—以陈翰章烈士生平事迹为例_王佳莹.pdf
下载文档

ID:400974

大小:1.62MB

页数:3页

格式:PDF

时间:2023-03-27

收藏 分享赚钱
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,汇文网负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。
网站客服:3074922707
东北 抗联 历史人物 事件 知识 陈翰章 烈士 生平事迹 王佳莹
2023年第22卷 第1期产业与科技论坛2023(22)1Industrial&Science Tribune东北抗联历史人物事件知识图谱的构建及应用 以陈翰章烈士生平事迹为例王佳莹 裴 尧【内容摘要】本文以陈翰章烈士生平事迹为例,整理归纳了 年期间公开发表的 篇相关文献,共获得 种实体,种关系,,个三元组。运用 软件对文献中的东北抗联历史人物事件进行数据挖掘,并在此基础上用 软件对相关历史人物之间以及历史人物和事件之间的相互关联进行可视化展示与分析,进而构建了陈翰章烈士人物事件知识图谱。通过本文的研究,能够将东北人民在中国共产党领导下,同日寇在艰苦险恶环境中英勇顽强斗争的史实,进行图谱化的展示。该方法通过知识图谱的构建,能够揭示东北抗联相关历史人物及事件之间的关联性,为大数据挖掘在东北抗联相关研究中的应用拓宽了渠道。【关键词】知识图谱;东北抗联;陈翰章【基金项目】本文为吉林省教育科学“十四五”规划 年度思政专项课题“东北抗联红色文化资源创新高职思政课实践教学研究”(编号:)成果。【作者简介】王佳莹,女,吉林电子信息职业技术学院讲师;研究方向:东北抗联红色文化、马克思主义理论与当代社会裴尧,吉林大学教授;研究方向:课程思政及地学大数据教学 一、引言东北抗联历史是东北人民在中国共产党领导下,浴血抗日过程中涌现的可歌可泣的红色过往。年“九一八”事变后,东北沦陷,党组织第一时间发表对日宣言,并派遣杨靖宇、赵一曼、魏拯民、周保中等党员到东北开展抗日工作。在日伪军力量薄弱的农村地区陆续组织东北反日游击队、东北人民革命军、东北抗日联军、东北民主联军,组织群众工作,建立东北游击根据地,开展游击战,牵制了大量日军。在与党中央失去联系、无后勤补给的情况下,抗联战士克服了东北恶劣自然环境的挑战,仍坚持同装备精良的侵略者开展了 年的浴血抗争。近年来,东北抗联的相关研究工作已经成为国内的研究热点,包括东北抗联史、东北抗联红色文化资源、东北抗联红色资源与思政课相结合的研究、东北抗日游击根据地研究及东北抗联数据库建设等。随着东北抗战史料的不断挖掘以及研究方法的创新,国内学者从各个角度展开深入研究,撰写文章、提出观点,形成了丰硕的研究成果。随着近年来文献史料的整理和深入挖掘,有关东北抗联研究也取得了丰硕的研究成果,积累了大量的文献资料。这些文献中隐藏着众多史实、事件、人物及其错综复杂的关系,不仅包括东北抗日联军内部人物之间的关系,还涵盖东北抗日联军与东北义勇军、中国共产党组织、共产国际、苏联、朝鲜的关系等,这些信息均以非结构化的文本数据的形式呈现。想要系统地阅读研究这些文献资料,需要耗费大量的时间,且很难发现其众待和处理代理人的机会主义行为,以保证委托研发项目的成果。当然,本研究仅是针对代理人单群体做了基于简单解析的分析,其理论深度和细度还不够充分。【参考文献】许儒航 基于计算机视觉技术的建设项目监管机理及方法研究 华北电力大学,黄颖,王勉,张铀 企业研发活动中的委托代理问题研究 科技进步与对策,():王宁,陈思 基于委托代理理论的企业研发活动研究科学学与科学技术管理,:舒红娟,宁宣熙 公共研发机构与政府之间的委托代理关系研究 中国科技论坛,():崔立红,梁婉颖 科技成果委托研发过程中政府权力与利益分配机制研究 郑州大学学报(哲学社会科学版),():冯芬芬 基于博弈论的串标行为分析及对策探讨 遵义师范学院学报,():,():,():周林荣,史文涛,关晓溪 基于权利结构不对等的“农超对接”供应链有机农产品的定价研究 遵义师范学院学报,():,产业与科技论坛2023年第22卷 第1期Industrial&Science Tribune2023(22)1多历史人物和事件之间的复杂关系。知识图谱由节点和边组成,是一种利用图模型描述知识之间关联关系的技术方法。通过采集结构各异、来源不同的东北抗联重大史实和人物资源数据,对庞大的文本数据进行大数据挖掘,发现人物和事件之间的相互关系,进而构建知识图谱,能够把我党领导下的东北地区抗战历史以更直观、动态、关联的形式可视化呈现。该方法有助于促进东北抗联史的研究,挖掘蕴含其中潜在的历史和学术价值。二、理论基础与研究现状 公司于 年提出了知识图谱概念,知识图谱包含实体、概念、属性、关系等信息,能够使用人与机器共同理解的语言,以图的形式描述真实世界。知识图谱的主要目的是根据知识之间的关系构建图谱,利用知识结构进行搜索,是人工智能研究的重要方向之一。国内外科技公司和研究机构纷纷开始构建知识图谱,如德国马普所的、清华大学的、复旦大学的 及谷歌的 等。目前,知识图谱在国内外引起了极大的重视,在如语义搜索、智能问答、辅助决策等领域都取得了极大的发展。刘勘等通过构建营商环境知识图谱,为政府业务流程整合以及制定优化营商环境决策提供了依据;沈旺等构建了数字人文视域下民国报纸的知识图谱;闻子墨等基于 构建知识图谱可视化地分析了临床用药及对治疗疾病的应用。是一款开源的跨平台可视化分析软件,其能够将 软件提取出的东北抗联历史人物事件进行知识图谱可视化。通过构建东北抗联人物知识图谱,能够直接形象地用图谱化的形式将东北 年抗战时期的历史人物及其关系可视化展现出来,拓宽东北抗联研究渠道,充实东北抗联研究。创新东北抗联红色文化资源的传承方式,让文本的文字以图形的形式立体直观的呈现出来,方便学习和研究。本文以陈翰章烈士生平事迹为例,构建东北抗联人物事件知识图谱,以知网下载的与陈翰章烈士有关的研究文献为素材,基于 软件提取实体,抽取节点和边,构建知识图谱三元组,在此基础上利用 软件建构可视化的东北抗联历史人物事件知识图谱,以期为进一步指导东北抗联史相关研究提供基础和参考意义。三、数据来源与词典构建从 下载东北抗联历史中陈翰章烈士的生平事迹资料,共检索到 年有关陈翰章烈士的 篇文章,将所有数据整合为 文件格式存储。基于简单共现关系,编写 代码,从 文本中提取与陈翰章将军生平相关联的人物事件,建立关系网络,并用 生成可视化图谱。在进行知识图谱构建之前,首先需要对数据进行预处理。对于数据挖掘来说,数据的预处理可能直接关系到数据分析和挖掘的结果准确性。本次研究工作,我们通过词典指定人物事件名称的方式进行实体识别。准备字典之前先要确定数据源,比如从知网下载张彦夫和吕博循发表的吉林籍抗日名将陈翰章生平事迹考为例,将下载的文本资料中的人名与历史事件写入自定义词典中,如“陈翰章”“东北反日联合军”“东北抗联第一路军”“魏拯民”“杨靖宇”等,将主要人物事件的名称保存至文件 中,为下一步提取实体做准备。对于实体识别,建立词典是一种效率较高的做法。但在提取实体的过程中,有时会提取到与所研究内容无关的词汇,如在本文档中提取出的“安详、郜先生、幸吉、敬佩、周旋”等词,对于知识图谱的建构无用,因此需要建立停用词表,将知识图谱中不需要的词汇放置在“停用词”文本中。为后续实体识别、实体抽取和关系建立做好准备。四、陈翰章烈士人物事件知识图谱构建就知识图谱的构建方法而言,主要涉及到命名实体识别、实体关系抽取、知识图谱构建等领域的研究。知识图谱中的节点称之为实体,比如一位人物,或是抽象的概念,比如重大史实、历史人物、重要事件等。知识图谱中的边表示实体之间的关系,如人物和历史事实之间的关系、人物和重要事件之间的关系等。(一)文本中实体识别。构建知识图谱的第一步是获取文本中的实体,从待测文本中识别出被标注为命名实体的部分,加以提取并归类。实体是生活中具体的实物,知识图谱中的实体通常通过文本中的词汇或短语进行描述,如东北抗联红色文化资源中的人名、游击根据地名称、战役名称、重要会议名称等。在陈翰章烈士生平事迹文本中,像“陈翰章”“魏拯民”“杨靖宇”“东北抗日联军第一路军”“敦化”等即为实体,这些实体之间有着复杂的关系。从下载的文本语料中挖掘出尽可能多的高质量词汇,读入已下载文本的每一行,以自定义词典为依据提取该行(段)中出现的实体。在文本中由于同一实体其相似名称有多种,如“抗联二军第二师”即“东北抗日联军第二军第二师”。因此,需要将实体进行清洗和归一化,比如将“敦化县”、“敦化城”、“敦化”等都统一清洗归一为“敦化市”,以提高所构建知识图谱的质量和效率。(二)实体间关系抽取。命名实体识别是知识图谱构建的基础,而关系是知识图谱最重要的组成成分之一。知识图谱中用节点来代表实体,用边来描述实体间的关系及属性。关系抽取旨在从无结构的文本中抽取不同实体之间的关系。在关系抽取部分,主要研究内容为关键历史人物、事件之间相互关系网络的挖掘。由于每个人物及历史事件均具有自己的属性信息,因此可将人物之间的关系、人物与事件之间的关系以及事件与事件之间的关系抽象为社会网络。首先,将每个实体(人物、事件)抽象为一个节点,而每个节点具有自己的属性信息,如名字、年龄、性别等。如果一个人物与另一个人物具有联络信息,则可视为两个节点之间具有边,而人物之间联络次数的多少则决定了边的强度,故而可以推断,两个节点之间边的强度越大,则说明这两个人物和相关关系在整个网络中权重越大,则越有可能是整个关系网中的关键人物和关系。实体关系抽取是在命名实体识别的基础上,抽取文本中实体间相互关系,并将其生成 实体,关系,实体 的三元组,这对于知识图谱的构建具有重要意义。比如在吉林籍抗日名将陈翰章生平事迹考这一文本中,“年 月初,在安图县两江口村汉窑沟,抗联第一路军第三方面军建立,陈翰章担任指挥”。实体为“安图县”、“抗联第一路军第三方面军”、“陈翰章”,这里抽取的三元组为 陈翰章,指挥,抗联第一路军第三方面军 、陈翰章,活动地,安图县 、抗联第一路军第三方面军,成立地,安图县 ,在知识图谱中具体表示如图 所示。2023年第22卷 第1期产业与科技论坛2023(22)1Industrial&Science Tribune图 陈翰章事迹知识图谱实体间关系举例(三)东北抗联历史人物事件知识图谱构建。东北抗联历史人物事件知识图谱主要就是由节点和边组成,因此知识图谱实际是一张图,知识图谱中可以标示出所有与节点间相关的连接边。使用 软件能够将陈翰章生平中的人物事件可视化,本文以陈翰章烈士生平事迹为例,构建的知识图谱共包含 个节点,条边,,个三元组,部分结果展示如图 所示。可视化技术的主要应用是对挖掘出的数据信息结果进行知识表达,在本文中主要指对挖掘的东北抗联历史人物事件相关信息进行可视化表达。图 陈翰章事迹知识图谱实体间关系举例(基于 软件)通过图 可以看出,“陈翰章”“周保中”“杨靖宇”“魏拯民”“东北抗日联军第一路军第三方面军”“东北义勇军”等节点最大。本次工作以句子为单位计算不同人物事件之间出现在文本中的频次,如“陈翰章”与“东北抗日联军第一路军第三方面军”共出现 次,这两个实体之间关联紧密。“东北义勇军”与“周保中”共出现 次,说明这两个节点关联较为紧密。各节点之间的关系强度是由节点之间的连线粗细来体现的,连线越粗,表示人物事件之间的联系越紧密。由图 中我们还可以看到,陈翰章加入过东北义勇军,指挥东北抗日联军第一路军第三方面军打下许多著名战役。“九一八事变”后,陈翰章加入救国军(在图谱中统一归为东北义勇军),投身于抗日斗争,在救国军中结识了共产党员周保中同志,并经过战斗的历练加入中国共产党,逐步成为周保中同志的得力干将。现有研究论文中,关于陈翰章一生中打下的胜仗,主要涉及其指挥东北抗日联军第一路军第三方面军进行的寒葱岭伏击战、安图县大沙河战役、牛心顶子战役等。其中,图谱中展示的大沙河战役是在东北抗联著名将领魏拯民指挥之下进行的战斗。年,东北抗日联军第一路军军长杨靖宇牺牲后,陈翰章带领第三方面军继续坚持游击战争,战斗至生命的最后一刻,牺牲于镜泊湖畔。由图 可见,由于目标文本中涉及的人物均与“陈翰章”为核心,提取的其他人物和事件亦是以陈翰章为核心进行关系提取的,其他人物和事件之间其实也存在关联,但是由于目标文本中提及次数不多或者没有重点介绍,因此在图谱中没有连接边,随着文本资料的增多,相关的关系也会显示清楚。五、结语本文通过对 下载相关文献资料的梳理与挖

此文档下载收益归作者所有

下载文档
收起
展开