第32卷第2期牡丹江大学学报Vol.32No.22023年2月JournalofMudanjiangUniversityFeb.2023文章编号:1008-8717(2023)02-0037-08收稿日期:2022-06-20基金项目:国家社科项目“基于语料库的当前我国立法语言研究”(项目编号:21AYY012)作者简介:郭康平(1997-),女,黑龙江绥化人,黑龙江大学在读硕士研究生,研究方向:话语分析。冯莉(1972-),女,黑龙江哈尔滨人,黑龙江大学教授,博士,研究方向:语言类型学与话语分析。从助词标注看汉语分词软件的问题郭康平1冯莉2(1.黑龙江大学文学院;2.黑龙江大学应用外语学院,黑龙江哈尔滨150080)摘要:以中文分词标注软件CorpusWordParser对助词标注的结果为研究对象,总结出六种标注错误类型:动词标记为助词、名词标记为助词、量词标记为助词或介词、代词标记为助词、助词标记为动词、助词标记为形容词。同时,比较了同类型的分词标注软件“ICTCLAS”,发现“IC-TCLAS”分词和标记词性的正确率高于“CorpusWordParser”,且两款软件存在共同的标记错误之处。最后,根据存在的共同错误类型,提出了相应的改进建议。汉语分词、标记技术研究以及方法研究等方面还有待改进和提升,人工检查在研究中必不可少,加强人工检查,能够提高词性标记的准确率。关键词:CorpusWordParser;助词;标注;分词中图分类号:H13文献标识码:AOntheProblemsofParsingSoftwareExposedfromAuxiliaryTaggingGUOKang-ping1FENGLi2(1.CollegeofArts,HeilongjiangUniversity;2.CollegeofAppliedForeignLanguages,HeilongjiangUniversity,HarbinHeilongjiang150080)Abstract:BasedontheresultofauxiliarytaggingbytheChineseparsingsoftwareofCorpusWordpars-er,sixtypesoftaggingerrorsaresummarized,namelywrongtaggingofverbs,nouns,...