第40卷第3期统计研究Vol.40,No.32023年3月StatisticalResearchMar.2023人口普查中行业和职业编码智能化*——国际经验与中国进程孙望书孙旭内容提要:行业和职业编码是人口普查中行业和职业信息采集与量化分析之间必要的资料整理环节。随着信息技术的快速发展及其在社会管理工作中的广泛应用,人口普查行业和职业编码走上了智能化探索之路。智能化计算机编码极大减少编码工作对人工的依赖,显著降低编码成本,提高数据的时效性,控制编码环节的再生性误差。本文结合国内外相关研究,总结计算机编码的两种基本实现思路,阐述字典编码方法和模型编码方法的原理、技术及其在人口普查编码实践中的应用。我国在前六次人口普查中,行业和职业编码均由人工完成,第七次全国人口普查采用计算机辅助编码技术,初步实现行业和职业编码智能化。未来可以有针对性地借鉴其他国家社会调查编码工作的先进经验,向全面智能化方向迈进,进一步提高计算机编码方式在我国社会精准化管理中的服务水平。关键词:行业和职业编码;人口普查;信息技术;文本检索;机器学习DOI:10.19343/j.cnki.11–1302/c.2023.03.012中图分类号:C812文献标识码:A文章编号:1002–4565(2023)03–0151–10——————––—–*基金项目:全国统计科学研究项目“大型社会调查中行、职业编码的智能化及质量控制研究”(2022LZ25);国家社会科学基金一般项目“人工智能驱动的职业流动模拟及2035年劳动力市场技能短缺状况预估研究”(22BTJ032)。ResearchonAutomatedCodingofIndustriesandOccupationsinthePopulationCensus:InternationalExperienceandtheProcessinChinaSunWangshu&SunXuAbstract:Industryandoccupationcodingisthenecessarystagebetweendatacollectionandquantitativeanalysisinthepopulationcensus.Withtherapiddevelopmentofinformationtechnologyanditswideapplicationinsocialmanagement,theindustryandoccupationcodinginthecensusisdevelopingtowardsintelligence.Theapplicationofautomatedcodingsignificantlyreducesthehumaninput,codingtimeandcosts,andespeciallythereproducibilityerror.Combinedwithrelevantdomesticandforeignresearch,thispapersummarizestwobasicmethodsofautomatedcoding,andexpoundstheprinciplesandtechniquesofdictionarycodingmethodandmodelcodingmethodwiththeirapplicationinthecensuscoding.InthefirstsixpopulationcensusesofC...