/2023.03基于OCR算法的物资供应商资质审查方法研究徐雨许瑾瑾(宁波永耀电力投资集团有限公司)摘要:为解决物资供应商资质核查工作量大、准确率低的问题,提出了一种基于OCR算法的物资供应商资质审查方法。首先,通过程序接口获取资质的图像信息,在图像字符区域分割后,采用OCR算法识别资质文字信息,并组合成段落;其次,通过网络爬虫技术获取资质验证的官方网站,在此基础上,采用机器人流程自动化技术进行物资供应商资质验证。最后,在某省电力公司物资分公司进行应用,物资供应商资质审查准确率为99.1%。所提方法能有效提高物资供应商资质审查效率,提升审查准确率。关键词:OCR算法;物资供应商;资质审查;机器人流程自动化;网络爬虫;图像分割0引言随着电网公司物资招标工作的数字化程度不断提高,智能化审查物资供应商资质日趋重要[1-2]。物资供应商在投标过程中,将厂房、生产设备、试验设备、运输设备、原材料等资质材料以扫描件的方式提供给招标代理机构。因物资供应商数量众多,传统的评标方式采用人工核查物资供应商资质[3-5],导致核查工作量大,不能满足电网公司数字化物资招标的管理需求。许多学者对智能化审查物资供应商资质做了大量研究。相关文献提出了一种基于大数据技术的物资供应商资质核查方法,通过互联网的征信情况对物资供应商进行评估。相关文献提出了一种基于智慧供应链体系的物资供应商资质核查方法,通过供应链历史关联数据分析,从而核实物资供应商资质。相关文献通过云检验环境对物资供应商资质进行自主匹配,并审查资质的有效性。相关文献通过对物资供应商的能力评估、绩效评价等方面核实物资供应商的资质。由此可见,物资供应商资质核查方法多样,但上述方法并未核实物资供应商提供资质扫描件的准确性,造成物资供应商资质核查工作量大、准确率差。为解决物资供应商资质核查工作量大、准确率低的问题,本文提出了一种基于光学字符识别(opticalcharacterrecognition,OCR)算法的物资供应商资质审查方法。该方法通过OCR识别物资供应商资质扫描件中的文字信息,并将文字信息组合成有效的资质文件认证信息,可在资质颁发的官方网站进行认证。1物资供应商资质审查框架文中所述的基于OCR算法的物资供应商资质审查方法框架包括:物资供应商资质采集、物资供应商资质文字识别和物资供应商资质核查三部分内容,如图1所示。图1物资供应商资...