基于PYQT5的AI图像识别工具黄率(湖南科技学院信息工程学院,湖南永州425199)摘要:随着深度学习算法的兴起和普及,在人工智能领域取得了令人瞩目的进步。如今在AI图像识别领域更是发展迅速,通过AI图像识别可以将以前人工智能完成的任务转换为由计算机自动完成。设计实现了一个AI图像识别工具,首先对图片进行预处理,对图片进行校正和去噪,然后切割图片,进行识别和修正,从而对身份证、银行卡和驾驶证等进行识别,并自动提取其中的信息。其中,对文本的识别采用深度学习模型完成。对该AI图像识别工具进行测试,结果表明,该工具运行稳定,识别率在95%以上,符合最初的设计要求。关键词:PYQT5图像识别人工智能JSON中图分类号:TP391文献标识码:A文章编号:2095-0748(2023)01-0090-021背景及意义在过去的10年,人工智能技术实现了自动驾驶、实用的语音识别、图像识别和有效的网络搜索等。人工智能在今天是如此普及,以至于人们可能一天要使用几十次。在服装、制造等传统行业中,由于保密、安全、信息化水平等条件限制,在工作中有大量的表格需要在现场手工填写,然后再录入到信息系统中,存在重复工作且容易录错[1]。而采用中文手写体识别可对相应表格内容进行实时识别和自动录入,人工进行检查校验即可,能够减少大量人工工作量[2]。图片识别技术称为光学字符识别,它是计算机视觉领域中重要的研究分支,其较常见的应用是印刷体和手写体文本的识别,前者都是打印字体,相对比较规整,但是在印刷过程中设备和纸张的原因导致的印刷质量问题,会对光学字符识别模型的输入产生噪声影响,另外由于印刷样式、底纹背景和拍摄光线等也会对识别的结果产生干扰[3]。人们在日常生活中由印刷体产生的各种证件,比如身份证、银行卡和驾驶证经常需要自动识别,并提取其中的数据信息。而基于人工智能的文字识别技术的优势就是对各种印刷体等进行文本识别,通过计算机图形学对表格进行识别,并将单元格进行切分,对每个单元格的图片,通过采用人工智能算法实现文本识别,可减少大量特征提取和处理的工作,并能够提高模型训练的准确率[4]。2工具的分析设计与实现2.1需求分析本文设计的AI图像识别工具需要在一张图片上获取相关信息。通过Python、PYQT5和百度AI开放平台开放接口实现简单的识别图像上的信息项目———AI图像识别工具。本文设计实现的工具可以识别银行卡图片、植物图片、动物图片、通用票据图片、营业执照图片、身份证图片、车牌号图片、驾驶证...