发票查验验证码OCR识别接口(新版旧版兼容+本地部署)

张开发
2026/5/9 3:40:35 15 分钟阅读

分享文章

发票查验验证码OCR识别接口(新版旧版兼容+本地部署)
一. 发票查验验证码OCR识别-API (/mobile/recognize)Mobile版使用多颜色专用模型各颜色使用独立模型。关联视频https://www.bilibili.com/video/BV1mkQ8BoEaE/ (2026年最新发票查验验证码OCR模型)https://www.bilibili.com/video/BV1g2aHzVE1J/ (验证码识别自动化(rpa与接口)发票查验技术分享)1.1 适用验证码样例1.2 POST/mobile/recognize功能: OCR 文字识别多模型支持幂等性: 否请求参数 (Body)参数名类型必填说明示例imagestring是Base64 编码的图片数据iVBORw0KGgo...colorstring否文字颜色默认红色红色枚举值:红色- 使用红色专用模型黑色- 使用黑色专用模型蓝色- 使用蓝色专用模型黄色- 使用黄色专用模型请求示例POST /mobile/recognize HTTP/1.1 Host: 127.0.0.1:5000 Content-Type: application/json { image: iVBORw0KGgoAAAANSUhEUgAAAAEAAAABCAYAAAAfFcSJAAAADUlEQVR42mNkM9QDwADhgGAWjR9awAAAABJRU5ErkJggg, color: 红色 }curl-XPOST http://127.0.0.1:5000/mobile/recognize\-HContent-Type: application/json\-d{image: iVBORw0KGgo..., color: 红色}响应成功 (200){success:true,text:DFK,confidence:0.9970,time_ms:45.50,color:红色,uuid:550e8400-e29b-41d4-a716-446655440000}失败 (400){success:false,error:无效的颜色值: 绿色支持的颜色: 红色, 黑色, 蓝色, 黄色}响应字段说明字段名类型可空说明successboolean否操作是否成功textstring否识别结果文本confidencefloat否置信度范围 0~1time_msfloat否处理耗时毫秒colorstring否识别使用的颜色uuidstring否本次请求唯一标识errorstring是错误信息识别Demoweb页面识别截图API接口调用demo整体准确率96%, cpu推理在50ms左右。二、验证码训练要点2.1 数据集标注。图片下载图片分类–黑红蓝黄图片标注–手动标注(自己超级费劲找人标注很费钱)数据集划分train/hXcbJ7_fpcyyzm17759764531568849.png hXcbJ7 train/zrkN_fpcyyzm17757872430992347.png zrkN train/Sca9Bf_fpcyyzm17759759171496836.png Sca9Bf val/yA9X_fpcyyzm17758092163308441.png yA9X val/闲妮SB_fpcyyzm17758066692628347.png 闲妮SB val/DY2YFE_fpcyyzm17758066947707246.png DY2YFE2.2 数据集构造重点部分字体、字符集、颜色、背景、干扰点、干扰线。每种颜色自动生成样本40万张。23456789ABCDEFGHIJKLMNPQRSTUVWXYZabcdefghijklmnpqrstuvwxyz 常见汉字构造验证码样例(兼容新版验证码和旧版验证码)构造-黑色样本部分样例(总数40w张)构造-蓝色样本部分样例(总数40w张)构造-红色样本部分样例(总数40w张)2.3 模型训练。2.4 模型评估。2.5 模型导出。2.6 模型测试 优化。第一次训练之后一定要在真实网站中进行测试记录错误验证码。 再把错误验证码手动标注后添加到训练集中进行微调训练或者二次训练。可纠正一些明显的错误。有效提升准确性。2.7 模型导出onnx。2.8 模型web服务化开发。2.9 生产部署。经测试准确率96%, cpu推理在50ms左右。本文只提供学习的思路严禁违反法律以及破坏信息系统等行为

更多文章