前几天看到有人询问:
http://www.shjtaq.com/zwfg/dzjc_new.asp
想要这个地址自动查询信息的接口。
看了一下,自动提交form表单的话,比较复杂的地方就是验证码的识别了。
看这个验证码是很简单的,应该使用简单的比较方法就可以识别。
按照这个思路就整了一下。
代码见: https://github.com/miwoow/easy_captcha.git
实现过程中主要遇到的问题就是bmp图片的读取了。
实现过程遇到的问题及解决思路见: http://miwoow.github.io/mblog/2015/08/11/easy-captcha.html
1
flowfire 2015-08-12 10:46:16 +08:00 1
虽然说。。。。内容最重要没错。。。。但是能不能稍微管管CSS。。。
点进去我检查了半天以为又是哪个CSS没加载出来。。。。然后发现根本就没有css |
3
yangxiongwei 2015-08-12 12:24:35 +08:00
|
4
womaomao 2015-08-12 15:56:13 +08:00
记得opencv有现成的例子,OCR识别
|
5
wuhx 2015-08-12 16:12:21 +08:00
用tesseract实现过一个类似的,稍微训练一下tesseract的识别库,这些简单数字图片毫无压力。
https://github.com/wuhx/zmate |
6
fractal314 2015-08-13 06:45:57 +08:00 via Android
这个验证码tesseract不训练都能达到95%以上
|
7
invite 2015-08-13 14:48:56 +08:00
很奇怪,既然记不清BMP情况,不能先转换为其他更常见的格式?
|