爬虫验证码识别免费开源版(5行代码解决)

小张学Python

共 1051字，需浏览 3分钟

·

2021-12-11 12:11

背景

爬取数据的过程中难免遇到登录的问题,为了绕过登录,保存cookie是常见的的解决方法.在遇到有验证码的问题时,无疑增加了获取cookie的难度.该python包,解决你的实际问题,避免了购买云打码或者自己搭建机器学习,训练模型的过程,话不多说,直接进入主题.

环境要求

目前已经支持python3.8以下的了，python3.8以上毫无问题。

调用方法

pip install ddddocr

如何使用

import ddddocr ocr = ddddocr.DdddOcr() with open('test.png', 'rb') as f:     img_bytes = f.read() res = ocr.classification(img_bytes) print(res)

参数说明

DdddOcr 接受两个参数:

参数名	默认值	说明
use_gpu	False	Bool 是否使用gpu进行推理，如果该值为False则device_id不生效
device_id	0	int cuda设备号，目前仅支持单张显卡

classification参数:

参数名	默认值	说明
img	0	bytes 图片的bytes格式

我试了试很不错，而且是cpu的情况下，几毫秒返回结果。
我的验证码如下:

往期:

1.首例爬虫禁令：法院裁定立即停止擅自爬取微信公众号相关数据行为

2.爬虫相关日志监控+自动告警

3.用不到十行代码实现新闻类网站的通用爬虫。经过测试数百个新闻网站，准确率接近100%

4.请不要污名化爬虫！

5.只因写了一段爬虫，公司200多人被抓！

6.如何让Python代码加速运行？

7.Python 3.10 明年发布，看看都有哪些新特性？

8.Python记录日志模块推荐-loguru

9.把 14 亿人拉到一个微信群，如何实现？

10.Python 之ConfigParser模块

11.Python入门专辑

小张学Python公众号的交流群已经建立，许多小伙伴已经加入其中，感谢大家的支持。大家可以在群里交流Python、AI等相关内容，还没有加入的小伙伴可以扫描下方管理员二维码，进群前一定要关注公众号奥，关注后让管理员帮忙拉进群，期待大家的加入。

浏览 28

点赞

收藏

分享

举报

评论

图片

表情

5行Python实现验证码识别，稳得一批！

Python网络爬虫与数据挖掘

Python 代码实现「验证码识别」

5行Python实现验证码识别，太稳了！

Python实用宝典

5行Python实现验证码识别，太稳了！

5行Python实现验证码识别，太稳了！

Python绿色通道

5行Python实现验证码识别，太稳了！

Python爬虫与数据挖掘

5行Python实现验证码识别，太稳了！

5行Python实现验证码识别，太稳了！

小詹学Python

5行Python实现验证码识别，太稳了！

captcha_break验证码识别

使用深度学习来破解captcha验证码本项目会通过Keras搭建一个深度卷积神经网络来识别captcha验证码，建议使用显卡来运行该项目。下面的可视化代码都是在jupyternotebook中完成的，

点赞

收藏

分享

举报