博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
验证码破解技术四部曲之环境搭建篇(一)
阅读量:4130 次
发布时间:2019-05-25

本文共 1092 字,大约阅读时间需要 3 分钟。

前言

转眼就变成大四狗了,大学期间做的比较深入的技术是爬虫,但是爬虫也有很多高级的技术没有涉及,比如说验证码的破解便是其中之一,再加上我对其非常感兴趣,于是乎,开始苦学图像处理、学习机器学习,验证码破解也有了些眉头。

以下是我破解的几种验证码。

1、最容易破解的验证码



直接使用tesseract库识别。

2、download.csdn的验证码



使用K近邻算法识别。

3、weibo.cn验证码



使用卷积神经网络训练识别。

说明

项目源码: (可以帮我点个star(^__^)) 
开发语言:python(编写爬虫),c++(编写图像处理部分以及机器学习算法) 
开发环境:ubuntu 14.04 
依赖库: 
Python:PIL、BeautifulSoup4、requests 
C++:boost、opencv2、tesseract-ocr

环境搭建

安装opencv 2.4.12

sudo apt-get install build-essential cmake libgtk2.0-dev pkg-config python-dev python-numpy libavcodec-dev libavformat-dev libswscale-dev wget https://codeload.github.com/Itseez/opencv/zip/2.4.12unzip opencv-2.4.12.zipcd opencv-2.4.12 ; mkdir release  ; cd release  cmake -D CMAKE_BUILD_TYPE=RELEASE -D CMAKE_INSTALL_PREFIX=/usr/local ..  make -j8sudo make install

安装tesseract-ocr

sudo apt-get install tesseract-ocr tesseract-ocr-dev

安装boost

sudo apt-get install libboost-all-dev

安装python的PIL库

sudo apt-get install python-imaging

安装python的BeautifulSoup4、requests库

sudo apt-get install python-pipsudo pip install bs4sudo pip install requests

下载项目源码

git clone https://github.com/nladuo/captcha-break.git

转载地址:http://qhbvi.baihongyu.com/

你可能感兴趣的文章
facebook库runtime.js
查看>>
vue2.* 中 使用socket.io
查看>>
openlayers安装引用
查看>>
js报错显示subString/subStr is not a function
查看>>
高德地图js API实现鼠标悬浮于点标记时弹出信息窗体显示详情,点击点标记放大地图操作
查看>>
初始化VUE项目报错
查看>>
vue项目使用安装sass
查看>>
HTTP和HttpServletRequest 要点
查看>>
在osg场景中使用GLSL语言——一个例子
查看>>
关于无线PCB中 中50欧姆的特性阻抗的注意事项
查看>>
Spring的单例模式源码小窥
查看>>
后台服务的变慢排查思路(轻量级应用服务器中测试)
查看>>
MySQL中InnoDB事务的默认隔离级别测试
查看>>
微服务的注册与发现
查看>>
bash: service: command not found
查看>>
linux Crontab 使用 --定时任务
查看>>
shell编程----目录操作(文件夹)
查看>>
机器学习-----K近邻算法
查看>>
HBASE安装和简单测试
查看>>
关于程序员的59条搞笑但却真实无比的编程语录
查看>>