暑假无聊想做一个学生自助查询教务信息的应用
为了识别东南大学的学生在线网站的验证码
自学2天TensorFlow后,虽然学的还不够成熟,但基本知道怎么用他了,还需要进一步加深知识。
用了网上别人已经搭建好的网络,学习改造了一下,用来训练学校的验证码。
整理一下成果
一开始写了一个界面化的人肉打码机,但无奈一个人打码枯燥无聊,然后就写了一个自动化脚本,挂在6台电脑上跑,虽然最慢要30几s才能有一个样本,但毕竟6台电脑,一个晚上下来样本数就基本够用了。
原理:爬下验证码,然后暴力从0000-9999不断post登陆网站,直到登陆成功,然后就把验证码保存下来。其中原验证码图片格式为210 * 100,为了机器学习时卷积方便,转化成了160 * 60
这几天一直在搭建服务器和写前端了,今天抽空整理上传了一下。