(是Python的期末大作业,顺便熟悉git的使用。)
对招聘网站“前程无忧”的数据采集与数据分析。
1)数据采集:使用多线程实现网络爬虫,爬取51网的招聘信息,并将页面中数据信息存储至文件和数据库中。
2)对数据进行多角度统计分析:对薪资进行统计分析,绘制柱状图;对公司性质进行分析,绘制饼图。
1.使用thinker构建GUI界面
2.可以在搜索框进行关键词的模糊搜索
3.爬取到的搜素结果将出现在GUI界面文本框中
4.爬取到的搜索结果以excel表格形式存储在代码文件同路径下
5.可对爬取到的数据进行分析,生成柱状图及饼状图
将代码内数据库配置修改为本地mysql的接口号、用户名和密码。