jerry-goodboy / hoteldatacrawler Goto Github PK
View Code? Open in Web Editor NEWThis project forked from ethanxzhang/hoteldatacrawler
https://www.factual.com/ 酒店数据的python爬虫 使用工具包: 1.selenium自动化测试工具 2.webdriver 3.geckodriver启动firefox 实现: 1.捕获cookies跳过网页人机验证码 2.动态加载的数据抓取 3.遍历所有数据页面 4.在工程目录下生成xls表格与每个页面的截图 遗憾: 由于factual的账户权限问题,访客或一般权限下,仅能显示前三页有效数据(三页后数据为重复数据) product by Ethan Program for FeiYangLi
Home Page: http://blog.csdn.net/fan2273