此程序是我之前在使用博客软件GitBlog时想出来的。
那时候是想在本地(局域网内)浏览知乎日报,不存在任何商业用途.
- 获取知乎日报首页日报列表URL.
- 进入每个URL获取内容,解析内容,添加作者相关.
- 解析并下载图片到本地.
- 把图片链接替换为markdown格式的链接,并返回到原文中
- 添加原文URL
- 保存为*.md文件
- html2text模块,HTML转为markdown的模块
- 图片下载,其中使用with这个Python上下文管理器
- 目录进化,这个有点绕。
- requests 流式媒体支持.在line:91的stream=True,这个应该是底层urllib3的某个方法支持的参数.往后的开发中仍然遇到过