- 最后修改:2023.12.7
本程序旨在实现一个 HTML 解析和选择器工具,其主要任务是解析 HTML 文档,提供对 HTML 元素的查询和操作功能,同时支持 CSS 选择器的使用。程序的关键功能包括 HTML 文档的解析、元素的查找和属性的处理。
- HTML 文档:作为主要输入,可以是一个 HTML 文件或一个字符串形式的 HTML 文档。同时也可以使用 url 输入,自动从网上爬取网页。
- 选择器查询:支持 CSS 选择器语法,用于在 HTML 文档中查找元素。
- 文件路径:当输入是文件时,提供文件的路径。
- HTML 文档应遵循标准的 HTML 格式。
- CSS 选择器查询支持常见的选择器类型,如标签、类、ID 和属性选择器。暂不支持伪类。
- 文件路径应为有效路径,指向可访问的 HTML 文件。
- 查询结果:根据 CSS 选择器查询返回的 HTML 元素链表。
- 解析后的 HTML 结构:展示解析后的 HTML 文档结构,包括元素的层次和属性。
- 文本输出:提供选定 HTML 元素的文本内容。
- HTML 解析:将 HTML 文档转换为内部数据结构,便于后续处理。
- 元素选择:使用 CSS 选择器在 HTML 文档中查找和筛选元素。
- 属性处理:获取和修改 HTML 元素的属性。
- 布局展示:以文本形式展示解析后的 HTML 文档结构。
- 文本提取:从选定的 HTML 元素中提取纯文本内容。