Парсер собирает данные обо всех PEP-документах, сравнивает их статус и записывает в файл, собирает информацию о статусe версии, скачивает архивы с документацией.
- Сбор ссылок на статьи о нововведениях в Python;
- Сбор информации о версиях Python;
- Скачивание архива с актуальной документацией;
- Сбор статусов документов PEP и подсчёт статусов документов;
- Вывод информации в терминал (в обычном и табличном виде) и сохранение результатов работы парсинга в формате csv;
- Логирование работы парсинга;
- Обработка ошибок в работе парсинга.
Клонировать репозиторий и перейти в папку в проектом:
git clone [email protected]:AlexandrVasilchuk/bs4_parser_pep.git
cd bs4_parser_pep
Создать и активировать виртуальное окружение:
python3 -m venv venv
-
Если у вас Linux/MacOS
source venv/bin/activate
-
Если у вас windows
source venv/scripts/activate
Установить зависимости из файла requirements.txt:
python3 -m pip install --upgrade pip
pip install -r requirements.txt
Сбор ссылок на статьи о нововведениях в Python:
python main.py whats-new
Сбор информации о версиях Python:
python main.py latest-versions
Скачивание архива с актуальной документацией:
python main.py download
Сбор статусов документов PEP и подсчёт статусов:
python main.py pep
Полный список аргументов:
python main.py -h
usage: main.py [-h] [-c] [-o {pretty,file}] {whats-new,latest-versions,download,pep}
Парсер документации Python
positional arguments:
{whats-new,latest-versions,download,pep}
Режимы работы парсера
optional arguments:
-h, --help show this help message and exit
-c, --clear-cache Очистка кеша
-o {pretty,file}, --output {pretty,file}
Дополнительные способы вывода данных
Автор: Васильчук Александр
[email protected]
@vsko_dev