This repository contains a Python-based web scraping tool designed to extract decision links and their headlines from the IT-Planungsrat website. The scraped data is stored in a JSON file and displayed on a web page with filtering capabilities. This project is useful for gathering and analyzing decision information efficiently.
- Scrapes decision links and headlines from specified URLs.
- Supports additional suffixes like
-al
and-al-runde
. - Stores the extracted data in a structured JSON file.
- Provides a web interface to view and filter the data.
- Handles consecutive misses to optimize the scraping process.
- Python
- BeautifulSoup (for web scraping)
- JSON (for data storage)
- HTML, CSS, JavaScript (for web interface)
- Python's HTTP server (for local development)
- Clone the repository:
git clone https://github.com/samsour/it-plr-decision-scraper.git
- Navigate into the project directory:
cd decision-scraper
- Install required Python packages:
pip install requests beautifulsoup4
- Run the scraper:
python scraper.py
- Start the local server:
npm i
npm run start
- Open your web browser and navigate to:
http://localhost:9000
<article id="c211" class="ce-module v-main fitkodecisions-details" data-js-module="fitkodecisions-details" data-mk="1">
<h1>Nutzung eines Online-Dienstes durch die IHK FOSA</h1>
<h4>AL-Runde | 30.04.2024 | 31. Sitzung AL-Runde | Beschluss 2024/08-AL</h4>
<div class="rte-container">
<p class="AufzhlungBulletpoints1FITKO"><strong>Beschluss:</strong></p>
<p class="AufzhlungBulletpoints1FITKO">Die AL-Runde beschließt, die Kosten für die Nutzung des Online-Dienstes „Anerkennung ausländischer Berufsqualifikationen“, soweit sie durch die Nutzung seitens der IHK FOSA entstehen, zu 100% aus dem Stammbudget der FITKO ausnahmsweise in diesem expliziten Einzelfall zu finanzieren. Der Online-Dienst wird der IHK FOSA durch die FITKO in Form eines (unentgeltlichen) Nachnutzungsvertrages über den FIT-Store zur Verfügung gestellt.</p>
</div>
<span class="fitkodecisions-details__back">
<a class="fitkodecisions-details__back-history" href="#" aria-hidden="false">
<div class="shortcut-links-element__icon-container">
<i class="svg-itpl_icon_arrow_20px_blue"></i>
<i class="svg-itpl_icon_arrow_20px"></i>
</div>
<span>Zurück zur Übersicht</span>
</a>
<a aria-hidden="true" class="fitkodecisions-details__back-overview" title="Öffnet die Übersichtseite der Beschlüsse" href="/beschluesse-informationen">
<div class="shortcut-links-element__icon-container">
<i class="svg-itpl_icon_arrow_20px_blue"></i>
<i class="svg-itpl_icon_arrow_20px"></i>
</div>
<span>Zur Übersicht</span>
</a>
</span>
</article>
This project is licensed under the MIT License - see the LICENSE.md file for details