This is a project during my master in Germany at the Chair of Engineering Design, Department of Mechanical Engineering, FAU Erlangen-Nuremberg.
Die Vorverarbeitung der Daten (Das „Daten-Preprocessing“), auch als „Datenbereinigung“ oder „Datenaufbereitung“ bekannt, wird als ein wichtiger Schritt im Data Mining-Prozess betrachtet. Datenvorverarbeitung ist eine Data-Mining-Technik, wobei die Rohdaten in ein verständliches Format umgewandelt werden.
Daten von der realen Welt sind oft unvollständig, inkonsistent und/ oder fehlen bestimmten Verhaltensweisen oder Trends und enthalten wahrscheinlich viele Fehler. Datenvorverarbeitung ist eine bewährte Methode zur Lösung solcher Probleme. Produktdaten sind eine Form der Daten, die unter Berücksichtigung des Produktle-benszyklus sämtliche Merkmale eines Produktes und die zu dessen Herstellung notwendige Umgebung beschreiben.
Informationen bzw. Daten, die als Produktdaten angesehen werden können, umfassen normalerweise wie folgt:
1. Technische Spezifikationen: Messungen und Materialien
2. Zeichnungen: elektronische oder manuelle Darstellungen des Produkts
3. Stückliste: eine strukturierte Anordnung von Objekten
4. Technische Dokumentationen: Unterlagen, wie ein Produkt konstruiert wird
5. Andere Dokumente: zum Beispiel: Bilder des Endprodukts
Im Rahmen dieser Projektarbeit ist das Preprocessing auf die Stückliste-Daten fokussiert.
Eine Stückliste („parts list“ oder „bill of materials“ (BOM)) ist eine Zusammenfassung sämtlicher Einzelteile mit entsprechenden Mengenangaben, die für die Erzeugung des jeweiligen Produktes oder einer bestimmten Baugruppe benötigt werden.
- Entwicklung einer effizienten und flexiblen Methode zur automatisierten Aufbereitung von Baugruppen- und Bauteildaten aus Stücklisten als Preprocessing für eine ontologiebasierte Weiterverarbeitung
- Methode um relevante Daten aus einer Stückliste zu extrahieren
- Identifikation von Baugruppen, Bauteilen und Normteilen anhand der Sachnummer
- Methode zur flexiblen Festlegung eines Suchschemas für verschiedene Sachnummern + Bewertung
- Umsetzung des Preprocessings anhand eines grafischen User Interface in Python
- Methode zur automatisierten Extraktion der relevanten Daten aus Stücklisten in Hilfstabellen
- Flexible Anwendbarkeit der Methode durch variabel festlegbare Suchschemata
- User Interface in Python für die optimale Wiederverwendung der Methoden
Die GUI bietet dem Benutzer alle Möglichkeiten, die zur Vorverarbeitung der im Form von Excel-Datei bestehenden Stücklistendaten benötigt sind. Unter Verwendung der Benutzeroberfläche kann sowohl eine Excel-Datei als auch ein Ordner mit mehreren Excel-Dateien aufbereitet werden. Das Ergebnis der Aufbereitung wird zunächst in Form einer Tabelle dargestellt und im Anschluss kann die Tabelle gegebenenfalls im Form einer Excel-Datei gespeichert werden.
In dieser Arbeit wurde eine Datenbank von allen be-stehenden Stücklistendaten erstellt. Die Datenbank verschafft eine Gelegenheit, dass die Daten gegebenenfalls von Benutzer abgerufen werden.
Es muss jedoch berücksichtigt werden, dass sich diese Arbeit ausschließlich auf die bestehenden Stücklistendaten konzentriert, die durch eine Formatvorlage strukturiert sind. Die Empfehlung für die weitere Arbeit ist daher, eine größere Datenbank zu er-stellen und dazu müssen allerdings mehrere Stücklisten vorhanden sein.