Code Monkey home page Code Monkey logo

projectwork-ktmfk's Introduction

Effizientes Preprocessing von Stücklistendaten (ontologiebasiertes Wissensbestandsmanagement)

This is a project during my master in Germany at the Chair of Engineering Design, Department of Mechanical Engineering, FAU Erlangen-Nuremberg.

Einleitung:

Die Vorverarbeitung der Daten (Das „Daten-Preprocessing“), auch als „Datenbereinigung“ oder „Datenaufbereitung“ bekannt, wird als ein wichtiger Schritt im Data Mining-Prozess betrachtet. Datenvorverarbeitung ist eine Data-Mining-Technik, wobei die Rohdaten in ein verständliches Format umgewandelt werden.

Daten von der realen Welt sind oft unvollständig, inkonsistent und/ oder fehlen bestimmten Verhaltensweisen oder Trends und enthalten wahrscheinlich viele Fehler. Datenvorverarbeitung ist eine bewährte Methode zur Lösung solcher Probleme. Produktdaten sind eine Form der Daten, die unter Berücksichtigung des Produktle-benszyklus sämtliche Merkmale eines Produktes und die zu dessen Herstellung notwendige Umgebung beschreiben.

Informationen bzw. Daten, die als Produktdaten angesehen werden können, umfassen normalerweise wie folgt:

1. Technische Spezifikationen: Messungen und Materialien
2. Zeichnungen: elektronische oder manuelle Darstellungen des Produkts
3. Stückliste: eine strukturierte Anordnung von Objekten
4. Technische Dokumentationen: Unterlagen, wie ein Produkt konstruiert wird
5. Andere Dokumente: zum Beispiel: Bilder des Endprodukts

Im Rahmen dieser Projektarbeit ist das Preprocessing auf die Stückliste-Daten fokussiert.

Eine Stückliste („parts list“ oder „bill of materials“ (BOM)) ist eine Zusammenfassung sämtlicher Einzelteile mit entsprechenden Mengenangaben, die für die Erzeugung des jeweiligen Produktes oder einer bestimmten Baugruppe benötigt werden.

Motivation und Zielsetzung:

- Entwicklung einer effizienten und flexiblen Methode zur automatisierten Aufbereitung von Baugruppen- und Bauteildaten aus Stücklisten als Preprocessing für eine ontologiebasierte Weiterverarbeitung
- Methode um relevante Daten aus einer Stückliste zu extrahieren
- Identifikation von Baugruppen, Bauteilen und Normteilen anhand der Sachnummer
- Methode zur flexiblen Festlegung eines Suchschemas für verschiedene Sachnummern + Bewertung
- Umsetzung des Preprocessings anhand eines grafischen User Interface in Python

Ergebnisse:

- Methode zur automatisierten Extraktion der relevanten Daten aus Stücklisten in Hilfstabellen
- Flexible Anwendbarkeit der Methode durch variabel festlegbare Suchschemata
- User Interface in Python für die optimale Wiederverwendung der Methoden

Grafisches User Interface (GUI):

GUI

Input- und Outbeispiel:

GUI

GUI

Ergebnisse des Pre-Processing mit GUI:

Die GUI bietet dem Benutzer alle Möglichkeiten, die zur Vorverarbeitung der im Form von Excel-Datei bestehenden Stücklistendaten benötigt sind. Unter Verwendung der Benutzeroberfläche kann sowohl eine Excel-Datei als auch ein Ordner mit mehreren Excel-Dateien aufbereitet werden. Das Ergebnis der Aufbereitung wird zunächst in Form einer Tabelle dargestellt und im Anschluss kann die Tabelle gegebenenfalls im Form einer Excel-Datei gespeichert werden.

GUI

In dieser Arbeit wurde eine Datenbank von allen be-stehenden Stücklistendaten erstellt. Die Datenbank verschafft eine Gelegenheit, dass die Daten gegebenenfalls von Benutzer abgerufen werden.

GUI

Es muss jedoch berücksichtigt werden, dass sich diese Arbeit ausschließlich auf die bestehenden Stücklistendaten konzentriert, die durch eine Formatvorlage strukturiert sind. Die Empfehlung für die weitere Arbeit ist daher, eine größere Datenbank zu er-stellen und dazu müssen allerdings mehrere Stücklisten vorhanden sein.

Recommend Projects

  • React photo React

    A declarative, efficient, and flexible JavaScript library for building user interfaces.

  • Vue.js photo Vue.js

    🖖 Vue.js is a progressive, incrementally-adoptable JavaScript framework for building UI on the web.

  • Typescript photo Typescript

    TypeScript is a superset of JavaScript that compiles to clean JavaScript output.

  • TensorFlow photo TensorFlow

    An Open Source Machine Learning Framework for Everyone

  • Django photo Django

    The Web framework for perfectionists with deadlines.

  • D3 photo D3

    Bring data to life with SVG, Canvas and HTML. 📊📈🎉

Recommend Topics

  • javascript

    JavaScript (JS) is a lightweight interpreted programming language with first-class functions.

  • web

    Some thing interesting about web. New door for the world.

  • server

    A server is a program made to process requests and deliver data to clients.

  • Machine learning

    Machine learning is a way of modeling and interpreting data that allows a piece of software to respond intelligently.

  • Game

    Some thing interesting about game, make everyone happy.

Recommend Org

  • Facebook photo Facebook

    We are working to build community through open source technology. NB: members must have two-factor auth.

  • Microsoft photo Microsoft

    Open source projects and samples from Microsoft.

  • Google photo Google

    Google ❤️ Open Source for everyone.

  • D3 photo D3

    Data-Driven Documents codes.