carolinelsner / speech-tokenization Goto Github PK

The tokenisation of spoken text. Received by the Watson STT and sent to the Apache OpenNLP. Additional code creates individual tokens, depending on the recorded sentences

License: MIT License

HTML 25.54% JavaScript 7.74% Python 0.84% Java 65.87%

nlp speech-recoginition tokenization

speech-tokenization's Introduction

Speech-Tokenization

Dieses Repository repräsentiert den Entwicklungsanteil der Speech Tokenization im Modul Cloud Computing Technology an der Hochschule der Medien Stuttgart.

Das Team besteht aus den folgenden Mitgliedern:

Aufbau/Ablauf der Fallstudie

In dem Speech_Recognition Ordner befindet sich das Front-End, das durch den Express Server, der durch NodeJS realisiert wird, ausgeführt wird. Das Front-End regelt die Authentifizierung mit der Watson API und die Interaktion mit der Watson Speech-to-Text API. Die erfassten Sätze werden dem Nutzer dargestellt und als GET Request dem Applikation Server gesendet.

Bei dem SpeechTokenization Ordner handelt es sich um den Java Code. Mitinbegriffen ist ein Servlet, das die Kommunikation mit einem Web Server ermöglicht. Im Rahmen der Tests wurde der Web Server Tomcat 8.5 verwendet um den Java Code auszuführen. Für die Kommunikation des Front-Ends mit dem Java Code werden die GET Requests vom Servlet empfangen. In dem Servlet können die übergebenen Parameter und dessen Werte ausgelesen werden. Zum aktuellen Stand wird ein Parameter mit der Bezeichnung "param" in dem Servlet ausgelesen.

ToDo:

Ziel des 2. Semesters ist die Entwicklung und Implementierung eines Prototypen, welche die Anforderungen an das Gesamtsystem Speech_Recognition und SpeechTokenization erfüllt. Um die Aufgabe des Speech to Text zu realisieren, wurde der IBM-Watson verwendet. Nach erfolgreicher Spracherkennung werden für die Tokenization entsprechende Chunks identifiziert, hierfür wird Apache OpenNLP genutzt. Ferner wird überprüft, ob es sich um einen Eigennamen und/oder Substantiv handelt. Handelt es sich um einen Eigennamen oder ein Substantiv, dann wird das Wort der ChunkListe hinzugefügt. Zudem kann identifiziert werden. ob zwei aufeinanderfolgende Wörter sinngemäß zusammengehören.

Um herauszufinden, ob eine Terminangabe Bestandteil eines Satzes ist, wird die Klasse DetectTermin verwendet. Das Format wird vom IBM Watson in DD/MM/YYYY ausgegeben und mit Hilfe einer regular Expression soll dies erkannt werden:

Regular Expression: (0?[1-9]|[12][0-9]|3[01])/(0?[1-9]|1[012])/((19|20)\d\d)

Nach erfolgreicher Erstellung der Chunk-Objekte, findet eine Überprüfung der Nennung von bestimmten Google Applikationen statt. Um dies zu realieren wird ein Objekt der Klasse DetectApplikation instanziiert. Es werden folgende Schlüsselwörter geprüft:

Um einen Satz vollständig durch ein Event abbilden zu können, wurde ein neues Objekt erstellt, das sowohl alle erkannten Chunks abbildet als auch die jeweilige Semantische Information. Die Funktionen des Objektes sind folgende:

Recommend Projects

carolinelsner / speech-tokenization Goto Github PK

speech-tokenization's Introduction

Speech-Tokenization

speech-tokenization's People

Contributors

Stargazers

Watchers

Recommend Projects

React

Vue.js

Typescript

TensorFlow

Django

Laravel

D3

Recommend Topics

javascript

web

server

Machine learning

Visualization

Game

Recommend Org

Facebook

Microsoft

Google

Alibaba

D3

Tencent