Comments (33)
Jap, funktioniert jetzt korrekt und das Datum ist da 👍.
Ich habe gerade auch mal mit anderen Dokumente getestet, die einen textuellen Monat hatten. Hat auch bisher super geklappt bei allen fünf Versuchen. :)
TOP!
from synocr.
Kannst du mir mal bitte ein komplettes Log schicken?
from synocr.
Das ist ja dein Log Part. Du gibst nur die Hilfe zurück.
Aber dadurch, dass eine Raute im Pfad ist und ich den Pfad unmaskiert übergebe, wird der Aufruf vor der Raute enden (ab der Raute gilt es als Kommentar) und du bekommst ein ungültiges Parameterset. Das wäre für mich jetzt die naheliegendste Ursache.
from synocr.
Dann musst du das in "" oder '' setzen.
Korrekt, das mache ich eigentlich auch schon aus Prinzip. Ist hier wohl verloren gegangen und keiner hat's gemerkt 🙈
Wie oben beschrieben funktionieren nach der Umstellung auf Python die Regeln nicht mehr (vielleicht auch ein wichtiger Hinweis).
Im originalen Profil wird deine Krankenkasse gefunden. Im geclonten gibt es Fehlermeldungen, die ich jetzt gerade auch nicht zuordnen kann.
Hier ist eine BETA, die diesen Fehler fixen sollte. bitte checke mal, ob mit dem default Profil auch wieder die Regeln funktionieren.
from synocr.
Absolut korrekt ! Das Problem sitzt wohl manchmal vorm Rechner ! :-o
Ich hatte beide Profile verwechselt und dachte, ich arbeite im anderen Profil.
Jetzt hat es super funktioniert 👍.
Entschuldigt bitte die Umstände und danke für die super schnelle Hilfe !!
from synocr.
Alles gut - schön, wenn es jetzt funktioniert. 🙂
Dein ursprünglich gesuchtes Datum ist da?
from synocr.
Welche synOCR Version nutzt du?
Auf dem ersten Blick sieht es auch so aus, als ob du nur mit der internen RegEx-Suche suchst, aber nicht mit dem Pythonmodule.
from synocr.
ich verwende die Version 1.3.1. Und ja du hast Recht, ich verwende aktuell die RegEx-Suche laut GUI:
Also würdest du empfehlen auf Python umzustellen? Ist dies schon irgendwo dokumentiert? Vielleicht hätte ich da auch selbst drauf stoßen können :-).
Update: Ja hätte ich wohl selbst herausfinden können, da es in der Information am entsprechenden Feld Dokumentiert war :-). Aber vielleicht wäre das Thema "Konfiguration der Datumserkennung" (als Gesamtes) mal etwas für die Doku im Wiki.
from synocr.
Ja, das solltest du umstellen, um davon profitieren zu können. Zu Beginn haben wir RegEx noch als Default Einstellung belassen. Aber du hast recht: dass sollte man mal umstellen (greift dann aber nur bei Neuinstallationen).
Bitte berichte mal, ob dein gewünschtes Format gefunden wird.
from synocr.
Mmmh, aus irgendeinem Grund läuft er bei mir in einen Fehler.
Hast du eine Idee?
from synocr.
Habs dir hochgeladen. Ist das komplett bzw. ausreichend?
from synocr.
Ja, ist da - aber lässt mich grübeln ... 🤔
An so einen Fehler kann ich mich die letzten Monate auch nicht wirklich erinnern (ist ja auch nicht gerade sehr aussagekräftig).
Hättest du mal ein Testfile?
Edit:
Bzw. mal bitte mit dem Loglevel 2 (debug mode)
laufen lassen. Die Einstellung dafür findest du ganz unten im Konfigurationsprofil.
from synocr.
Ich hab dir mal ein Test-File hochgeladen, welches aktuell zum gleichen Ergebnis führt.
Zudem hab ichs jetzt mit log level 2 durchgeführt und dir auch das log hochgeladen.
from synocr.
Loglevel 2 war schon besser.
Kannst du mir mal bitte deinen Pfad zum Logordner schreiben?
from synocr.
Das ist der Log-Ordner: /volume1/data/# Document Inbox/# synOCR/Log
Was mir auch auffällt, dass nach der Umstellung auf Python die RegEx Regeln (also Verschiebung, Umbenennung) nicht mehr funktionieren.
Und kann es einen Einfluss haben, dass ich gestern lediglich die neuere Version (1.3.1) über die damalige Version 1.1.902 drüber installiert habe? Gibt es vielleicht noch ungewollte (alte) Einstellungen?
from synocr.
Das Update sollte kein Problem sein. Ich vermute, dass uns hier die Raute #
im Pfad ärgert. Wäre es ein großer Aufwand, das mal zu checken? (Vielleicht nur mal das aktuelle Profil clonen und zum Test einen anderne Quell- und Logpfad ohne Raute probieren).
@Gthorsten65 kann es sein, dass es hier ein Problem bei der Übergabe der Parameter gibt?
-----------------------------------------------------------------------------------
| search for a valid date in ocr text: |
-----------------------------------------------------------------------------------
ERROR at line 1007: founddatestr=$( python3 ./includes/find_dates.py -fileWithTextFindings "$searchfile" $arg_searchnearest -dateBlackList "$ignoredDate" -dbg_file $current_logfile -dbg_lvl "$loglevel" -minYear "$minYear" -maxYear "$maxYear" 2>&1)
find_dates.py result:
usage: find_dates.py [-h] [-fileWithTextFindings FILEWITHTEXTFINDINGS]
[-dateBlackList DATEBLACKLIST]
[-searchnearest SEARCHNEAREST] [-dbg_file DBG_FILE]
[-dbg_lvl {0,1,2}] -minYear MINYEAR -maxYear MAXYEAR
find_dates.py: error: unrecognized arguments: Document Inbox/# synOCR/Log/synOCR_2023-03-28_20-19-58.log
ERROR at line 1007: python3 ./includes/find_dates.py -fileWithTextFindings "$searchfile" $arg_searchnearest -dateBlackList "$ignoredDate" -dbg_file $current_logfile -dbg_lvl "$loglevel" -minYear "$minYear" -maxYear "$maxYear" 2>&1
Edit:
Ich sehe gerade auch, dass ich den Logpfad nicht maskiert an das Pythonskript übergebe. Hier vermute ich den Auslöser
from synocr.
@geimist Hmm, hast du mal den Python teil des log files?
Kann aus deinem post nicht erkennen wie die Parameter sind.
Im logile, also das was ich logge, sollte alle drin stehen.
Welcher Parameter hat denn ein#? Kann das mal ausprobieren
from synocr.
Vielleicht nur mal das aktuelle Profil clonen und zum Test einen anderne Quell- und Logpfad ohne Raute probieren.
Das habe ich mal gemacht und du hast völlig Recht. Ohne der Raute im Pfad funktioniert die Datumserkennung.
Wie oben beschrieben funktionieren nach der Umstellung auf Python die Regeln nicht mehr (vielleicht auch ein wichtiger Hinweis).
from synocr.
Schön und nicht schön - aber Fehler gefunden. Das ist gut. Funktionieren die Regeln beim Test wieder? Eigentlich sollte die Umstellung auf die Pythonsuche damit nichts zu tun haben.
from synocr.
Habe gerade mal geschaut. So wie Du den lognamen übergibst geht das nicht. Das sieht das Pythonscript als mehrere Parameter.
Es sind Leerzeichen vorhanden.
Dann musst du das in "" oder '' setzen.
from synocr.
Schön und nicht schön - aber Fehler gefunden. Das ist gut. Funktionieren die Regeln beim Test wieder? Eigentlich sollte die Umstellung auf die Pythonsuche damit nichts zu tun haben.
Ich hab auch noch mal hin und her getestet. Du hattest Recht! Ich hatte wohl in meiner Regeldatei einen Typo drin, sodass die Regeln nicht mehr gezogen haben. Also das Datums-Problem ist wohl lediglich durch die Raute im Pfad verursacht.
from synocr.
Wie oben beschrieben funktionieren nach der Umstellung auf Python die Regeln nicht mehr (vielleicht auch ein wichtiger Hinweis).
Ja wie gesagt war das mein Fehler. Ich hatte einen Typo in der Regeldatei.
Hier ist eine BETA, die diesen Fehler fixen sollte. bitte checke mal, ob mit dem default Profil auch wieder die Regeln funktionieren.
Die Beta habe ich installiert und das Monitoring neu gestartet (müsste doch reichen oder?).
Leider wird das Datum noch nicht korrekt verarbeitet. Aber könnte es an den zwei Rauten im Pfad (sowohl für Logs als auch für Input/Output Ordner) liegen?
from synocr.
Die Beta habe ich installiert und das Monitoring neu gestartet (müsste doch reichen oder?).
Korrekt.
Für das Datumsproblem bräuchte ich wieder das Log, bzw. den unmittelbaren Teil ab hier:
-----------------------------------------------------------------------------------
| search for a valid date in ocr text: |
-----------------------------------------------------------------------------------
from synocr.
Genau das würde helfen
from synocr.
habs Stephan hochgeladen. Aber auch hier der direkte Abschnitt:
from synocr.
Du hast die Standardregexsuche aktiv (bist glaube auch in deinem Testprofil) 😉
from synocr.
Ich habe wieder mein Default Profil laufen, extra nochmal das Monitoring neu gestartet.
Und weiterhin läuft die Datumssuche mittels Python.
Im Ergebnis kommt leider noch das falsche Datum heraus:
from synocr.
Bitte ein Log 😃
(gespeichert hast du ja dein Profil?)
from synocr.
Dein Logfile:
current Profil: clone
Bitte beachte: Alle Profile sind gleichberechtigt. Es ist also unerheblich, welches in der GUI ausgewählt wird.
from synocr.
Hab dir das Log hochgeladen (mache dann nur noch einen Daumen auf deinen Comment, wenn ich es hochgeladen habe, Dann bläht es die Konversation nicht weiter auf).
Explizites Speichern des Profils werde ich noch mal versuchen. Da ich aber nicht mehr das Profil (Methode der Datumsuche) geändert habe, schließe ich das nahezu aus. Aber ein Versuch ist es Wert :).
from synocr.
Möglicherweise musst du das Testprofile clone
mal deaktivieren, wenn es noch falsch konfiguriert ist und vielleicht immer vor deinem Default-Profil abgearbeitet wird. Denn es scheint mir, dass es die gleichen Pfade wie dein Default-Profil nutzt.
from synocr.
Hier ist eine BETA, die diesen Fehler fixen sollte.
Wie ich heute gesehen hatte, gab es einen Fehler in dieser Version, der zu einer Endlosschleife führte, sofern kein Datum gefunden werden konnte. Unter demselben Link gibt es eine aktualisierte Version.
from synocr.
cool, ganz vielen Dank für den Fix und die neue Version ! Ich habe sie gleich installiert 👍. Merci & viele Grüße
from synocr.
Related Issues (20)
- Default Profil zurückgesetzt nach Löschen eines anderen Profils HOT 4
- Feature: Detect and delete blank pages from scans HOT 26
- Folderpicker über GUI realisieren HOT 4
- diverse Listboxen durch Schalter oder Checkbox ersetzen HOT 13
- YAML-Regeln / Tagverwaltung übersichtlicher gestalten
- Sensitivität der OCR Erkennung HOT 3
- Datumserkennung (Python) mit zweistelliger Jahreszahl HOT 12
- GUI: Parameter per JS mit Drag&Drop zusammenstellen HOT 2
- Kompatibilität für Domänenuser ([Synology] Directory Server) HOT 2
- Wie stelle ich die Sprache der OCR-Engine ein – damit sie diakritische Zeichen korrekt erkennt? HOT 4
- verbesserte Benachrichtigungen
- Falsche Download Version! HOT 1
- Falsche Download Version für DSM7 HOT 2
- processing fails since update to 1.4.0: "ModuleNotFoundError: No module named 'pypdf'" HOT 5
- QR Code parsen und mit enthaltenen Werten synOCR Workflow beeinflussen
- New setup not working HOT 4
- Dokument automatisch aufteilen (split) HOT 9
- synOCR does not yet have the necessary permissions HOT 1
- keine Verarbeitung von Scans mehr nach Update von 1.4.1 auf 1.4.5 HOT 5
- Metadata-Datei im Ausgabe-Ordner HOT 6
Recommend Projects
-
React
A declarative, efficient, and flexible JavaScript library for building user interfaces.
-
Vue.js
🖖 Vue.js is a progressive, incrementally-adoptable JavaScript framework for building UI on the web.
-
Typescript
TypeScript is a superset of JavaScript that compiles to clean JavaScript output.
-
TensorFlow
An Open Source Machine Learning Framework for Everyone
-
Django
The Web framework for perfectionists with deadlines.
-
Laravel
A PHP framework for web artisans
-
D3
Bring data to life with SVG, Canvas and HTML. 📊📈🎉
-
Recommend Topics
-
javascript
JavaScript (JS) is a lightweight interpreted programming language with first-class functions.
-
web
Some thing interesting about web. New door for the world.
-
server
A server is a program made to process requests and deliver data to clients.
-
Machine learning
Machine learning is a way of modeling and interpreting data that allows a piece of software to respond intelligently.
-
Visualization
Some thing interesting about visualization, use data art
-
Game
Some thing interesting about game, make everyone happy.
Recommend Org
-
Facebook
We are working to build community through open source technology. NB: members must have two-factor auth.
-
Microsoft
Open source projects and samples from Microsoft.
-
Google
Google ❤️ Open Source for everyone.
-
Alibaba
Alibaba Open Source for everyone
-
D3
Data-Driven Documents codes.
-
Tencent
China tencent open source team.
from synocr.