Die regex-Funktion erlaubt sehr komplexe Funktionen der Textanalyse. Es lassen sich damit auch kompliziertere Tabellenanteile auslesen und in CKE-Einträge sortiert übertragen, um sie dann weiter nutzbar zu haben.

Da es regex in verschiedenen "Geschmacksrichtungen" gibt, wäre es hilfreich zu wissen, welcher Dialekt in tomedo zum Einsatz kommt. Das Austesten in https://regex101.com ergibt recht oft dort funktionierende regex-Ausdrücke, die sich dann beim Übertragen in tomedo anders Verhalten.

Frage also: Gibt es da eine konkrete Beschreibung, wo man die tomedo-eigene regex-Syntax-Variante findet?
Gefragt in Frage von (2.2k Punkte)
+2 Punkte
Den Wunsch kann ich nur unterstützen. der Tester liefert andere Ergebnisse als die Aktion unter Tomedo. Da scheint es Unterschiede zu geben.

Für mich ist das nur über "try and error" in mühsamen kleinen Schritten umsetzbar.

1 Antwort

Guten Tag Herr Dr. Baumann,

ich kenne mich zwar nicht spezifisch mit den CKEs aus, aber allgemein benutzen wir am Mac-Client die von Apple zur verfügung gestellte Klasse

https://developer.apple.com/documentation/foundation/nsregularexpression?language=objc

welche laut der Dokumentation dieser Spezifikation folgen sollte:

https://unicode-org.github.io/icu/userguide/strings/regexp.html

Mit freundlichen Grüßen,

Toni Ringling

Beantwortet von (15.4k Punkte)
+1 Punkt
\n für Newline führt bei tomedo zu Problemen bzw funktioniert nicht. \R im Gegensatz dazu funktioniert. ...da muss man erst mal draufkommen.

Die hingefügten Customfelder im OTK 2 sind mit einem Zeilenbruch versehen, das bekomme ich mit Regex nicht ausgelesen - er liest immer bis zur ersten "echten" neuen Zeile.
Gibt es eine Idee? Single line? Felder "komisch" benennen zu Beginn?

Wenn Sie in dem regex-Anteil, der die auszulesenden Zeichen beschreibt (in Ihrem Fall bisher: ([\w\W])   ) den Ausdruck \W weglassen und durch ein \s ersetzen (damit auch Spaces mit ausgelesen werden, es würde sonst nur das Wort bis zum ersten Space ausgegeben) klappt es. smiley

Mit dem \W (= alles, was nicht Buchstabe/Zahl/Unterstrich ist) haben Sie in Ihrer Version dafür gesorgt, dass auch der Zeilenumbruch in den zu übernehmenden Text eingeschlossen wird.

\W          Matches anything other than a letter, digit or underscore. Equivalent to [^a-zA-Z0-9_]

1000 Dank. Das ist ein großer Schritt zur Online BG Anamnese.

Und damit auch Daten oder 0800 Uhr als Zeit funktionieren muss noch der "Punkt" oder \d für die Zeit rein: \s+([\w\s\.]+)\s\R

Aber Doppelpunkt "08:00" stellt mich vor Schwierigkeiten, wenn das Pat reinschreiben, kann ich nicht auslesen
Versuchen Sie es mal hiermit:

/möglich:\s+([\wÄÖÜäöüß\.\:]+)\s\R

Funktioniert bei mir auch mit Uhrzeiten wie 08:00. Die Umlaute und das ß hatte ich übrigens vergessen, die müssen auch extra angegeben werden, da sie mit dem Ausdruck \w nicht ausgegeben werden.

\W nimmt alle "non-word character", also auch Doppelpunkt und alles andere.

Nimm für Arbeitsbeginn: 

Arbeitsbeginn:\s([\w\W]+)\s\RArbeitsende

Dann bekommst du als Ergebnis "08.00 Uhr"

 

16,088 Beiträge
23,862 Antworten
41,989 Kommentare
11,691 Nutzer