Ich möchte die Fragen des Versorgungsamtes aus einem gescannten Schreiben zwischen den Worten:  berichten:  und Bitte senden für ein Antwortschreiben extrahieren. Mithilfe von chatgpt versuchte ich

[regex berichten:\s*((?:.|\r?\n)*?)Bitte senden x Dok 5 _ 0-7d NN NNJN NNNN _ K _]    in allen möglichen Kombinationen.

klappt aber nicht hat jemand eine Idee??

Besten Dank im Voraus Ralf Kampmann
Gefragt in Frage von (5.7k Punkte)
0 Punkte

3 Antworten

Das Problem ist "nicht zu sehen" ;-)

 

 

"Bitte  senden" enthält ein Leerzeichen, das die Probleme macht. Mit "Bitte\ssenden" müsste es klappen
Beantwortet von (2.2k Punkte)
0 Punkte

Moin,

https://regex101.com hilft immer ganz gut beim Testen. 

Funktioniert das vielleicht? 

 

Gruß, Andreas Schemm

Beantwortet von (2.3k Punkte)
0 Punkte

Moin Ralf, 

das geht so: $[regex (?<=berichten\:)([\s\S]*?)(?=Bitte\s+senden) $[v2]$]$

Schöne Grüße nach Verden!

Beantwortet von (10.9k Punkte)
0 Punkte
Herzlichen Dank an Hans Jörg:

hier ist die Lösung für alle :

$[regex (?<=berichten\:|folgende\sGesundheitsstörungen\:\n)([\s\S]*?)(?=Bitte\s+senden|Fügen\sSie\sbitte) x dok _ _ 5d NN NJ2N NNNN _ U _]$
Hallo Ralf,

ist da wirklich "dok" und nicht "DOK" korrekt?

Schöne Grüße nach Verden
19,805 Beiträge
28,264 Antworten
51,007 Kommentare
33,658 Nutzer