Ich möchte die Fragen des Versorgungsamtes aus einem gescannten Schreiben zwischen den Worten:  berichten:  und Bitte senden für ein Antwortschreiben extrahieren. Mithilfe von chatgpt versuchte ich

[regex berichten:\s*((?:.|\r?\n)*?)Bitte senden x Dok 5 _ 0-7d NN NNJN NNNN _ K _]    in allen möglichen Kombinationen.

klappt aber nicht hat jemand eine Idee??

Besten Dank im Voraus Ralf Kampmann
Gefragt in Frage von (5.8k Punkte)
0 Punkte

3 Antworten

Das Problem ist "nicht zu sehen" ;-)

 

 

"Bitte  senden" enthält ein Leerzeichen, das die Probleme macht. Mit "Bitte\ssenden" müsste es klappen
Beantwortet von (2.3k Punkte)
0 Punkte

Moin,

https://regex101.com hilft immer ganz gut beim Testen. 

Funktioniert das vielleicht? 

 

Gruß, Andreas Schemm

Beantwortet von (2.3k Punkte)
0 Punkte

Moin Ralf, 

das geht so: $[regex (?<=berichten\:)([\s\S]*?)(?=Bitte\s+senden) $[v2]$]$

Schöne Grüße nach Verden!

Beantwortet von (11k Punkte)
0 Punkte
Herzlichen Dank an Hans Jörg:

hier ist die Lösung für alle :

$[regex (?<=berichten\:|folgende\sGesundheitsstörungen\:\n)([\s\S]*?)(?=Bitte\s+senden|Fügen\sSie\sbitte) x dok _ _ 5d NN NJ2N NNNN _ U _]$
Hallo Ralf,

ist da wirklich "dok" und nicht "DOK" korrekt?

Schöne Grüße nach Verden
Hallo lieber Hans Jörg, wie aufmerksam von Dir, tatsächlich klappt beides! Keine Ahnung wieso. Gruß Ralf
19,850 Beiträge
28,311 Antworten
51,096 Kommentare
33,734 Nutzer