In den letzten Jahren hat Tomedo enorme Verbesserungen erfahren, was die kontinuierliche Weiterentwicklung durch die engagierten Entwickler unterstreicht. Ein gutes Beispiel dafür sind die Inbox-Funktion und die OCR-Textextraktion aus *.pdf-Dokumenten.
Allerdings gibt es Optimierungspotenzial: Es wäre wünschenswert, die Textextraktion für Karteieinträge beim Vidieren per Aktionskette automatisieren zu können. Während dies beim Neuanlegen von Dokumenten durch einen Scanvorgang mit OCR-Texterkennung problemlos funktioniert, muss die Texterkennung bei KIM-Briefen, eingehenden Faxnachrichten oder E-Mails mit pdf-Anhängen manuell angestoßen werden. Solange bleibt der Text visuell sichtbar, jedoch maschinell nicht auswertbar.
Eine mögliche Verbesserung wäre die Konfiguration dieser Funktionalität als Aktionskette. Das Einrichten solcher Aktionsketten funktioniert generell einwandfrei, jedoch können Sonderzeichen in den Dokumenten Appleskripte beeinträchtigen. In solchen Fällen hilft ein angepasster Befehl, um Sonderzeichen zu entfernen.
Für alle Interessierten - ich habe das mit diesem Befehl gemacht:
Appleskript
-- Funktion zur Entfernung von Sonderzeichen aus Dokumenten
on removeSpecialCharacters(inputText)
set cleanedText to do shell script "echo " & quoted form of inputText & " | tr -cd '[:print:]'"
return cleanedText
end removeSpecialCharacters