LuraTech hat die Version 5.5 ihres LuraDocument PDF Compressors vorgestellt, die erweiterte Funktionen zur besseren Erkennung und zum exakteren Auslesen von Formularen beinhalten soll. Dazu gehört eine automatische Seitenausrichtung, mit der verdrehte oder verschobene Einzelseiten ausgerichtet werden. Außerdem soll die Lösung nun auch Ankreuzfelder in strukturierten und unstrukturierten Dokumenten erkennen und auswerten sowie Inhalte definierter Formularfelder in den PDF-Resultaten durch echtes Schwärzen dauerhaft unleserlich machen können.
LuraDocument PDF Compressor ist eine Konvertierungslösung, die die komplette Prozesskette – Scannen und digitales Erstellen von Dokumenten, Datenextraktion und Export für die Langzeitarchivierung – abdecken soll. Die Software soll gescannte farbige oder schwarz-weiße Dokumente in hochkomprimierte PDF/A-Dateien konvertierten können, die im Volltext (OCR) durchsuchbar sind. Dabei werden alle üblichen Scan-Formate wie beispielsweise TIFF, JPEG oder PDF unterstützt.
Das flexibel einsetzbare Modul Formularerkennung klassifiziert Dokumente automatisch und extrahiert die darin enthaltenen Daten. Der PDF Compressors soll auch große Dokumentenmengen – beispielsweise im Stapelverfahren oder über Joblisten – schnell und effizient verarbeiten können. Das Modul bietet außerdem einen Formdesigner zur Erstellung der Erkennungsregeln und einen Formvalidator zur sicheren Korrektur und Ergänzung der Leseergebnisse.
In der Version 5.5 zählt die Funktion „Adjustment“ zum erweiterten Leistungsumfang des PDF Compressors. Diese richtet innerhalb der templatebasierten Formularerkennung verdrehte oder verschobene Seiten so aus, dass eine wesentlich genauere Extraktion von Daten möglich ist. Zusätzlich bietet die Software nun eine „Checkmark Recognition“, also das Erkennen von Ankreuzfeldern. Sie steht sowohl in der templatebasierten als auch innerhalb der Freiformerkennung zur Verfügung. Schließlich erlaubt die neue Version des LuraDocument PDF Compressors das Schwärzen von Feldern. Mit diesem sicheren Verfahren können sensible oder personenbezogene Daten aus zu veröffentlichenden Dokumenten einfach entfernt werden.
Der LuraDocument PDF Compressor 5.5 soll auch XMP-Metadaten, Verlinkungen und Lesezeichen sowie OCR-Ergebnisse aus anderen Prozessen im XML-Format in seine PDF- und PDF/A-Ausgabedateien einbetten können.
Mit dem Modul „Born Digital Option“ sollen sich elektronisch erzeugte Dokumente aus MS Office, Outlook (E-Mails) sowie elektronisch entstandene PDF-Dateien – auf Wunsch auch stapelweise – in PDF- oder PDF/A-Dateien umwandeln lassen. (Quelle: Luratech Europe GmbH/GST)