Texterkennung – Text aus Dokumenten extrahieren

Texterkennung (OCR) dient der automatisierten Erkennung von Text in Dokumenten, wie z.B. Word- oder PDF-Dateien. Durch Texterkennung entfällt die zeitintensive und aufwändige manuelle Abschrift des Textes zur weiteren Bearbeitung. Der Inhalt eines Dokuments wird durch die automatisierte Texterkennung extrahiert und kann in einem Digital Asset Management (DAM) digital durchsuchbar gemacht werden.

Mockup Digital Asset Management AdmiralCloud

Texterkennung mit AdmiralCloud – Zeitersparnis bei der Verarbeitung und Suche

Mit dem DAM von AdmiralCloud werden Dokumente, wie z.B. Word- oder PDF-Dateien direkt nach dem Upload mittels automatisierter Texterkennung für die Suche in der Medienbibliothek indiziert. Alle Begriffe, welche im PDF-Dokument enthalten sind, sind direkt für die Suche nutzbar. Dadurch können Dokumente schnell und effizient zur Medienbibliothek hinzugefügt werden und sind sofort per Volltextsuche auffindbar.

Nach der Texterkennung liegt der Inhalt des Dokuments als Plain Text vor. Textteile können daraus einfach kopiert und später weiterverarbeitet werden. Dies erspart das Herunterladen und Öffnen der jeweiligen Dokumente, um den gewünschten Text zu extrahieren.

Zu den Features