Automatische Texterkennung und Indexierung mittels OCR Technologie
Automatische Texterkennung und Indexierung mittels OCR Technologie Hilfreich für die Verschlagwortung/Indexierung und das Indizieren von Dateien und Dokumenten sind sogenannte OCR- und ICR-Technologien. OCR steht für Optical Character Recognition (optische Zeichenerkennung, auch Texterkennung) und dient hauptsächlich dem schnellen, automatischen Auslesen von gedrucktem Text aus digitalen Bildern. ICR steht für Intelligent Character Recognition (Intelligente Zeichenerkennung); dabei wird die rein optische Zeichenerkennung (OCR) durch weitere Methoden ergänzt. Dateien indizieren: Ihre digitalisierten Dokumente werden mit entsprechenden Suchkriterien gespeichert. Sollen Informationen erfolgreich wiedergefunden werden, so müssen die gescannten Dokumente durch spezielle Suchbegriffe (Indizes) eindeutig zuzuordnen sein – das Indizieren von Dateien wird auch als Indexierung o. Verschlagwortung bezeichnet. Es ist möglich, mehrere Indizes zu bilden, sodass eine spätere Recherche nach unterschiedlichsten Schlagworten möglich ist, wie beispielsweise Datum, Kundennummer, Postleitzahl u.ä. Diese Funktion gewährleistet eine schnelle und effektive Suche. Das Indizieren der Dateien erfolgt entweder automatisch über OCR/ICR-Technologie, Barcode oder manuell.