Na het scannen worden alle digitale documenten, ongeacht het oorspronkelijke formaat, geconverteerd. Alle documenten krijgen daardoor een universeel document formaat, zodat deze in het verdere proces eenduidig kunnen worden afgehandeld.
Omdat alle documenten hetzelfde bitmap formaat hebben, worden ze allemaal volautomatisch herkend door middel van OCR software. Op de achtergrond wordt ieder document omgezet naar ASCII/XML data. De herkende data wordt vervolgens gekoppeld aan iedere pagina van het document. Het systeem legt hierdoor nauwkeurig vast op welke plek welke informatie zich binnen het document bevindt.
De inzet van OCR herkenning is een optie in de Digitale
Postkamer. Voor de verwerking
van documenten later in het proces biedt de inzet van OCR de
volgende toegevoegde waarde:
- Automatisch classificeren. Indien u geen OCR herkenning toepast, zult u handmatig documenten moeten classificeren. M.a.w. wat voor soort document is het en voor wie is het bedoeld.
- Volledig doorzoekbaar. Omdat alle data van ieder document toegankelijk is gemaakt, kan gezocht worden op ieder willekeurig woord (zeg maar: "Google zoeken").
