Quali sono gli svantaggi del riconoscimento ottico dei caratteri?

Lo svantaggio principale della scansione del riconoscimento ottico dei caratteri è il potenziale per introdurre errori in un documento scansionato. Nessun sistema di scansione OCR è infallibile e documenti di scarsa qualità possono creare errori sufficienti a richiedere tempi lunghi e lunghi- consumando correzioni. I caratteri a mano e non latini sono particolarmente difficili da scansionare correttamente.

Gli scanner ottici possono anche avere problemi con i documenti che non hanno un contrasto significativo tra i caratteri e lo sfondo. Le pagine sporche, o quelle stampate su supporti colorati, possono confondere uno scanner e generare grandi blocchi di testo non letto. I passaggi aggiuntivi necessari per rendere originali di scarsa qualità adatti per la scansione OCR potrebbero finire per compensare completamente il potenziale risparmio di tempo che la tecnologia offre.

Il modo migliore per garantire che la scansione OCR sia il più accurata e rapida possibile è progettare il documento originale in modo specifico per la scansione ottica. Ad esempio, molti pacchetti OCR hanno difficoltà a distinguere tra caratteri simili, come lo zero numerico e la lettera O. I caratteri compatibili con OCR rendono questi due caratteri più diversi possibili per aiutare il computer a leggere il documento.

I documenti scritti a mano richiedono una spaziatura uniforme e chiara tra le lettere per garantire una scansione corretta. Questo è il motivo per cui le forme che usano la tecnologia OCR spesso richiedono agli utenti di stampare in maiuscolo all'interno di una serie di scatole. Ogni casella separata può quindi essere scansionata individualmente, impedendo al computer di leggere erroneamente le lettere che sono state eseguite insieme.