Portuguese/PT Scannos

From DPWiki
Jump to: navigation, search

Os erros de reconhecimento (scannos) resultam de uma incapacidade dos programas de reconhecimento óptico de caracteres para interpretar uma letra ou palavra tal como se encontra na edição impressa.

Podem resultar em erros de reconhecimento facilmente identificáveis (como urn em vez de um, dada a semelhança entre a letra m e as letras rn conjugadas); ou num erro camuflado (stealth scanno), mais dificilmente perceptível pelo olho humano (como 0utro em vez de Outro -- no primeiro caso a primeira letra é um zero: zero+utro).

Está em curso a construção de listas de erros de reconhecimento que possam facilitar o seu tratamento automático prévio. Ver discussão no fórum em Erros de Reconhecimento.

Até agora, os erros mais frequentes encontrados são:

PT Scannos Normais

PT Scannos Acentos