Como fazer OCR em PDF
O Reconhecimento Óptico de Caracteres (OCR) permite extrair texto editável de imagens ou documentos PDF digitalizados. Com o Tenorshare PDNob, você pode facilmente realizar OCR para tornar seus PDFs pesquisáveis e editáveis. Este guia fornece um tutorial claro e passo a passo sobre como instalar o recurso OCR e usá-lo em seus arquivos PDF.
1. O que é OCR
OCR (Reconhecimento Óptico de Caracteres) é uma tecnologia que converte imagens digitalizadas ou PDFs baseados em imagem em texto editável e pesquisável. Isso é particularmente útil ao lidar com documentos digitalizados ou materiais impressos que foram digitalizados.
2. Baixar e Instalar OCR
- Abra o software Tenorshare PDNob no seu computador.
- Na interface principal, clique no botão "OCR PDF" .
- Selecione os arquivos desejados no seu computador e clique em "Abrir" para carregá-los no PDNob.
- Clique no botão "Download" para instalar a funcionalidade OCR, se solicitado.
3. Como fazer OCR em PDFs
- Após a instalação do recurso OCR, clique no botão "OCR" na barra de ferramentas superior para iniciar o processo de OCR.
- Uma janela de configurações aparecerá. Escolha o modo OCR conforme suas necessidades:
-
Digitalizar para texto editável
Converte texto digitalizado em conteúdo totalmente editável. Após o OCR, você pode editar, mover, copiar ou excluir texto no PDF como em um documento comum. -
Digitalizar para texto pesquisável na imagem
Mantém a imagem digitalizada original intacta enquanto torna o texto pesquisável e selecionável. Perfeito para indexação ou consulta de texto sem alterar o layout. - Após selecionar a opção adequada, clique em "OCR" para iniciar o reconhecimento de texto.
- Após a conclusão do OCR, o texto reconhecido torna-se pesquisável e copiável. Selecionar "Scan to Editable Text" permite editar o texto diretamente no PDF.
4. Configurações Avançadas de OCR (Suportado no PDNob 2.0)
O PDNob 2.0, previsto para lançamento entre meados e final de março, introduz Configurações Avançadas de OCR, permitindo aos usuários otimizar os resultados do reconhecimento. Ativar essas opções pode melhorar a precisão, embora possa reduzir um pouco a velocidade do processamento OCR.
Para acessar essas opções, abra o painel de configurações OCR e clique em Configurações avançadas. Você pode ativar ou desativar recursos específicos de processamento de imagem e detecção de texto. Consulte a captura de tela abaixo para a localização da entrada.
Saiba mais sobre essas configurações nesta seção:
- Corte automático de página – Detecta automaticamente áreas de conteúdo e corta bordas desnecessárias, tornando as páginas mais compactas e melhorando a precisão do OCR.
- Correção automática de inclinação da página – Corrige páginas inclinadas para alinhar o texto horizontalmente, aprimorando a precisão do reconhecimento.
- Aprimorar contraste local – Melhora o contraste local da imagem para clarear texto borrado, alterando ligeiramente as cores originais.
- Remover manchas escuras – Elimina pequenas manchas escuras de ruído, melhorando a limpeza da página e a nitidez do OCR.
- Remover Ruído – Filtra pontinhos brancos e outras interferências, clareando as bordas do texto para melhores resultados de OCR.
- Detectar texto em imagens – Reconhece e extrai texto embutido em regiões de imagem para um OCR abrangente.