Este tutorial descreve como converter PDF digitalizado em PDF editável usando Python. Ele contém detalhes para configurar o IDE, uma lista de etapas e um código de exemplo para tornar o PDF legível usando Python. Você aprenderá a personalizar o reconhecimento definindo vários parâmetros expostos pela API.
Etapas para converter PDF em PDF pesquisável usando Python
- Configure o IDE para usar Aspose.OCR for Python via Java para escanear um PDF
- Importe a biblioteca e inicialize a licença
- Crie um mecanismo de reconhecimento usando o objeto da classe AsposeOcr
- Instancie o objeto OcrInput para configurar a entrada usando o PDF escaneado
- Defina o objeto RecognitionSettings configurando os parâmetros para controlar o processo de digitalização
- Chame o método engine.recognize() passando o objeto de entrada e as configurações de reconhecimento
- Salve os resultados como PDF com qualidade máxima
Estas etapas descrevem como transformar uma imagem PDF em texto PDF usando Python. Instancie o motor de reconhecimento usando a classe AsposeOcr, defina a entrada usando o objeto OcrInput e instancie o objeto RecognitionSettings para definir os parâmetros desejados. Por fim, chame o método recognize() para escanear o arquivo PDF e salve o resultado do processo de reconhecimento como um arquivo PDF usando o método save_pdf().
Código para converter imagem PDF em texto usando Python
O documento foi convertido com sucesso para PDF.
Este código de exemplo demonstra como converter PDF escaneado em PDF pesquisável usando Python. O método save_pdf() renderiza o fundo do PDF como está e coloca o texto escaneado sobre ele. Os desenvolvedores podem definir parâmetros como idioma de detecção, áreas de detecção, nível de precisão e desempenho.
Este artigo nos ensinou o processo de transformar um PDF escaneado em um PDF legível. Para extrair dados de faturas, consulte o artigo Extração de Dados de Faturas usando Python.