Este artigo descreve como extrair uma tabela de PDF para Excel usando Python. Ele contém todos os detalhes para utilizar ambos os produtos, ou seja, Aspose.PDF e Aspose.Células, uma lista de etapas e um código de exemplo para extrair tabela Excel de PDF usando Python. O código de exemplo demonstrará o processo completo ao transferir a tabela de uma página PDF para uma planilha Excel.
Etapas para extrair tabela de PDF para Excel usando Python
- Configure o ambiente para instalar Aspose.Total For Python via .NET
- Aplique a licença para as bibliotecas importadas relevantes, ou seja, Aspose.Células e Aspose.PDF
- Carregue o arquivo PDF de origem com tabelas usando o objeto da classe Document
- Crie um arquivo Excel vazio usando a classe Workbook e defina um nome para a primeira planilha
- Percorra cada página na coleção de páginas do arquivo PDF
- Acesse a coleção de tabelas e analise cada célula da tabela
- Buscar texto da célula PDF e copiá‑lo para a célula respectiva na planilha Excel
- Guarde o ficheiro Excel no disco com os dados da tabela do PDF
Esses passos englobam o processo de extrair dados de uma tabela PDF para Excel usando Python. Importe as bibliotecas necessárias, carregue o ficheiro PDF de origem, aceda a cada página e à coleção de tabelas nele, e analise todas as tabelas. Finalmente, acesse cada célula em uma tabela PDF e salve seu conteúdo na célula correspondente na planilha Excel de saída.
Código para extrair tabela de PDF para Excel usando Python
Este código demonstra como obter uma tabela de PDF para Excel usando Python. Você pode experimentar um mecanismo de reconhecimento de tabelas diferente usando a opção use_flow_engine na classe TableAbsorber para detectar tabelas sem bordas no PDF. Use o text_state na célula absorvida para obter o nome da fonte, o tamanho, a cor de fundo, a cor de primeiro plano e o estilo negrito itálico, a fim de personalizar o formato da célula de destino no Excel, mantendo a formatação das tabelas semelhante em ambos os arquivos.
Este artigo ajudou a entender o processo de transferência de uma tabela PDF para o Excel. Para instalar o Python para executar o Aspose.PDF para Python via .NET, consulte o artigo [Como instalar o Python para executar o Aspose].PDF para Python via .NET]( https://kb-qa.aspose.com/ pt/total/python/how-to-install-python-to-run-aspose-pdf-for-python-via-net/).