Neste breve tutorial, aprenderemos como ler documento do Word em C# com a ajuda de detalhes sobre configuração do ambiente, uma lista de etapas e um código executável. O código demonstrará a leitura do arquivo do Word de diferentes maneiras. Você aprenderá como C# lê um documento do Word carregando um arquivo do Word como DOCX, DOC, RTF ou HTML etc., e acessando seus diferentes elementos para processar ou visualizar.
Etapas para ler dados do documento do Word em C#
- Configure o ambiente do projeto para usar Aspose.Words do gerenciador de pacotes NuGet
- Carregue o arquivo DOCX de entrada no objeto de classe Document
- Obtenha todos os nós do tipo Paragraph do documento
- Converta cada parágrafo em uma string e exiba-o no console
- Obtenha todos os nós do tipo Run do documento
- Converta cada item Run em uma string e exiba-o junto com o nome e o tamanho da fonte
Essas etapas fornecem as informações detalhadas necessárias para configurar o ambiente e as tarefas a serem executadas durante a gravação de um programa leitor de arquivos do Word. Ele mostra como C# lê o arquivo DOCX carregando o arquivo de origem na instância da classe Document e acessando todos os seus parágrafos para exibir o texto. Também descreve a leitura de dados de parágrafos, tabelas, etc., de forma que cada segmento de texto com um estilo diferente seja separado ou cada valor de célula da tabela seja acessado separadamente para processamento.s
Código para ler arquivo do Word em C#
Este código demonstra como ler o arquivo do Word em C# usando a função Document.GetChildNodes() que requer que um tipo de nó seja buscado como Paragraph, Run, Section, Body, HeaderFooter, Comment, etc. Uma vez que o nó filho é acessado , você deve convertê-lo para o respectivo tipo para usar seus métodos e propriedades. Por exemplo, lemos o documento duas vezes, de modo que primeiro todo o texto de todo o documento é exibido independentemente de um parágrafo normal ou de uma tabela etc., e na segunda vez ele é lido com base em qualquer alteração no estilo e no tipo de conteúdo.
Este artigo nos ensinou a ler arquivos do Word, mas se você quiser aprender a conversão de documentos do Word para HTML, consulte o artigo em como converter documento do Word para HTML usando C#.