Tento rychlý průvodce popisuje jak najít a nahradit text v PDF pomocí C# pomocí podrobných kroků a spustitelného kódu. Pomáhá s konfigurací prostředí a poté poskytuje krok za krokem proces nahrazení textu v PDF pomocí C#. Jakmile je soubor aktualizován, můžete jej uložit zpět na disk v původním formátu, tj. PDF nebo jako DOCX, Excel, HTML atd. abychom jmenovali alespoň některé.
Kroky k nalezení a nahrazení textu v PDF pomocí C#
- Nakonfigurujte projekt tak, aby používal Aspose.PDF for .NET pomocí správce balíčků NuGet
- Vytvořte nebo načtěte soubor PDF obsahující ukázkový text pomocí objektu třídy Document
- Pomocí objektu třídy TextFragmentAbsorber nastavte text, který se má prohledávat
- Pro všechny stránky ve vstupním souboru PDF přijměte absorbér textu
- Získejte kolekci fragmentů, kde je text extrahován z načteného souboru PDF
- Analyzujte všechny fragmenty a nastavte nový text
- Uložte aktualizovaný soubor PDF
Tyto kroky popisují, jak v PDF vyhledávat a nahrazovat text pomocí C#. Vytvoří se nový soubor s ukázkovým textem, ale můžete načíst existující soubor PDF, jehož text má být nahrazen. Pro vyhledávání textu v PDF je k dispozici celá řada možností, jako je ignorování stínového textu, omezení vyhledávání na vazbu stránky atd.
Kód pro nahrazení textu v PDF pomocí C#
Tento kód používá TextFragmentAbsorber a TextFragment pro text k vyhledání a nahrazení v PDF pomocí C#. Ve výsledném souboru PDF můžete nejen nahradit text, ale také změnit jeho rodinu písem, velikost, barvu popředí a barvu pozadí. K dispozici jsou také možnosti pro nahrazení textu v celém PDF najednou nebo nahrazení textu na základě regulárního výrazu.
V tomto tématu jsme se naučili hledat a nahrazovat text v PDF, pokud se však chcete naučit rozdělovat soubory PDF podle stránek, přečtěte si článek na jak rozdělit soubor PDF podle stránek v C#.