Dieses Tutorial beschreibt, wie man gescannte PDF mit Python in ein editierbares PDF konvertiert. Es enthält Details zur Einrichtung der IDE, eine Schritt‑für‑Schritt‑Liste und Beispielcode, um PDFs mit Python lesbar zu machen. Sie lernen die Anpassung der Erkennung, indem Sie verschiedene von der API bereitgestellte Parameter einstellen.
Schritte zum Konvertieren von PDF in durchsuchbare PDF mit Python
- Stellen Sie die IDE so ein, dass sie Aspose.OCR for Python via Java zum Scannen eines PDFs verwendet.
- Importieren Sie die Bibliothek und initialisieren Sie eine Lizenz
- Erstelle eine Erkennungs‑Engine unter Verwendung des Klassenobjekts AsposeOcr
- Instanziieren Sie das OcrInput‑Objekt, um die Eingabe mit dem gescannten PDF zu konfigurieren.
- Definieren Sie das RecognitionSettings‑Objekt, indem Sie die Parameter festlegen, die den Scanvorgang steuern.
- Rufen Sie die Methode
engine.recognize()indem Sie das Eingabeobjekt und die Erkennungseinstellungen übergeben. - Speichern Sie die Ergebnisse als PDF mit maximaler Qualität
Diese Schritte beschreiben, wie man ein PDF‑Bild in PDF‑Text mit Python umwandelt. Instanziieren Sie die Erkennungs‑Engine mit der Klasse AsposeOcr, definieren Sie die Eingabe mit dem Objekt OcrInput und instanziieren Sie das Objekt RecognitionSettings, um die gewünschten Parameter festzulegen. Rufen Sie schließlich die Methode recognize() auf, um die PDF‑Datei zu scannen, und speichern Sie das Ergebnis des Erkennungsprozesses als PDF‑Datei mit der Methode save_pdf().
Code zum Umwandeln von PDF-Bildern in Text mit Python
Der zu übersetzende Text ist nicht verfügbar. Bitte stellen Sie den zu übersetzenden Satz direkt bereit.
Dieser Beispielcode demonstriert, wie man gescannte PDFs in durchsuchbare PDFs mit Python konvertiert. Die Methode save_pdf() rendert den PDF‑Hintergrund unverändert und legt den gescannten Text darüber. Die Entwickler können Parameter wie Erkennungssprache, Erkennungsbereiche, Genauigkeitsgrad und Leistung festlegen.
Dieser Artikel hat uns den Prozess erklärt, ein gescanntes PDF in ein lesbares PDF zu ändern. Um Daten aus Rechnungen zu extrahieren, siehe den Artikel Datenextraktion aus Rechnungen mit Python.