В этом руководстве мы узнаем, как читать PDF файл на C++. Вы можете извлекать текст или изображения с любой страницы или всего документа файла PDF с помощью простых вызовов API на C++. Эта функция не зависит от Adobe Acrobat или любого приложения для чтения PDF на платформах Windows или Linux.
Шаги для чтения файла PDF в C++
- Установите Aspose.Pdf for C++ из диспетчера пакетов NuGet.
- Добавьте ссылку на пространство имен Aspose::Pdf
- Загрузите входной PDF-файл, используя Document Class
- Инициализировать экземпляр класса TextFragmentAbsorber
- Распечатать извлеченный текст на консоли
- Итерация по каждой странице и изображению документа
- Сохраните извлеченное выходное изображение в виде файла JPG.
Вы можете открыть и прочитать pdf-файл на C++ с помощью нескольких простых строк кода. Он может эффективно извлекать весь текст и изображения из файла PDF.
Код для чтения PDF-файла на С++
В предыдущем разделе мы рассмотрели Как сгладить поля формы PDF в C#. В этом разделе основное внимание уделяется тому, как читать текст из PDF-файла в C++.