Hướng dẫn này sẽ hướng dẫn bạn cách trích xuất văn bản từ hình ảnh bằng Python. Hướng dẫn cung cấp thông tin để thiết lập môi trường sử dụng Aspose.OCR, danh sách các bước để mô tả luồng chương trình và mã Python để trích xuất văn bản từ hình ảnh. Bạn sẽ học cách trích xuất văn bản từ một hình ảnh PNG/JPEG/PDF/TIFF/GIF/BMP hoặc bộ sưu tập hình ảnh trong một thư mục.
Các bước trích xuất văn bản từ hình ảnh trong Python
- Thiết lập môi trường để sử dụng Aspose.OCR for Python via .NET để trích xuất văn bản từ hình ảnh
- Tạo một đối tượng của lớp AsposeOcr để đọc văn bản
- Tạo một đối tượng của lớp bộ sưu tập OcrInput để thêm hình ảnh
- Đặt loại đầu vào Ocr thành DIRECTORY
- Thêm một hoặc nhiều đường dẫn thư mục vào bộ sưu tập hình ảnh
- Gọi phương thức extractTextFromImage() bằng cách cung cấp đối tượng OcrInput
- Hiển thị tất cả văn bản đã trích xuất trên bảng điều khiển
Các bước này mô tả chương trình Python để trích xuất văn bản từ hình ảnh. Tạo một đối tượng của lớp AsposeOcr, đối tượng OcrInput để duy trì bộ sưu tập hình ảnh, thiết lập danh sách hình ảnh trong bộ sưu tập và gọi phương thức recognize() để đọc văn bản. Cuối cùng, văn bản được nhận dạng được hiển thị từng cái một bằng cách phân tích cú pháp bộ sưu tập được trả về từ phương thức recognize().
Mã để trích xuất văn bản từ hình ảnh bằng OCR trong Python
Mã này minh họa trích xuất văn bản từ hình ảnh bằng Python. Bạn có thể đặt loại đầu vào thành SINGLE_IMAGE, PDF, TIFF, URL, ZIP, v.v. dựa trên yêu cầu của bạn. Bạn có thể thêm nhiều đường dẫn thư mục hoặc đường dẫn hình ảnh bằng cách sử dụng phương thức add() trong lớp OcrInput.
Bài viết này đã hướng dẫn chúng ta quy trình trích xuất dữ liệu từ hình ảnh bằng Python. Để đọc hình ảnh viết tay, hãy tham khảo bài viết trên Chuyển đổi chữ viết tay thành văn bản bằng Python.