Այս ձեռնարկը ցույց է տալիս, թե ինչպես կատարել տվյալների արդյունահանում հաշիվ-ապրանքագրերից Python-ի միջոցով: Այն ունի բոլոր մանրամասները մշակման համար IDE-ն սահմանելու համար, ծրագրի հոսքը սահմանող քայլերի ցանկ և օրինակելի կոդը, որը ցույց է տալիս ապրանքագրի OCR ծրագրակազմը Python-ի միջոցով: Դուք կսովորեք հարմարեցնել հայտնաբերման գործընթացը այնպիսի պատկերներից, ինչպիսիք են՝ PNG, JPEG, BMP, TIFF և GIF՝ ըստ ձեր պահանջների:
Python-ի միջոցով հաշիվ-ապրանքագրի OCR-ի քայլեր
- Սահմանեք միջավայրը, որպեսզի օգտագործի Aspose.OCR for Python via .NET հաշիվ-ապրանքագրի տվյալները հանելու համար
- Ստեղծեք Aspose.Ocr-ի օրինակ OCR մշակման համար
- Ստեղծեք OcrInput դասի օրինակ՝ անդորրագրերը պահելու համար
- Ավելացրեք անդորրագրեր OcrInput հավաքածուին
- Կարգավորեք անդորրագրի ճանաչման կարգավորումները և սահմանեք ճանաչման լեզուն
- Կատարեք OCR՝ օգտագործելով recognize_receipt մեթոդը՝ մուտքագրված անդորրագրերից տեքստը ճանաչելու համար
- Ցուցադրել անդորրագրերից ճանաչված տեքստը
Այս քայլերը նկարագրում են, թե ինչպես կիրառել OCR անդորրագրերի համար՝ օգտագործելով Python: Ստեղծեք Aspose.Ocr օբյեկտի օրինակ, նախաստորագրեք OcrInput օբյեկտը՝ անդորրագրերը պահելու համար, և ստեղծեք ReceiptRecognitionSettings օբյեկտը՝ հաշիվ-ապրանքագրերի OCR-ի պարամետրերը սահմանելու համար: Ի վերջո, զանգահարեք ճանաչում_receipt() մեթոդը՝ տրամադրելով անդորրագրերի ցանկը և տեքստը հանելու կարգավորումները։
Python-ի միջոցով հաշիվ-ապրանքագրի տվյալների արդյունահանման կոդը
Այս օրինակելի կոդը ցույց է տալիս invoice OCR API-ի օգտագործումը Python-ի միջոցով: Դուք կարող եք մուտքագրման տեսակը սահմանել PDF, TIFF, URL, Directory, Zip և այլն, և սահմանել հայտնաբերման լեզուն Լեզու համարիչի լեզուների անունների մեծ ցանկից, ReceiptRecognitionSettings դասը պարունակում է մի շարք հատկություններ, ինչպիսիք են թույլատրելի նիշերի հավաքածուի կարգավորումը: , դրոշակ՝ գույների ավտոմատ հակադարձումը սահմանելու և նիշերի սև ցուցակ սահմանելու համար՝ դրանք անտեսելու համար:
Այս հոդվածը մեզ սովորեցրել է հաշիվ-ապրանքագրի տեքստը հանելու գործընթացը: Ձեռագիր տեքստը խմբագրելի և որոնելի տեքստի փոխարկելու համար տես Ձեռագիրը փոխակերպեք տեքստի Python-ի միջոցով-ի հոդվածը: