Այս կարճ ձեռնարկում մենք կսովորենք, թե ինչպես փոխարկել Word Document-ը HTML-ի` օգտագործելով Python: Python-ում կոդերի օրինակելի տողերը արդյունավետ կերպով փոխակերպում են DOCX-ը HTML՝ հետևելով պարզ քայլերին: Կարելի է այս փոխարկումը կատարել ցանկացած օպերացիոն համակարգի վրա, ինչպիսիք են Linux-ը, macOS-ը կամ MS Windows-ը, որտեղ կազմաձևված է .NET Framework-ը:
Քայլեր Word փաստաթուղթը HTML-ի փոխակերպելու համար Python-ի միջոցով
- Ստեղծեք միջավայր՝ ձեր հավելվածում Aspose.Words Python-ի համար .NET-ի միջոցով օգտագործելու համար
- Ներառեք անվանատարածքներ և դասեր, որոնք պահանջվում են ծրագրի սկզբում
- Բացեք սկզբնաղբյուր Word ֆայլը սկավառակից Փաստաթղթի դասի օբյեկտի մեջ՝ HTML-ի փոխակերպելու համար
- Նախաձեռնեք HtmlSaveOptions օբյեկտը՝ ելքային HTML-ը հարմարեցնելու համար
- Փոխակերպեք DOCX-ը HTML-ի՝ օգտագործելով պահպանման մեթոդը
Python DOCX-ի HTML-ի վերը նշված քայլերի օգնությամբ ձեռք է բերվում փոխակերպում: Առաջին հերթին, Document դասի օրինակն օգտագործվում է մուտքագրված Word Document-ը բեռնելու համար, այնուհետև սահմանում է տարբեր հատկություններ HTML-ի մատուցման գործընթացի համար, ինչպիսիք են ExportPageMargins, CssStyleSheetType և ImageResolution և այլն: Վերջապես, ելքային ֆայլը պահվում է սկավառակի վրա HTML ֆայլի ընդլայնմամբ: .
Կոդ Python-ում բառը HTML-ի փոխարկելու համար
Python Word-ի HTML փոխակերպման հավելվածը մշակվել է վերը նշված օրինակի օգնությամբ։ Փաստաթղթի դասի օրինակն օգտագործվում է սկզբնաղբյուր Word Document-ը բեռնելու համար, այնուհետև նշվում են արտապատկերման տարբեր տարբերակներ՝ ելքային HTML ֆայլի հատկությունները հարմարեցնելու համար: Ի վերջո, պահպանելու համար օգտագործվում է Word to HTML Python վրա հիմնված պահպանման մեթոդը:
Այս հոդվածում մենք ուսումնասիրել ենք DOCX-ը HTML-ի փոխակերպելու գործընթացը՝ օգտագործելով Python* վրա հիմնված API: Այնուամենայնիվ, եթե ցանկանում եք DOCX ֆայլը վերածել PDF-ի, տես ինչպես փոխարկել Word-ը PDF-ի՝ օգտագործելով Python-ը-ի հոդվածը: