このクイック ガイドでは、Python を使用して Excel の重複行を削除する プロセスについて説明します。開発環境を設定するための詳細、アプリケーションを作成する手順の一覧、Python を使用して Excel の重複行を削除する サンプル コードが含まれています。さまざまなパラメーターを設定して重複行を削除するさまざまなオプションについて説明します。
Python で Excel の重複行を削除する手順
- 重複行を削除するためにJava 経由の Python 用 Aspose.Cellsを使用するようにIDEを設定します
- ExcelファイルをWorkbookオブジェクトに読み込みます
- 選択したシートからセルコレクションにアクセスする
- removeDuplicates() メソッドを呼び出して、シートから重複行をすべて削除します。
- 重複行を削除するには、定義した範囲でremoveDuplicates()メソッドを呼び出します。
- セル範囲とヘッダーおよび対象列のフラグを指定してremoveDuplicates()メソッドを呼び出します。
- 出力を保存する
上記の手順は、Python を使用して Excel の重複エントリを削除する プロセスについて説明しています。プロセスを開始するには、ソース Excel ファイルを Workbook クラス オブジェクトに読み込み、removeDuplicates() メソッドのさまざまなバリアントを呼び出します。ソース ファイルから必要な重複行を削除した後、出力 Excel ファイルを保存します。
Python で Excel の重複行を削除するコード
import jpype | |
import asposecells as cells | |
jpype.startJVM() | |
from asposecells.api import License, Workbook | |
# Instantiate a license | |
license = License() | |
license.setLicense("License.lic") | |
book = Workbook("removeduplicates.xlsx") | |
# Remove duplicates from the entire sheet | |
book.getWorksheets().get(1).getCells().removeDuplicates() | |
# Remove duplicate from the defined range | |
book.getWorksheets().get(0).getCells().removeDuplicates(0,7,5,10) | |
# Remove Duplicates based on data from the selected columns | |
cols = [ 0, 3 ] | |
book.getWorksheets().get(0).getCells().removeDuplicates(0, 0, 6, 3,True,cols) | |
# Save result | |
book.save("removeduplicates-result.xlsx") | |
print("Duplicate rows removed successfully") |
このコードは、Python を使用して Excel で重複レコードを削除する 方法を説明しています。引数なしの removeDuplicates() メソッドは、ターゲット シートから重複行をすべて削除し、開始セルと終了セルを持つ 2 番目のオーバーロードは、削除するセルの範囲を定義します。別のオーバーロードは、セルの範囲、データにヘッダーがあることを示すフラグ、最後に、指定された範囲内でデータを比較する列インデックスのリストを受け取ります。
この記事では、Python を使用して Excel 内の重複エントリを削除する方法について説明しました。Excel ファイルから数式を削除するには、Python を使用して Excel の数式を削除する方法 の記事を参照してください。