この短いチュートリアルでは、Java を使用して PowerPoint からテキストを抽出する方法を説明します。IDE の設定方法、手順の一覧、そして Java を使用した PowerPoint からテキストへの変換ツールのサンプルコード を共有します。プレゼンテーションからテキストを抽出するさまざまなオプションについても解説します。
Java を使用して PowerPoint からすべてのテキストを抽出する手順
- 環境を設定して Aspose.Slides for Java を使用し、PPTX を TXT に変換します
- スライド解析とファイル出力のための依存関係をインポートする
- Presentation クラスを使用して、ソース PPTX ファイルをメモリにロードします。
- すべてのテキストフレームを取得し、すべての slides からテキストコンテナを収集する。
- すべてのフレームの段落と部分を解析し、テキストを StringBuilder オブジェクトに追加します
- 出力ファイルをTXTファイルとして保存する
上記の手順は、Java を使用して PPTX からテキストを抽出するプロセスを要約しています。プレゼンテーションをロードし、すべてのテキストフレームにアクセスし、StringBuilder オブジェクトを作成し、すべてのフレームを反復して段落を取得します。各段落からは、ポーションを取得し、各ポーションのテキストを抽出して StringBuilder インスタンスに追加し、最後に蓄積されたテキストを TXT ファイルに保存します。
Java を使用した PPTX を TXT に変換するコード
このコードは、Java を使用して PowerPoint をテキストに変換する方法を示しています。SlideUtil.getAllTextBoxes() メソッドを使用してスライドごとにテキストを抽出でき、スライドを入力として受け取ります。また、slide.getNotesSlideManager().getNotesSlide() メソッドでスピーカーノートを抽出し、slide.getShapes() でテーブルからテキストを抽出できます。これはシェイプコレクションを返し、各シェイプが ITable のインスタンスかどうかでフィルタリングします。JSON 出力は、JsonObject にデータを設定し、JSONArray に保存することで生成できます。
この記事では、PowerPoint をテキストに変換する手順を説明します。プレゼンテーションをビデオに変換するには、記事 Convert PowerPoint to Video using Java を参照してください。