この短いハウツー記事では、Java で PDF からリンクを抽出する 方法を学習します。IDE 設定、手順の一覧、および Java で PDF からハイパーリンクを抽出する ためのサンプル コードが含まれています。リンク タイプの注釈を取得し、それを URI を取得するための URIAction に変換する方法を学習します。
JavaでPDFからURLを抽出する手順
- リンクを抽出するためにAspose.PDF for Javaを使用するようにIDEを設定します
- ソースPDF fileを読み込み、すべてのページを反復処理し、ページの注釈セレクターを作成します。
- ページからすべての注釈を抽出し、選択したコレクションに保存します。
- すべての注釈を反復処理し、各注釈を GoToURIAction に型変換します。
- getURI() メソッドを呼び出してリンクにアクセスし、コンソールに表示します。
このガイドでは、Java で PDF からすべてのリンクを抽出する方法を説明しました。ソース PDF ファイルを読み込み、ターゲット ページにアクセスし、各ページの注釈セレクターを作成します。定義されたセレクターを使用して accept() メソッドを呼び出し、リンク注釈のリストを取得し、GoToURIAction クラスに型キャストして URI を取得します。
Java で PDF からハイパーリンクを抽出するコード
上記のコードは、Java での PDF リンク抽出を示しています。PDF 内のページを反復処理しながら、Page クラス オブジェクトを使用してその内容を分析することで、ページをスキップまたは選択できます。getAction() メソッドは、リンクの URI を含む URIAction を取得するために使用されます。
この記事では、PDF からハイパーリンクを取得するプロセスについて学習しました。PDF でハイパーリンクを作成するには、Javaを使用してPDFにハイパーリンクを作成する方法 の記事を参照してください。