日付を取得する(西暦の変換)

PDFから取得した西暦の日付テキストを処理する方法について説明します。

PDFからテキストを取得するページ

まず、取得したいテキストをPDF上でドラッグします。
例えば、ここでは右上の「請求日付」を取得しています。

ラベル「請求日:」と取得したい日付テキストが近接している場合は、ラベルと日付を含むすべてのテキストを取得し、不要なテキストを削除するよう設定するのがポイントです。

歯車ボタンをクリックし詳細設定画面を開きます。

詳細設定画面の左上に表示されているて「変換前のテキスト」がPDF上から取得したテキストです。

テキストの種類を選択する

今回のテキストは「請求日」ですので、テキストの種類は「日付」を選択します。
日付を選択することで、ほかのオプションと組み合わせた際に、日付範囲検索や書式変換などが可能になります。

テキスト中の不要なテキストを削除する

「先頭から削除する文字」に「請求日:」と入力し、確認ボタンをクリックし変換後のテキストを確認します。

標準対応していない日付形式を処理する

標準で「日付」として認識できない形式で記録された日付は、変換に失敗します。
例えば、「2025_1_31」のような形式は、標準の日付フォーマットではないため、変換できません。
標準の日付フォーマットで変換できない場合は、「PDFで使用している日付の書式」に対応するフォーマットを入力します。
例えば、「2025_1_31」の場合は、「yyyy_M_d」と入力してください。
確認ボタンをクリックし、日付に変換できることを確認します。

使用できる日付書式について

日付の書式は、日付や時刻を特定のフォーマットで表示・変換するためのルールです。
以下の書式を使用することで、日付データを希望の形式で出力できます。

書式一覧

書式 書式 説明
年の表記
yyyy
西暦4桁
2025
yy
西暦の短縮形(下2桁)
25
ggy
元号の年(2桁)
令和07
ggy
元号の年(1桁)
令和7
月の表記
MM
月の2桁表示(01~12)
06(6月)
M
月の1桁表示(1~12)
6(6月)
日の表記
dd
日の2桁表示(01~31)
05(5日)
日の1桁表示(1~31)
5(5日)
時刻の表記
HH
24時間制の時刻(00~23)
13(13時)
hh
12時間制の時刻(01~12)
01(午後1時)
mm
分(00~59)
45(45分)
ss
秒(00~59)
30(30秒)

設定を保存する

設定後は「適用」ボタンをクリックして、設定内容を保存します。