日付を取得する(和暦の変換)

PDFから取得した和暦の日付テキストを処理する方法について説明します。

PDFからテキストを取得するページ

まず、取得したいテキストをPDF上でドラッグします。
例えば、ここでは右上の「請求日付」を取得しています。

ラベル「請求日:」と取得したい日付テキストが近接している場合は、ラベルと日付を含むすべてのテキストを取得し、不要なテキストを削除するよう設定するのがポイントです。

歯車ボタンをクリックし詳細設定画面を開きます。

詳細設定画面の左上に表示されているて「変換前のテキスト」がPDF上から取得したテキストです。

テキストの種類を選択する

今回のテキストは「請求日」ですので、テキストの種類は「日付」を選択します。
日付を選択することで、ほかのオプションと組み合わせた際に、日付範囲検索や書式変換などが可能になります。

テキスト中の不要なテキストを削除する

「先頭から削除する文字」に「請求日:」と入力し、確認ボタンをクリックし変換後のテキストを確認します。

標準対応していない日付形式を処理する

標準で「日付」として認識できない形式で記録された日付は、変換に失敗します。

例えば、「令和7.1.31」のような形式は、標準の日付フォーマットではないため、変換できません。

標準の日付フォーマットで変換できない場合は、「PDFで使用している日付の書式」に対応するフォーマットを入力します。
例えば、「令和7.1.31」の場合は、「ggy.M.d」と入力してください。

確認ボタンをクリックし、日付に変換できることを確認します。

使用できる日付書式について

日付の書式は、日付や時刻を特定のフォーマットで表示・変換するためのルールです。
以下の書式を使用することで、日付データを希望の形式で出力できます。

書式一覧

書式 書式 説明
年の表記
yyyy
西暦4桁
2025
yy
西暦の短縮形(下2桁)
25
ggy
元号の年(2桁)
令和07
ggy
元号の年(1桁)
令和7
月の表記
MM
月の2桁表示(01~12)
06(6月)
M
月の1桁表示(1~12)
6(6月)
日の表記
dd
日の2桁表示(01~31)
05(5日)
日の1桁表示(1~31)
5(5日)
時刻の表記
HH
24時間制の時刻(00~23)
13(13時)
hh
12時間制の時刻(01~12)
01(午後1時)
mm
分(00~59)
45(45分)
ss
秒(00~59)
30(30秒)

元号のない和暦を変換する

元号のない和暦を日付に変換できるように設定します。
例えば、「7年1月31日」のような元号のない和暦を、日付に変換できるように設定します。

「元号のない和暦を使用している」チェックボックスを選択し、「元号を『令和』として処理する」と入力します。

「元号を『令和』として処理する」とは、指定されていない元号を、入力された元号として処理することを指します。
たとえば、元号に「平成」と入力すると、「7年1月31日」は「平成7年1月31日」として処理されます。

元号(略号)の和暦を変換する

H や Rといった元号(略号)を日付に変換できるように設定します。
例えば、「R7年1月31日」のような元号(略号)の和暦を、日付に変換できるように設定します。
「元号の略号を使用している」チェックボックスを選択します。
「元号と略号の対応を設定」ボタンをクリックします。

略号と元号の対応を入力する画面が開きますので、
たとえば 略号「R」を「令和」として処理するというように、略号に対応する元号を設定します。
設定後は「設定を確定」ボタンで、入力内容を保存します。

確認ボタンをクリックし、日付への変換が成功するか確認します。

元号がない和暦で、標準対応していない日付形式 を処理する

例えば、「7.1.31」のような元号のない和暦で、かつ標準の日付書式で変換できないような日付を、日付に変換できるように設定します。

下記の設定は「請求日:7.1.31」を日付に変換できるよう設定するサンプルです。

テキストの種類で「日付」を選択します。
日付の前に不要な文字「請求日:」がついているので、先頭から削除する文字に「請求日:」を入力します。
元号がないので「元号のない和暦を使用している」を選択し、元号を「令和」といて処理するよう入力します。
標準書式ではないので「PDFで使用されている日付の書式」を選択し、元号が付いているものとして書式(ggy.M.d)を設定します。

確認ボタンをクリックし、日付への変換が成功するか確認します。

設定を保存する

設定後は「適用」ボタンをクリックして、設定内容を保存します。