オープンデータ編集 日付のルール

公開日 2022年1月23日 最終更新日 2022年1月23日

 一般的なコンピュータの日付は連続したシリアル数値です。当店では時・分・秒を含む製品を取り扱っていないので、年月日について説明します。

 当店の製品のほとんどは「年次」「四半期次」「月次」データです。もとデータが月次であれば、もとデータの多くは、画像のような「年月書式」「文字列書式」「分割文字列」が採用されています。
 当店ではこれらを「Y/M/D書式」へ変換しています。

 コンピューターの日付はシリアル数値であり、年月日です。ところが「年月」だけが記載されているデータには「日」にに該当する部分がありません。年次データにあるのは「年」だけです。
 このとき「日」や「月日」の部分を設定するルールが必要になります。例えば2022年1月1日~2022年1月31日の期間売上高合計が2022年1月の売上高で、もとデータの表記は「2022年1月」です。

 当店の製品は 「2022年1月」 は「2022/1/1」へ変換するといったルールがあります。

もとデータ販売データ
年月 (月次)日の部分はすべて1日 (末日を採用している製品がいくつかありますが明記してあります)
暦年 (年次)月日の部分はすべて1/1
暦年四半期 (四半期次)月日の部分は四半期の初日 1/1、4/1、7/1、10/1 これら4通り
会計年度 (年次)月日の部分はすべて会計年度の初日
4月~翌年3月が会計年度のときは4/1
会計年度四半期 (四半期次) 月日の部分は四半期の初日
会計年度が3月~翌年2月であれば3/1、6/1、9/1、12/1

 では、文字列でよいのでは?文字列のときはデメリットがあります。文字列は連続した数値ではないからです。


 ほとんどのBI系アプリでは

・時系列通りの昇順・降順に並ばない。
 2021年1月を2022年01月と表記すれば回避できますが・・・

・近似曲線 (回帰分析) を引けない、予測ができない。
 エクセルはそれらしいものができるものの、正確とはいえません。

・自動でグループ化できない。
 日付から年・四半期・月などの階層を自動作成する機能が使えません。

・折れ線グラフが繋がらない、折れ線グラフを作成できないことがある。

・エクセルでは文字列の「年月」を日付形式へ、日付形式を文字列へ「セルの書式設定」機能だけ変換することができません。