複数のファイルに分かれたデータをひとまとめにするには

2023.12.30 tableau
ホームブログ

複数のファイルに分かれたデータ...

さて、今回もセミナーでお受けした質問に対するひとつのヒントを書いていきます。質問の内容は「日ごとのCSVファイルをひとつに統合するにはどうしたらいい?」です。ウェブサイトのログデータは日付別のファイルになっていたりしますよね。他にも、月ごとに同じフォーマットのレポートを出している場合など。

Tableauは表の形がほぼ同じであれば、ユニオンの機能を使うと簡単にデータをひとつにまとめられます。ユニオンはデータを縦方向につなげることができます。次の図のようにファイルが2つに分かれている場合を例にとってみましょう。

Tableauを起動して[接続]からテキストファイルを選択し、目的のファイルをひとつ選択します。

そして、統合したいもうひとつのファイルを、最初に選んだファイルに載せるとユニオンができます。

ユニオンでデータをつなげると、自動的に元のファイル名が TableName としてデータに追加されますので出元が分かって安心です。

ところで、ファイルによって見出しの名前が違うときはどうなるでしょうか? 「支店」と「支社」の表記が統一されていなかったり、見た目の調整のために一部のファイルで「総利益」が「総 利 益」のようになっていたりすることはありませんか? Tableauは見出しが同じものは同じ意味のデータとしてひとつにユニオンしてくれますが、見出しが異なるものは別のデータだと認識します。

でも大丈夫。「名前は違うけど、同じ意味のデータだよ」と教えてあげることでデータがバラバラの状態になることを解消することができます。例えば、今ユニオンしたデータは、”境域年次”の見出しが和暦のものと西暦のものが混じっています。平成27年は2015年と同じなので、それぞれひとつにまとめてあげましょう。

やりかたは簡単で、一列にまとめたいデータを選択して、右クリックメニューから「一致していないフィールドをマージ」を選択するだけです。

同じやりかたで平成12年と2000年も一列にまとめることができます。

このように、ちょっとしたデータの整形はTableauのなかで行うことができます。もっと複雑な場合はデータプレパレーションツールを使うとうまくできますし、いっそのことデータの出力そのものから変更するのもアリです。「そうは言ってもどんなソフトウェアを選んでいいか分からない、既存のパッケージシステムに変更を加えるなんてできない」という方は、ぜひセミナーやユーザー会に参加してご相談ください。もちろん、当ホームページのお問い合わせフォームからでもOKです。