Googleの移動データ可視化

2020.04.24 ニュース
ホームお知らせ

Googleの移動データ可視化

 新型コロナウイルスの世界的な流行に伴い、外出制限・自粛の動きが広まっています。日本では、「人との接触を8割削減すること」が求められており、皆さんもリモートワークや家での過ごし方を模索されている状態だと思います。

 このような流れの中で、スマートフォン等の位置情報や、検索のビッグデータを持つGoogleやYahoo!Japan等が人々の移動データを期間限定でオープンデータとして公開しています。今回は、このオープンデータと、気象データや感染者のデータを組み合わせた分析を行い、Tableau Publicで公開しましたので、その作成方法と分析についてお知らせします。 

〇Googleの「COVID-19 Community Mobility Reports」の可視化

〇データの概要

 Googleは、4月3日より「COVID-19 Community Mobility Reports」というレポートを全世界に公開しています。同レポートは、集計のうえ匿名化したデータを使用し、娯楽関連施設(Retail & recreation)、食料品店やドラッグストア(Grocery & pharmacy)、公園(Parks)、公共交通機関(Transit stations)、職場(Workplaces)、住宅(Residential)といった大分類を用い、これらの場所の行動の傾向を時系列のグラフで表示しています。日本を含む 131 カ国が対象で、国レベルだけでなく可能な範囲で地域ごと(日本においては県単位)の情報が掲載されています。

 

〇データのダウンロード

 さて、このデータは、今週から期間限定ではありますが、CSV形式でダウンロードして誰でも利用出来るようになりました。CSVデータは、こちらのサイトの下の図の場所からダウンロードすることができます。

<ダウンロードするページ>

 「Download global CSV」のボタンを押すと、「Global_Mobility_Report.csv」というファイルがダウンロードされます。

<Global_Mobility_Report.csv」の中身>

 

 ファイルの中身は、約22万行程のデータで13.4M程の量があります。今回使うのは、日本のデータだけですので、それ以外のデータは削除したいと思います。また、集計単位は都道府県別に有るのですが、表記が英語表記になっているため、これらを日本語化したいと思います。このようなデータの「前処理」を行う時に使うツールが「Tableau Prep Builder」です。このツールは、データをTableauで可視化する前に、データを整理したり、加工したりする時に使います。

○Tableau Prep Builderによるデータ前処理

 Tableau Prep Builderの画面は下のような画面です。上半分のところにデータ処理の流れがアイコンで表示されるので、「ステップ」「集計」「ピボット」等の機能を選んで処理をしていきます。今回は、データを読み込んだ後、「クリーニング1」のところで、データ項目を日本語に修正したり、日本のデータだけにフィルタリングしたり、不要なデータ列を削除し

たりしています。その後、ピボットをかけてデータの値の部分と項目の部分と分け、予め別途用意していた「都道府県マスタ」で都道府県名を英語表記から日本語に変換。最後に、Tableauで使うhyper形式のデータに出力して、前処理は終了です。

 

○Tableau Desktopで可視化

 Tableau Prepで前処理したデータが出来たら、Tableau Desktopで可視化する作業を進めます。今回は、3種類のワークシートを作り、最後にそれをダッシュボードにまとめていきます。

 まず、一つ目のワークシートは、日本地図上に各都道府県の移動量を色分けするワークシートです。Tableauの機能に、「地理的役割」という機能があり、これを適切に指定すると、Tableauが各都道府県のエリアで分けてくれます。

<「地理的役割」の指定>

そして、それぞれの「場所」をフィルタに設定し、公共交通機関や公園などでの人の移動量の増減を色で表現することにします。これは、数値をTableauの[マーク]カードの「色」に持ってくることで出来ます。それ以外に集計期間をフィルタに追加するなどして一つ目のワークシートは出来上がり。

 二つめのワークシートは、フィルタで指定した集計期間における、各都道府県の場所毎の増減率を表す表を作成します。ワークシートという程のものではなく、単なる表なので、それほど難しい事は無く、場所と増減率を表示するだけで完成です。

 三つ目のワークシートは、各都道府県の場所毎の移動量が、時系列でどのように変化したのかを表すワークシートです。こちらもそれほど難しい事は無く、[列]フィールドに日付、[行]フィールドに増減率と増減率の7日間移動平均を置きます。尚、増減率の7日間移動平均は、増減率を右クリックして、簡易表計算の中から「移動平均」を選んで作成できます。一つだけ気をつけなければいけないのは、「当日を含む7日間」の移動平均を作成するには、「前」の数値を「7」ではなく、「6」に設定し、「現在の値」欄にチェックを入れる必要があることです。この指定をすることで、最新の日を含む7日間の移動平均を計算してくれます。

 

 さて、3つのワークシートが出来たので、一つのダッシュボードにまとめていきます。新たに「新しいダッシュボード」を作成し、これまでに作成した3つのワークシートを配置していきます。フィルタやワークシートのレイアウト、文字のフォントなどを調整する見栄えの調整や、左上のマップ上で都道府県をクリックすることで、右と下のワークシートが変化するようにフィルターの設定などを行います。

<フィルターアクションの設定>

 実際にそれぞれのフィルタやマップをクリックし、全てが思ったように動作することを確認したら、メニューから「サーバー」を選び、ワークブックをTableau Publicにパブリッシュします。しばらく待つとダッシュボードがTableau Publicにアップロードされ、誰でも見ることが出来るようになります。

<ワークブックをパブリッシュ>

<パブリッシュ完了画面>

以上で、汎用的に使えるダッシュボード作成と公開の手順は完了です。

○可視化したデータの分析とレポーティング

 単に数字を可視化しただけでは、意味がありません。データを可視化した上で、そのデータを様々な角度から分析し、意味がある「情報」を読み取り、他の人たちに分かりやすく「説明」し、認識を「共有」することが重要です。今回は、当社がある福岡県の移動量データに、天候データ(降水量、気温等)や新型コロナウイルスの感染者数などのデータを組み合わせて可視化を行い、その背景にある人々の行動や思考を推測してみようと思います。

○付加するデータ

 当社は、グループ会社のホームセンターグッデイの売上データ等を分析する際、天候要因も加味した売上増減分析を行っており、クラウド上の社内データベースに気象庁が公開している天候データを日々収集・保管しています。今回は、その天候データを用いて、天候がどの程度人々の行動に影響したのかを分析してみます。

○福岡県の「公園」への移動は増えたのか?

 今回のGoogleのデータでは、場所の分類に「公園」が有りますので、天候がどの程度公園への人手に影響しているのかを可視化してみようと思います。

ダッシュボードで「日付範囲」を「2/15-4/11」に指定すると、公園は+9.1%となっています。緊急事態宣言後の「4/8-4/11」で集計しても、+10.3%となっており、公園への移動量はむしろ増加しているようです。外出自粛が言われる中、ちょっとした息抜きの為に、公園に出かける人が増えているというのは、実際の生活実感にも合致するので、このデータは正しそうです。ちなみに、東京と比較してみると、どうでしょうか?同じ緊急事態宣言後の「4/8-4/11」で見てみると、東京は-4.5%となっており減少しています。福岡に比べると、東京は公園に行く人も減っているようです。下記のグラフで、両都県の比較を見ても、そのことが現れているようです。特に3月29日(日)は、東京で季節外れの雪が降った日ということもあり、公園への移動は約66%減少しています。

 しかし、福岡県が大きく減少している日もあります。3月26-28日や4月1日がマイナスとなっていますが、この日の福岡の天気はどうだったのでしょうか?この点を検証するために、福岡市の降水量データを重ねてみたのが以下のグラフです。オレンジ色が公園への移動量、青色が降水量を示しており、見事に雨が降った日は、公園への移動が減っていることが分かります。

 この雨の日を除くと、福岡県の公園への移動量は、3月20日~4月11日までで約28%程増えていることになり、かなり公園に行く人が増えていると言えそうです。

 尚、政府の専門家委員会の提言においても、公園に行くこと自体は禁止されてはおらず、集団や密接な接触などを避ければ良いと言われています。このような人の動きの傾向が、実際のデータにも明確に現れているということを、ここではお伝えしたいと思います。

○福岡県のリモートワークの状況は?

 新型コロナウイルスの感染を防ぐ為、もう一つ提唱されているのが「リモートワークの推奨」です。カホエンタープライズでは、3月からリモートワーク体制に移行していますが、まだ移行出来てない会社も多いようです。福岡県での職場の活動量はどの程度減ったのでしょうか?

 陽性患者数の増加と、職場への移動量を比較すると、ちょうど反比例するようなグラフになっています。患者数の増加が目立ってきた3月24日頃から職場に行く人が減少しており、緊急事態宣言が発令された4月8日以降は日に日に減少しています。(4月11日時点で-26%)

ただ、東京都と比較したグラフで見ると、東京都が約40%程度減少しているのに対し、福岡は26%と10ポイント程の開きがあります。中小企業や地方はテレワークへの取り組みが遅れているも言われており、より一層のテレワーク体制の推進が必要と思われます。

<職場のグラフ(注:2月24日と3月20日は、休日のズレにより異常値が出ているので除外しています)>

○終わりに

今回、作成したダッシュボードは、Tableau Publicのこちらのアドレス( https://public.tableau.com/profile/.3575/vizhome/MobilityDatainJapan/1#!/vizhome/MobilityDatainJapan/1で公開されています。ご興味ある方は、是非ご覧頂ければ幸いです。