2012年4月9日月曜日

Googleを使って社会を読み解く(予習1:Google Public Data Explorer)

私も運営に参加している日本ジャーナリスト教育センター(JCEJ)では、4月14日にデータジャーナリズムを実践するワークショップを開催します。ここではその予習として、ワークショップで利用するデータ分析ツール「Google Public Data  Explorer」で何ができるのか、少しまとめておきます(「Google Trends」については次回)。ワークショップの開催概要はJCEJのブログをご参照ください。

萩原雅之さんを講師に「データジャーナリズム実践:Googleを使って社会を読み解く」を行います | JCEJブログ 
ソーシャルメディアの浸透や、政府によるネットを利用した情報発信の普及、ウィキリークスの出現などにより、ネット上のデータを収集/分析/可視化/発信するための手段として「データジャーナリズム」が注目される一方、マーケティングリサーチ業界では古くから「ネット上のデータを収集/分析/可視化/発信」を実践してきていました。 
ワークショップでは、マーケティングリサーチャーの萩原雅之さんを講師にお迎えし、マーケティングリサーチ業界で長年に渡って蓄積されてきたデータを扱うためのノウハウをデータジャーナリズムに実践的に活かすことを試みます。 
具体的には、世界中の政府、民間の公開データが収録され、項目を選ぶだけでグラフ化され、貧困、健康、経済、格差、戦争などの社会問題をわかりやすく伝える目的で使われる「Google Public Data  Explorer」と検索語のデータを、クエリ、時期、エリアなどで自由にグラフ化できる「Google Trends」の使い方の説明を受け、検証したいテーマを設定し、実際にデータを選択、収集、分析、解釈し、記事のアウトラインを作成します。

Google Public Data ExplorerはGoogleが提供するWebブラウザで利用可能な公開データの分析ツールで、国連機関や米国政府などがネット上に公開している様々な指標データを、折れ線グラフや棒グラフで視覚化し、ウェブページやブログなどに組み込むことができます。


例えばPIIGS(ポルトガル、イタリア、アイルランド、ギリシャ、スペイン)とドイツの国内総生産に対する一般政府債務の割合をグラフ化するとこんな感じです。ギリシャが格別なことがわかります。



Google Public Data Explorerには英語版のほかに日本語版やフランス語版などもあり、言語別に利用可能なデータの種類が異なります。2012年4月9日現在、日本語で利用できるデータが5種類に対し、英語で利用できるデータは64種類と、英語版のほうが圧倒的にデータの種類が多いため、日本語版に利用できるデータが無い場合は英語版で探してみても良いかもしれません。

なお、日本語版では、世界銀行が発表する「世界開発指標」、およびユーロスタット(欧州委員会において統計を担当する部局)が発表する「ヨーロッパの失業データ」「ヨーロッパの最低賃金」「ヨーロッパのブロードバンド普及データ」「ヨーロッパの政府負債」が公開されています。

世界銀行の「世界開発指標」には、国別の「人口」「出生率」「国内総生産」などの一般的な指標から、「5歳未満児の死亡率」「1人あたりのCO2排出量」「1人あたりの電力消費量」などニュースを読むときに参考となるような指標まで幅広く含まれています。


一方、英語版では、日本語版で公開されているデータに加え、国連開発計画(UNDP)が発表する「人間開発指数(Human Development Indicators)」、IMFが発表する「世界経済見通し(World Economic Outlook)」、世界経済フォーラムが発表する「各国の競争力をまとめたレポート(Global Competitiveness Report)」などのほか、米国政府やEUが発表するデータが公開されています。オープンガバメントを進めている米国政府のデータが充実しているのは流石です。誠に残念ながら日本政府が発表するデータはありません。


ワークショップ当日はここで紹介したGoogle Public Data Explorerか次回紹介するGoogle Trendsを使い、以下のような手順でデータジャーナリズムを実践します。

  1. ニュースなどをもとに記事のテーマを設定する(仮説を立てる)
  2. Google Public Data ExplorerもしくはGoogle Trendsでデータを分析する
  3. データ分析結果をもとに記事のアウトラインを作成する

このうち「ニュースなどをもとに記事のテーマを設定する(仮説を立てる)」が実は結構大変だと思いますので、貧困、健康、経済、格差、戦争など、自分が調べてみたいテーマを事前に考えておくことをお勧めします。また、Google Public Data Explorerで公開されている各データについて、当日の講義でも説明はあると思いますが、結構充実していますので、事前に確認しておくと良いかもしれません。

Google Public Data Explorerについては以下の記事も参照してみてください。


次回はGoogle Trendsについてまとめてみます。Googleはすごいですね。