2012年5月13日日曜日

LIVEonWIRE_JOURNALをリニューアルしました

今年2月29日の深夜にリリースしたLIVEonWIRE_JOURNALのサイト、それ以降あまり手を加えることができなかったのですが、連休中に少し時間がで作れたこともあり、少しリニューアルしました。


リニューアルのポイントは以下3点。

  1. ジャーナリストページのリニューアル
  2. 記事間リンクを設置
  3. ジャーナリストの顔写真の出現頻度の向上

LIVEonWIRE_JOURNALは「ジャーナリストとともに学び、社会に関わるためのニュースメディア」として、読者のみなさまには、記事をお読みいただくだけでなく、その記事を寄稿したジャーナリストのこと、そしてそのジャーナリストの取材テーマのことをもっとよく知ってもらえるようなサイトを目指しており、今回のリニューアルはその第一歩となります。

ジャーナリストページは「1.ジャーナリストページのリニューアル」により、情報はまだまだ足りていませんが、これまでよりは見易く、また、ジャーナリスト個人を応援しやすくなったと(おそらく)思います。

今後、各ジャーナリストが追いかけている取材テーマや、ジャーナリストが主催しているイベント、ジャーナリストが参加しているプロジェクトに関する情報などを追加し、読者が各ジャーナリストのことをもっと良く知ることができるようなページにしていきたいと考えています。

なお、現時点でLIVEonWIRE_JOURNALにご参加いただいているジャーナリストは4名います。LIVEonWIRE_JOURNALにもし気に入った記事がありましたら、その記事を寄稿したジャーナリストをぜひ応援してください!


もしお時間があれば、新設した運営スタッフのページもぜひご一読を:-) デザインも少しリフレッシュしています。

2012年5月1日火曜日

日本人の死因を可視化する【追記あり】

2010年、119万7012人の日本人が亡くなりましたが、その死因について調査した結果が、3月1日、「都道府県別にみた死亡の状況 -平成22年都道府県別年齢調整死亡率-」として厚生労働省(厚労省)より発表されました。前回前々回の記事でこの統計データをGoogle Public Data Explorerに導入しましたが、ここではそれを元に実際に日本人の死因を可視化してみたいと思います。

まず「死因別の死者数」を棒グラフで見てみましょう。

日本人の死因の上位3つは悪性新生物(がん)、心疾患、脳血管疾患の いわゆる三大成人病であることがわかります。 これらの合計は死因全体のおよそ55パーセントを占めています。


三大成人病については「男女別、三大成人病の粗死亡率(そしぼうりつ)の推移」を、折れ線グラフで見ることができます(粗死亡率:人口10万人あたりの死亡者数を表す数値)。これを見ると男女ともに、悪性新生物は右肩上がりに増え続けている一方、脳血管疾患による死者数は1965年をピークに、わずかながら減少傾向となっています。なお、脳血管疾患による死者数が1995年に一時急上昇しているのは、「脳血管疾患」の適用規則が変更になったためのようです。



ここで一旦冒頭の棒グラフにもどり、三大成人病以外の死因についても見てみましょう。三大成人病以外の死因には「肺炎」「老衰」「不慮の事故」「自殺」「腎不全」「肝疾患」「慢性閉塞性肺疾患」「大動脈瘤及び解離」そして「糖尿病」の9つがありますが、棒グラフから各死因のボリュームを把握することができます。


三大成人病以外の9つの死因のうち、ここでは病気以外の「自殺」「不慮の事故」「老衰」について少し詳細に見てみましょう。厚労省の統計データには「男女別、死因別、都道府県別の粗死亡率」も含まれていますので、これをバブルチャートで可視化してみます。

ちなみに、前々回の記事でご紹介した朝日新聞デジタルとMSN産経ニュースの記事で利用されていたのは「男女別、都道府県別の年齢調整死亡率で、これをバブルチャートで可視化すると以下のようになります(年齢調整死亡率:粗死亡率を年齢調整した数値)。縦軸は男性の年齢調整死亡率、横軸は女性の年齢調整死亡率となっています。



男女ともに青森県が突出して高く、東北地方だけで見ても、青森県、岩手県、秋田県の北部3県は比較的高いことがわかります。一方、長野県は男女とも突出して低いですね。ここから、青森県では天寿を全うする人の割合が低く、長野県では天寿を全うする割合が高い、とも言えます。

さて、話を元にもどしましょう。まずは2010年、自殺の粗死亡率を都道府県で比較してみます(病気以外の死因については年齢調整しないほうが実態を把握しやすいと判断しました)。縦軸は男性の自殺の粗死亡率、横軸は女性の自殺の粗死亡率、泡の色は男性の年齢調整死亡率(全死因)、泡の大きさは女性の年齢調整死亡率(全死因)を、それぞれ表します。


秋田県、岩手県で男女ともに高い一方、三重県の男女、福井県の女性、徳島県の男性は低いことがわかります。こうした事実は「どうすれば自殺を減らすことができるのか」を考えるうえで利用できないものでしょうか。

続いて不慮の事故について見てみましょう。縦軸を男性の不慮の事故の粗死亡率に、横軸を女性の不慮の事故の粗死亡率に、それぞれ変えただけとしています。



ここで少し気になったのが、都市部における不慮の事故の粗死亡率が低いことです。沖縄県は人口が少なく、交通量・交通機関も少ないことから低いのは頷けるのですが、なぜ都市部は平均的に低いのでしょうか。「都市部では緊急医療体制が比較的整備されている」という仮説も成り立つかもしれません。

さて、最後に最も平穏な死に方である老衰を見てみましょう。これは高ければ高いほど、長寿を全うした人の数が多い、ということになります。



男女ともに島根県が抜けています。島根県で老衰が多い理由を調べることで、長寿の秘訣が見えてくる…かもしれません。

以上、簡単ではありますが日本人の死因を可視化してみました(このポストに不備があればご指摘ください)。ここで利用したデータ、及びGoogle Public Data Explorerにアップしたデータセットを公開しておきますので、より深い、独自の分析をぜひ試されてみてください。


[追記] 2012/05/02

なぜ沖縄県では老衰が少ないのだろう、という感想をいくつかいただきましたので、追加調査を実施してみました。私が考えた仮説は、沖縄県の死者数がそもそも少ないのではないか、というもの。そこで都道府県別の全死因の粗死亡率(棒の高さ)と年齢調整死亡率(棒の色、色が青に近いほど低く、赤に近いほど高い)を棒グラフで比較してみました。


沖縄県は、年齢調整死亡率は平均的(早死にでもなく長寿でもない)である一方、粗死亡率はかなり低い(死者数が少ない)ことがわかります。つまり、上述したように「沖縄県の死者数はそもそも少ない」ために老衰による死者数も少なかったと解釈できます。

なお、沖縄県では「慢性閉塞性肺疾患」「肝疾患」そして「大動脈瘤及び解離」による死亡率(年齢調整死亡率)がかなり高いようです。



2012年4月30日月曜日

省庁が発表する統計データで何ができるか(データジャーナリズムの実験)【後編】

前回に引き続き、省庁が発表する統計データで何ができるのか考えます。

対象とする統計データは、厚生労働省が1965年以降5年に1度、国税調査にあわせて調査している「都道府県別年齢調整死亡率」(年齢調整された都道府県別・死因別の死亡率)で、今回はこれをGoogleが提供するデータ分析サービス「Google Public Data Explorer」を使って分析してみます。Google Public Data Explorerについては過去のポストをご参照ください。


Google Public Data Explorerは、「用意されているデータを使った分析」とは別に、「自分で用意したデータの分析」にも利用できます。「都道府県別年齢調整死亡率」のデータは厚生労働省のウェブサイトで公開されていますので、今回はこれをGoogle Public Data Explorerに適用したうえで分析することを考えます。分析までのステップは以下の通りとなります。

  • ステップ1:統計データを取得する
  • ステップ2:統計データをGoogle Public Data Explorer形式に整形する
  • ステップ3:統計データをGoogle Public Data Explorerに適用する
  • ステップ4:統計データをGoogle Public Data Explorerで分析する

厚生労働省も含め、各省庁が実施している調査の結果は、調査レポートとセットで生データが公開されています。今回の分析対象となるデータ「都道府県別年齢調整死亡率」も厚生労働省のサイトにExcel形式で公開されているので、これをダウンロードすればステップ1は完了です。


続いてステップ2。実はここで時間がかかり、前回ポストから間が空いてしまいました。Google Public Data Explorerに独自データを導入するには、これをDSPLという専用フォーマット(DSPLファイルとCSVファイル群)に整形する必要があります。仕様の把握はさほど難しくはないのですが、どのような分析をするかによって整形方針が異なり、始めのうちは多少施行錯誤することになると思います。


DSPLへの整形方法については、後日別の形式でまとめてみたいと思いますが、参考までに今回整形したデータを公開しておきます。過去データ(2010年より前のデータ)と直近データ(2010年のデータ)とでは、項目と値の範囲に大きな差異があるため、2種類のデータセットとして登録しました。


ステップ3は、ステップ2で作成したDSPLファイルとCSVデータ群を格納したディレクトリをZIP形式で圧縮し、Google Public Data Explorerにアップロードすれば完了です。アップロード時に共有範囲の設定ができますので、ここを「パブリック」としておけばブログなどに張り付けて不特定多数の人に見てもらえるようになります。なお、アップロードは、Googleアカウントにログインした状態で以下のページより行えます。


無事にアップロードされ、実際にGoogle Public Data Explorerで使える状態になると結構感動します。そしてデータが視覚化されることで、実に多くの事が見えてきます(ステップ4)。例えばこれ。



各県の自殺による年齢調整死亡率をバブルチャートで表したものですが、三重県は男女ともに低く、福井県は女性、徳島県は男性が、それぞれ突出して低い一方、岩手県、秋田県、青森県は男女ともに高いことがわかります。

ここで自殺を不慮の事故に変えると、今度は違った景色が見えてきます。



不慮の事故による死亡率は、東京や京都では男女ともに低く、高知県や石川県では高いことがわかります。

最も幸せな死に方、老衰も見てみましょう。



こうしたデータをもとにして可視化された「事実」は一体何を表しているのでしょうか(右上で隠れている県は三重県です)。さらに調査・分析を進めるきっかけとしては面白い素材になるのではないでしょうか。前編でご紹介した記事がとても薄っぺらく見えてくるかもしれません。

最後に、男女の死因を比較しておきます。





男性、女性とも、がんによる死亡が圧倒的に多いですね。

今回私がアップロードしたデータは以下のページよりご利用いただけます。


存分に分析されてみてください。不明な点などあればコメントください。