「グラフをつくる前に読む本」棒グラフ(作り方編)を一部先行公開!

松本 健太郎

 

今回は2017年9月23日に出版される「グラフをつくる前に読む本 一瞬で伝わる表現はどのように生まれたのか」の冒頭を特別に公開します。いわゆる試し読みってやつです。

 

 

マメ研所長が本を出すのは知ってるけど、それってどんな本?どんな内容?と気になっている方もおられると思います。

そこで「本文の一部を公開していいか?」と編集者さんに許可を求めたところ、OKを頂くことができました!

今回は第2章「棒グラフ」を試し読みして下さい!

 

棒グラフを使えば「どのデータ項目が大きいか?」がわかる

まずは、以下の棒グラフを見てください。北海道、本州、四国、九州、沖縄それぞれの面積を表す棒グラフです。

 

図1:地方別面積(国土地理院「全国都道府県市区町村別面積調」より作成)

 

棒グラフは、1つのデータ項目につき1つの棒を用意します。

上のグラフでは北海道、本州、四国、九州、沖縄それぞれに1つの棒が描かれています。5つの棒を「比較」して、本州の面積が一番大きく、次いで北海道、九州、四国、最後が沖縄だと把握できたのではないでしょうか。

なぜこのグラフを見ただけで、直感的にそこまで理解できるのでしょうか? 棒グラフの見方を、順番に説明していきます。

 

各データは、地方別面積というデータ項目を持っています。例えば約7.8万というデータは北海道の面積というデータ項目を持っています。

次に、データ項目ごとに、そのデータを棒の高さで表現します。縦軸にその高さがどれくらいの数量を表すかわかるよう、目盛りもあわせて描きます。

 

図2:データとデータ項目からグラフの作成

 

最後に、これが一番大事です。棒グラフは必ず複数のデータ項目を描きます。棒を1つだけ描く棒グラフを目にする機会はまずないでしょう。

棒グラフでは、複数並んだ棒の高さを比べて「棒が大きい(小さい)項目はどれだろう?」と考えます。つまり棒グラフが一 番得意な表現方法はデータの「比較」です。棒グラフを使えば、比べたいデータを最もわかりやすく図で表現できます。

「高さ」を比べて項目の量の違いを感覚的につかめるのが棒グラフの特徴です。だから、本州の面積が一番大きいと直感的に把握できたのです。

続いて、どのように表現すればより比較しやすいのかを解説します。

 

データ項目の並び方を変えるだけでグラフの印象は変わる

棒グラフの奥が深いのは、カスタマイズ性が高い点にあります。

先ほどのグラフでは特に何も考えずに北海道、本州、四国、九州、沖縄の順番に並べました。実は、棒グラフは「データ項目」の並び順に意味を持たせれば、何が言いたいのかより伝わります。

以下の棒グラフを見てください。都道府県別人口をもとに棒グラフを作成しました。47個のデータ項目(都道府県)があるので、47個の棒が描かれています。

 

図3:都道府県別人口(総務省統計局「2015年国勢調査人口集計結果」より作成)

 

このグラフは、人口の多い順に左から右に向けてデータ項目が整列しています。東京都の人口が一番多くて約1300万人、次に大阪人である私にとっては意外でしたが神奈川県約910万人、その後に大阪府が約880万人と続きます。棒の高さもそれにならって東京都がダントツで高く描かれています。

人口の多い順にデータ項目を並べて、棒グラフ全体を俯瞰して棒の高さを比較すると、日本の中でも東京都の人口が突出し過ぎているようにも見えますね。ちなみに、最も人口の少ない鳥取県約57万人と比べると、棒の高さは約23倍です。

このように、データの大きい順番や小さい順番などでデータ項目を並べて見ると、棒の高さに規則性が生まれるので、より比較しやすい棒グラフに仕上がります。

全体の中でも突出しているデータ項目や、途中から傾向が変わっているデータ項目も発見しやすくなります。データ項目の並べ方は、意外と大事なのです。

上のグラフだと、突出しているのは東京都、傾向が変わっているのは静岡県・茨城県だと見てすぐにわかります。このデータが表で提示されるとなると、気付きにくいはずです。

 

ところで、このように比較すると、なぜ私の住む大阪府の人口が神奈川県より少ないのか気になるところです。

真っ先に思い浮かぶのは面積です。

大阪府の面積は都道府県順で46番目、下から数えて2番目です。もう少し面積が広ければその分だけ人が住めて、神奈川県を追い抜けたのではないでしょうか。話は少し脱線しますが、以下のように都道府県別の人口密度(1kmあたり人口)を算出して棒グラフを作成しました。

 

図4:都道府県別人口密度(人口÷面積)(総務省統計局「2015年国勢調査人口集計結果」及び国土地理院「全国都道府県市区町村別面積調」より作成)

 

想像した通り、大阪府が神奈川県を抜いて左から数えて2番目になりました。大阪人としては「大阪府の人口が神奈川県より少ないのは面積が狭いため」と反論させてください。

一方で、神奈川県民からは「西部の丹沢山地や足柄山地など人口が住めない面積も含めた人口密度の算出は不公平だ。大阪なんてほとんど平野で人が住めるところばかりだろう!」という声が聞こえてきそうです。確かに的を射た批判です。

「そこまで言うなら、人が住める場所に限定した人口密度を計算したろうやないか!」と再反論させてください。しかし、そんなデータはあるのでしょうか?

なんと総務省統計局が、人間が居住可能な条件を備えた可住地面積(具体的には総面積から林野面積と湖沼面積を引いた面積)を都道府県別に発表しています。このデータを用いて都道府県別の可住地人口密度(可住値あたり人口)を算出して以下のような棒グラフを作成しました。

 

図5:都道府県別可住地人口密度(人口÷可住地面積)(総務省統計局「2015年国勢調査人口集計結果」「社会生活統計指標」及び国土地理院「全国都道府県市区町村別面積調」より作成)

 

大阪府と神奈川県の差は狭まりましたが、追い抜くまでには至りませんでした。内心、冷や汗をかいていました。

一方で東京都が再びダントツで高く描かれています。東京都は都心である23区を除けば、西側の奥多摩地域や小笠原諸島など「ここが東京なの?」という場所は意外に多いので、そうした面積を除いた結果、高い棒が描かれたようです。

1km×1kmの中に約9500人ですから、縦横10mあたり約1人という計算です。心地よい距離感とは言えませんね。

 

沖縄県の人口密度は意外と高い?「データ項目」の並べ方で気付きを得るには

棒を高い順番に並べる以外にも「データ項目」の並び方に意味を持たせる方法があります。データ量の多い(少ない)順ではなく、データ項目そのものが持っている法則や規則性の順番に並べる方法です。

以下の棒グラフを見てください。図5のデータを使って可住地人口密度の棒グラフを作成しました。

ただし項目の並び方は、JISX0401にて定められている都道府県に割り振られたID順(都道府県コード)です。都道府県コードとは都道府県に付けられた数字で、北海道から始まり沖縄で終わります。北から南へ、東から西へ、各都道府県に順番に数字が割り振られています。

 

図7:都道府県別可住地人口密度(人口÷可住地面積)(総務省統計局「2015年国勢調査人口集計結果」「社会生活統計指標」及び国土地理院「全国都道府県市区町村別面積調」より作成)

 

データは先ほどとまったく同じなのに、データ項目の並び順を変えるだけで見え方がまったく違う棒グラフが完成しました。

 

図6と見比べてください。大きな気付きが2つあります。

1つは東京都、神奈川県、大阪府の人口密度の高さです。図6では北海道、埼玉県、千葉県、愛知県、福岡県も人口が多かったですね。それはこの3都府県に比べて広い土地があるからです。良いか悪いかは別にして、人口が密集しているのはこの3都府県だとわかります。

もう1つは沖縄県の可住地人口密度の高さです。データ自体は図5と同じです。都道府県に割り振られたID順(都道府県コード)に並べれば、近隣他県との比較がしやすくなり、意外と人口が密集している沖縄県の表現に成功しました。

 

棒グラフの一番得意な表現方法は「比較」だと述べました。

しかし、単純に「比較」するといっても、どのようにデータ項目を並べるかで伝わり方は大きく変わります。棒グラフを作成する秘訣は、何を「比較」するためにデータ項目を並べるか、その順番にあると言っても過言ではありません。

 

時系列データにも対応している棒グラフ

…おっと。公開はここまでです!

 

 

へぇ~と感じる点はありましたでしょうか。

「グラフをつくる前に読む本 一瞬で伝わる表現はどのように生まれたのか」では、棒グラフの他に、折れ線グラフ、円グラフ、レーダーチャート、ヒートマップ、散布図、積み上げ棒グラフ、面グラフの8種類を紹介しています。

全てにおいて、もっとも向いている表現方法(棒グラフであれば「比較」)、その具体例をオープンデータで説明しています。

また、今回紹介している画像は、もしかしたら少し文字が小さくて見にくかったかもしれません。書籍版ではちょっとした工夫もなされています。

 

さらにマメ研の人気コンテンツである「統計解析の事例」特別書き下ろしとして「なぜ雑誌は衰退したのか?」を収録しています。

ぜひ手にとって見て頂ければ幸いです!