Excelで・・・分析教室

Excelで始めるデータ分析 
 ~第2回 クロス集計を解釈する最も簡単な方法~

2010年6月8日 火曜日
このエントリーをはてなブックマークに追加

前回の記事では、引き算とソートを使った”比較”と”データの読み方”のお話をしましたが、
比較するものが男vs女の2者だったので単純に引き算とソートで済みました。
今回は、年代毎(4グループ)に成績の良かった広告を、クロス集計と差分を使って
分析してみます。

さて、3つ以上の場合の比較で、最も簡単な方法は、”全体”と比較させる方法です。
さっそくやってみましょう。

下表は各広告からの売上(ROAS)をクロス集計(Excelのピボット集計)で年代別の
平均を集計したものです。2列目には全体平均を表示しています。

各年代毎に、単純にソートをかけるだけでも、ある程度の傾向がつかめるとは思いますが、
もともとの広告出稿量などに差がある場合などは、”差分”などの処理をすることで
よりわかりやすいデータに変換することができます。

まずは、各年代と全体平均の差を計算する列をそれぞれに追加(赤字)します。

「差_20代」の列は、20代の数値と全体平均との差、「差_30代」は30代の数値と
全体平均との差を引き算で求めているだけです。
差の列は、書式設定で、+、-を表示させるとわかりやすいでしょう。

次に、年代毎に区切り、見出しとしての広告名の列を追加(赤字)し、

各年代ごとに、「差」の列で降順ソートします。

これで、各年代に反応の良い広告が高い順に並んでいることになります。
せっかくなのでもうちょっとわかりやすくするために、グラフにしましょう。

バーが右に伸びているほど、その年代に特徴的に効果があったもので、左に伸びている
ほど、効果がマイナスだったものと、一目でわかるグラフができました。

ターゲットが30代ならば、「広告2,9は外せない。広告1,19,10,18,15は必要に応じて
使おう」なんてことがここからわかるわけです。

また他にも、ここから読み取れることとしては


・20代は広告4が突出して効果をあげている。
・30代に効果の高い、広告2,9は20代ではワースト1,2になっている。
・50代ではトップ3(広告1,6,20)が拮抗している

などです。あとは商材の特性と表現素材などから、なぜそうなったのか、次に何を
すべきか
を考えてみましょう。

ところで、前回も今回も「差分」、つまり引き算で比較をしました。比較の方法としては
「比」、つまり割り算が使いやすい場合もあります。

元の数字が小さい数字の場合は、”比”の方が数字が大きく振れやすいです。
例えば、1と4という数字があった場合、
差だと、+3
比だと、+300%

逆に元の数字が大きいと、”比”の値は小さくなりがちです。
10001と10004の場合、
差だと、+3
比だと、+0.03%

今回の例の20代の場合。

差と比は全体傾向は変わらないものの、広告6,19,15が”比”と”差”とにずれがあるのが
わかります。

比も差もどちらが正解ということでもないので、両方やってみて感覚的に近い方を採用
すればよいと思います。

全くモノサシが違うものを比較できるようにする”標準化”という統計手法もあります。
“偏差値”と言った方が聞き慣れているでしょうか。
この方法についてはまた次の機会にお話しいたします。

前回・今回でクロス集計の後の処理と数字の読み方をみてきました。
クロス集計は分析の基本である”分ける”ことのもっとも代表的なやり方です。
分析初心者の方にとっては、クロス集計(ピボット集計)もそれなりのハードルがあるとは
思いますが、その先どう扱って、どんな分析ができるかを知ることで、クロス集計する
ことも苦ではなくなるのではないかと思います。

是非、周りの数字をいろいろ分けてみてください。いつもとは違ったものが見えてくると
思います。

Excelで始めるデータ分析 ~第1回 引き算とソート~

2010年5月12日 水曜日
このエントリーをはてなブックマークに追加

データ分析というと、
“難しい”、“専門化がやること”といった印象がありますが、
Excelの基本的な機能が使える方ならば、結構いろいろなことができるものです。

このシリーズでは、
データ分析を始めたいけど、どこから始めればいいかわからないという方を対象として、
「これなら使えそうだし、すぐできそう」といった、
データ分析のきっかけになるようなことをご提供していきたいと思います。

第1回目は、引き算とソートです。

今回の材料は、広告代理店に勤めるYさんから相談を受けた、
以下のデータです(一部のみ)。

某通販サイトの会員獲得のキャンペーンを広告効果測定ツールで計測したもので、
同じ費用で出稿した広告A~Iで会員獲得に成功した人数を男女別で示したものです。

これだけの量ならば、獲得数が多いもの、少ないもの、
男性を多く獲得したものなどを見ることもできますが、
わかりやすくするためにグラフにしてみましょう。

そのままグラフにしてしまうと、上記グラフ1のようになります。

数字が棒の高さにはなりましたが、これでは数字のままと大してかわりません。
Yさんは広告主様に「グラフにして!」と言われて、とりあえずここまではやってみたようです。

みなさんも、これで終わりにしちゃってはいませんか?
このままでは、「結果はこうです」を言っているだけであって、
次につながる洞察を得られることは少ないと思います。

もう少し工夫してみましょう。

データ表に“差分(男-女)”という列を加えました。
このセルには 「=獲得(男性)-獲得(女性)」の計算式を入れただけです。

つまり+の数字が大きいほど、より男性の獲得数が多く、
-が大きいほど女性の獲得数が多いということになります。

これをまたグラフにしてみましょう。

差分の折れ線はExcelグラフの機能「第2軸」を使っています。
(右側が第2軸。ご存じない方は「excel グラフ 第2軸」などでググってみてください)

このようにすると、獲得量の絶対値と男女差(折れ線が高いほど男性、低いほど女性)が
見えてくるようになりました。

これを見たYさんは、
「広告Iは、量は取れたが女性向きです。
男性にはC,D,Eの○○のような表現が効いたので、次の広告は・・・・」
といった提案をしたいと感じたようです。

ただし、情報量が増えた分、図が煩雑になってしまいました。
これでは説得性に欠けます。

さらに分かりやすくするために、差分の高い順に広告を並び替えてみましょう。

そしてグラフに

すると、左ほどより男性を獲得した広告、右ほどより女性を獲得した広告、
そして棒が高いほど獲得量が多いと、直観的にわかるグラフが完成です。

これをもとにYさんと広告クリエイティブや出稿媒体などと突き合わせてみることで、
男性(女性)に受けが良かった理由がはっきりと見つけることができました。

また、ソートする前では気づかなかった、男女の差が小さい広告G,Hは
獲得数も小さいという事象も発見できました(「万人にうけるものには誰も見向きしない」の実例)。

確かに、「お得感」は訴えてはいたものの、
“誰に”の視点が欠けた表現で、それでは効果がないことが実証されました。

以上のように、引き算+ソート+適正なグラフによって、
数字をシンプルに、直観的にすることができました。

そうです、そもそもグラフとは数字を直観的にわかるようにするためのものなのに、
グラフ1も2も「何を言いたいか、いまいちわからない」、
「ただグラフにしてみました」なグラフなのです。
ちょっとした工夫で一歩進んだ分析ができることがおわかりなったかと思います。

Yさんはその後この分析から、「効果が高かった理由」、「イマイチだった理由」を明確にし、
広告主様やクリエイティブチームと共有しました。

そして、次のキャンペーンでは広告表現を見直すことで、効果が上がり、
広告主様にお褒めの言葉をいただいたとのことでした。

今回は、引き算で比較し、ソートすることで意味をわかりやすくしました。
次回は「比較」について、なぜ比較?、他の比較方法は?について、お話しさせていただきます。

ご意見、ご感想等は contact@mm-lab.jp までいただければ幸いです。