難しい計算は不要!クロス集計でデータを簡単に比較する

前回の記事では、引き算とソートを使った”比較”と”データの読み方”のお話をしましたが、
比較するものが男vs女の2者だったので単純に引き算とソートで済みました。
今回は、年代毎(4グループ)に成績の良かった広告を、クロス集計と差分を使って
分析してみます。

さて、3つ以上の場合の比較で、最も簡単な方法は、”全体”と比較させる方法です。
さっそくやってみましょう。

下表は各広告からの売上(ROAS)をクロス集計(Excelのピボット集計)で年代別の
平均を集計したものです。2列目には全体平均を表示しています。

各年代毎に、単純にソートをかけるだけでも、ある程度の傾向がつかめるとは思いますが、
もともとの広告出稿量などに差がある場合などは、”差分”などの処理をすることで
よりわかりやすいデータに変換することができます。

まずは、各年代と全体平均の差を計算する列をそれぞれに追加(赤字)します。

「差_20代」の列は、20代の数値と全体平均との差、「差_30代」は30代の数値と
全体平均との差を引き算で求めているだけです。
差の列は、書式設定で、+、-を表示させるとわかりやすいでしょう。

次に、年代毎に区切り、見出しとしての広告名の列を追加(赤字)し、

各年代ごとに、「差」の列で降順ソートします。

これで、各年代に反応の良い広告が高い順に並んでいることになります。
せっかくなのでもうちょっとわかりやすくするために、グラフにしましょう。

バーが右に伸びているほど、その年代に特徴的に効果があったもので、左に伸びている
ほど、効果がマイナスだったものと、一目でわかるグラフができました。

ターゲットが30代ならば、「広告2,9は外せない。広告1,19,10,18,15は必要に応じて
使おう」なんてことがここからわかるわけです。

また他にも、ここから読み取れることとしては


・20代は広告4が突出して効果をあげている。
・30代に効果の高い、広告2,9は20代ではワースト1,2になっている。
・50代ではトップ3(広告1,6,20)が拮抗している

などです。あとは商材の特性と表現素材などから、なぜそうなったのか、次に何を
すべきか
を考えてみましょう。

ところで、前回も今回も「差分」、つまり引き算で比較をしました。比較の方法としては
「比」、つまり割り算が使いやすい場合もあります。

元の数字が小さい数字の場合は、”比”の方が数字が大きく振れやすいです。
例えば、1と4という数字があった場合、
差だと、+3
比だと、+300%

逆に元の数字が大きいと、”比”の値は小さくなりがちです。
10001と10004の場合、
差だと、+3
比だと、+0.03%

今回の例の20代の場合。

差と比は全体傾向は変わらないものの、広告6,19,15が”比”と”差”とにずれがあるのが
わかります。

比も差もどちらが正解ということでもないので、両方やってみて感覚的に近い方を採用
すればよいと思います。

全くモノサシが違うものを比較できるようにする”標準化”という統計手法もあります。
“偏差値”と言った方が聞き慣れているでしょうか。
この方法についてはまた次の機会にお話しいたします。

前回・今回でクロス集計の後の処理と数字の読み方をみてきました。
クロス集計は分析の基本である”分ける”ことのもっとも代表的なやり方です。
分析初心者の方にとっては、クロス集計(ピボット集計)もそれなりのハードルがあるとは
思いますが、その先どう扱って、どんな分析ができるかを知ることで、クロス集計する
ことも苦ではなくなるのではないかと思います。

是非、周りの数字をいろいろ分けてみてください。いつもとは違ったものが見えてくると
思います。