Excelで始めるデータ分析 ~第5回 ポアソン分布でマーケティングを博打にしない~

 

【文責】 松本 健太郎
アドエビス開発ユニット所属 マーケティングメトリックス研究所 主任研究員

最近の趣味は、漫画喫茶で何時間もマンガを読み耽ることです。ちょっとした自慢は、二晩で島耕作の課長から会長までの人生を一気通貫で読んだことです。

小さい頃からマガジン派だったので、最初は「神様の言うとおり」「サイコメトラー」「進撃の巨人」「アルスラーン戦記」「金田一少年の事件簿」を読んでいました。

最近はジャンプ系に手を伸ばし始めています。「友情」「努力」「勝利」。基本コンセプトがしっかりしているので読んでいて飽きません。

「暗殺教室」のような突拍子もない設定であっても、コンセプトが明確ならば応用は可能という証明がされたことは記憶に新しいですね。

圧倒的に不利な状況で、全員がもうダメだと諦めていても、主人公だけは「まだまだ解らない、チャンスはある」と前を向きます。

その姿に私は感化され、時に涙を流すこともあります。マンガは常に勇気と希望を与えてくれます。

ただし、それに感化され過ぎて、絶望的に不利な状況で、四方八方手を尽くして何もやりようが無いとき、いきなり「まだまだ解らない、とにかく頑張ろうぜ」と根性論をぶつ人は、ちょっと苦手です。

大学生の頃、文化祭にポップコーンを出店したのですが、残暑厳しい夏空の下で水分を必要とする食べ物を誰が好き好んで買うのか、というマーケティング思想が抜け落ちていたため、目眩を起こすような在庫を抱えてしまいました。

どうやって売るか。水分とセットで販売する?でも今更水を買えばさらに赤字膨らむぞ。2個セットなら安くする?値段は問題じゃないだろ。メンバー間で険悪な空気が流れたとき、飛び出したのが前述した根性論だったのです。

結局、顧客層を10代後半女子と40代オバサマに「集中」して、「ポップコーンを食べること」に対価が発生するのではなく、「ジャニーズ系とEXILEのようなイカツイ系の二枚看板が食べ物を食べさせてくれる経験」に対価を発生させることで 300円を安いと思わせることにして、何とか赤字だけは防ぎました。

悔やまれるのは、出足の伸びが悪いと解っていながら、「まだまだ解らないよ」という声に賛同してしまったことです。

始まってあまり時間は経っていない。まだ入場者も多くない。そんな「甘い囁き」に私は負けてしまいました。

でも、もし早い決断が下せていたら。ホストやん!という男子からのバッシングも浴びず、翌年出店禁止というペナルティが課されることも無かったはずです。

では、そんなことが簡単にできるのでしょうか。できるんです。そう、ポアソン分布ならね。

「ポアソン分布」とは何か?

簡単に言うと、ポアソン分布とは「ある期間に平均してλ回起こる現象が、ある期間にちょうどκ回起きる確率の分布」です。数学者であるシメオン・ドニ・ポアソンが1838年に確率論と共に発表したのが始まりです。

 

最初にポアソン分布が実用されたのは、統計学者であるボルトキーヴィッチによってでした。

彼はプロイセン陸軍の騎兵連隊のべ200部隊で、1875年から1894年の間に「馬に蹴られた死亡した兵士の数」を調べました。

彼はこの事象の平均値がλ=0.61(人)であることを確認すると、発生する確率がポアソン分布に近似していることを発見し、さらにこの先にどれぐらいの確率で馬に蹴られて兵士が死亡するか予測してみせたのでした。

 

全く偶然に起きている(ように見える)目の前の事象が、実は数学的に「発生する確率」を表現できるとしたら、とても凄いことだと思いませんか?

ポップコーン販売の事例に当て嵌めてみましょう。

ポップコーンは最初の10分で3個しか売れませんでした。ですが、本来は1時間で60個売れる算段を立てて在庫を調達していたのです。つまり、10分で10個です。

このペースが今後も続きそうだと仮定した場合、次の10分で10個売れる確率はどれくらいあるでしょう?

本来であれば小難しい計算式を用いるべきでしょうが、エクセルのPOISSON関数で直ぐに出せます。第1引数にはkを、第2引数にはλを挿入します。第3引数は累積で算出するか否かを意味しますので、今回は0を挿入します。

今回の場合、第1引数には「0,1,2,3…nの整数」(想定販売個数)、第2引数には「3」(平均販売個数)、第3引数には「0」を代入します。

その結果は、以下の通りです。図の右端に、出力結果はエクセルでどのように表現するかを付け足しています。

 

ポップコーンが売れる個数が0個の確率は約5%、1個の確率は約15%、2個の確率は約22%…なんと、10個も売れる確率は約0.1%です。つまりポップコーンを販売している1000個のパラレルワールドがあったとして、そのうち1つの世界でしか成功しないのです。

この結果をもとに、メンバーに共有していたら「何とかなる」という甘い声も遮って、直ぐに方針転換を図れたでしょう。

ポアソン分布の前提

ポアソン分布が現れる例は「ある交差点で1時間に起こる事故の件数」「1ページの文章を入力する時に打ち間違いを起こす回数」「馬に蹴られて死亡する回数」など、発生する確率が低く、かつそれが偶然に発生する事象が対象になります。

このことから、「少数の法則」とも呼ばれます。

またポアソン分布は、過去の結果を元に、それが未来で起こる確率を求める計算式ですから、定常性(事象の起こる確率)と独立性(未来で起こる確率は、それ以前に起きた事象の回数や起こり方に無関係)が担保される必要があります。

過去の影響を受けない未来など考えられませんが、事象そのものが起こる確率は常にランダムでありながらある期間において一定であるほど、ポアソン分布は有効だと考えられています。

ポップコーンの例で言うと、販売の努力の成果からポップコーンを購入する気持ちが変わってしまうと、定常性や独立性が担保されているとは言えません。

したがってWEBマーケティングに活用するとしても、アトリビューションが大人気の昨今としては、なかなか独立性が担保し辛いところです。

しかし、ダイレクトレスポンス系のマーケティングにおける「予測」としては十分に通用するのではないでしょうか?或いはマーケティングを始めた初日、翌日のCV数を予測するのに活用できるのではないでしょうか?

CV数を予測する

例えばA社のキャンペーンが、X日10時から始まったとします。A社がWEBでキャンペーンをするのは初めて、全てが手探りの状態だとしましょう。

それから7時間で獲得した購入完了CVは10件でした。良いかどうか解りませんが、1時間で1件も購入完了CVが無いこともあり、担当者としては生きた心地がしません。

上司からは「大丈夫なの?」とせっつかれる始末です。

ここで知りたいのは、次の1時間でCVが1件も無い確率はどれくらいか?ということです。ポアソン分布が活用できます。

今回の場合、第1引数には「0,1,2,3…nの自然数」(想定CV獲得件数)、第2引数には1時間当たりのCV獲得件数の平均を出すので「10/7」(1時間あたりのCV獲得件数)、第3引数には「0」を代入します。

 

さて、その結果ですが約24%となりました。イチローの打率よりは低いですが、起こることを前提にして準備した方が良さそうです。逆に約76%の確率でCV獲得件数1件以上だから問題無し、と割り切る考え方もあるでしょう。

ちなみに、購入完了CVが10件のみという条件しか話していませんでしたが、事象の試行数n回に対して事象が発生する確率Pが解っている場合は、二項分布を使うべきです。

 

今回の事例で言えば、広告がクリックされた回数(サイトに流入してきたユーザー数)に対してCVRがおおよそこのくらいと解っている場合と言えます。

例えば、A社のキャンペーンの初日の結果が1000件のクリック数に対して購入完了CVが10件、CVRが1%だったとします。

翌日も引き続きCVRが1%だと仮定する場合、翌日の想定CV獲得件数はどのくらいだと予想できるでしょう?

本来であれば小難しい計算式を用いるべきでしょうが、エクセルのBINOMDIST関数で直ぐに出せます。

第1引数には「0からnまでの整数(今回の事例で言えば想定CV獲得件数)」を、第2引数には「試行回数(翌日の想定クリック数)」を、第3引数には「ある事象の起こる確率(CV/クリック数)」を挿入します。第4引数は累積で算出するか否かを意味しますので、今回は0を挿入します。

その結果は、以下の通りです。

 

7件から12件の間で、全体の3分の2を占める結果となりました。そして、6件以下が6分の1の確率、13件以上も6分の1の確率になります。皆さんなら、この結果を踏まえて、どのようなアクションを起こされるでしょうか

もし、CV獲得件数を15件以上は目指したいと考えるなら、第2引数の「翌日の想定クリック数」を変えるしかありません。クリック数を1.5倍にしてみましょう。ただし、CVRは1%のままという前提です。

 

15件未満の確率は約46%になりました。半々ですね。皆さんなら、この結果を踏まえて、どのようなアクションを起こされるでしょうか?

ちなみにクリック数を増やした分、出費は増えてしまいますから、何とかCPCを下げる施策をセットで考えなければなりません。

まとめ

今回紹介させて頂いた分析手法。あくまで、これは確率です。1%の奇跡も、100回やれば恐らくは起こる事象の1つでしかありません。

しかし、できる限り高い確率が起こる選択肢を成功に導くのがプロジェクトなら、Aが起こる確率がどれくらいかは知ったうえで、選択したいものです。それが、「とにかくやってみよう」「とにかく頑張ろう」という掛け声に勝ち、マーケティングを博打にさせない手法の1つではないかと当研究所は考えます。

もちろん今回のポアソン分布と、最後に少しだけ紹介させて頂いた二項分布は、様々な前提の上に成り立ちます。事前に「今回は適用できる状況か?」を確認だけして頂ければと思います。

【参考文献】

Excelで学ぶ統計解析入門 著:菅民郎

やさしくわかる数学のはなし77 著:岡部恒治

マーケティングメトリックス研究所では、共同研究や寄稿記事を募集中です。
ご興味のある方は、是非、お問い合わせください。

Written by