結果の積み重ねで信頼を勝ち取る!~サイバーエージェント 岡川宏之様〜


株式会社サイバーエージェント ディスプレイ戦略局 チーフデータアナリスト 岡川宏之 様
2008年名古屋大学大学院理学研究科素粒子宇宙物理学専攻後期博士課程修了。博士(物理学)専攻:素粒子物理学・超弦理論。総合電機メーカーにて半導体フラッシュメモリの研究開発に従事した後、2011年より株式会社サイバーエージェントに勤務。SEMコンサルタント、DMP開発などを担当した後、現在はディスプレイ戦略局にてDMP及びアトリビューション分析などデータ分析全般を担当。

ホーキングとスーパーストリング理論

[豊澤] 早速ですが、ご経歴についてお伺いいたします。

[岡川]はい。学部は慶應大学理工学部で理論物理を専攻していました。なぜこのような進路に決めたかと申しますと、元々、数学が好きで、数学科にも合格していたのですが、当時ホーキングの宇宙論※という本に出会ったことがきっかけでした。

[豊澤] もの凄く売れた本ですよね。私も買いました。よくわっかんないけどカッコいいなぁと思いました。

[岡川] そうですね。その本の中で、一般相対性理論、ブラックホールや大統一理論など、このような分野があるということがわかり、勉強してみたくなり数学科ではなく、物理学科を選択しました。
ただ、当時、慶應大学は理論物理の中でも物性物理がメインで、一般相対性理論やブラックホール、統一理論、いまで言うところの素粒子理論を研究するチャンスはなく、量子ドットと言われる研究をしていました。

電子という電気の粒があるのですが、この電子一つ二つを制御できるのか?また、一つから二つになった時にどういった挙動を示すのかといったことを理論的に解析していました。
その後、名古屋大学に修士課程から移り、素粒子物理を研究していました。

[豊澤]名古屋大学で博士号を取得されたのですね。

[岡川] はい。主な研究は超弦理論(スーパーストリング理論)で、これらを束ねる11次元時空上のM理論などを研究していました。
ブラックホールのエントロピーは、超弦理論に含まれるDブレーンという膜状の物体から理解できますし、M理論は量子重力を含む大統一理論の候補です。

名古屋大学では、高校生のころに思い描いていた研究ができていました。しかし、研究者になることに憧れていたのですが、自分よりも確実に賢いのにも関わらず、10年経っても研究者としての定職を得られない人が山ほどいる現実を目の当たりにし、社会に活躍の場を求めました。

フラッシュメモリ

[豊澤] いくつか岡川さんに関するWebサイトを拝見したのですが、フラッシュメモリの研究に取り組んでいらっしゃったのですね。
社会に出る選択肢をされた際にその会社を選ばれた理由などを教えて下さい。

[岡川]当時は、社会で自分の経歴がどう活かせるのか、よくわかっていませんでした。
博士号を取得した後は、学校推薦で内定を頂いた総合電機メーカーの工場で2年間働いていました。

会社の方針で、新卒は必ず工場などの現場に2年間配属され、研修を行うことになっており、研究者としてではなく、LPCVD(減圧化学蒸着)の開発エンジニアとして勤務していました。

[豊澤] 少し具体的に教えて下さい。また、データ分析的なことも行っていたのでしょうか。

[岡川]半導体は膜を多層に重ねて作っていくものなのですが、その膜圧をしっかり調整するようなプロセスを開発していました。
工場はデータが豊富に存在している環境ではあったのですが、それらのデータを日々の業務に活かしきれていませんでした。

何故かというと、実験が王道なんですよね。理論的に導かれた帰結に基づいて判断するのではなく、いくつか試行を重ねて得られた結論から選択していくという、ステップバイステップのプロセスが支配的でした。
例えば、半導体の製造過程において、圧力を100Paにするのか150Paにするのか、どちらか好ましいのかということについて、理論的に解を求めることは非常に困難です。

[豊澤]それは膜を作るときのお話でしょうか。

[岡川]そうですね。圧力をかければかけるほど膜は堆積します。この辺りは流体力学の話になるので、理論的に解を導くよりは、実験を行って最適な値をみつけていく事が、正しい方法だと思います。

[豊澤]トライアンドエラーを繰り返すということですね。

[岡川]そうです。ただ、実験計画法やコンジョイント分析を使うことは使っていたのですが、非常に少数派で、経験が物を言うような工場文化の中では分が悪かったです。
成果という観点では、10年近く課題となっていた問題をアナリティクスで解決しました。
半導体は構造をいかに微細化できるかが大事なポイントです。すると、凹凸がありまくる構造ができます。

例えば、20ナノの幅で、高さが400ナノの溝ができている、つまり、20cm間隔で、4mの凹凸がそそり立つような構造になります。
このような構造物に対して、均一にガスを吹き付けて表面を一定の厚さの膜で覆うには、高額な装置と高度な技術が必要です。

この時、同時に考えるべき変数は、温度、ガスの圧力や流量など様々です。
一回の実験でも、数百から数千万単位のコストがかかってしまうことから、サンプルを集めることもままならず、長い間大きな問題となっていました。最終的に、非線形構造を持つ積分モデルを構築することで解決することができましたが、経験が重視される文化の中では、こういった思考方法を根付かせることは非常に困難でした。

[豊澤]大阪ガスの河本さんの言うところの「勘と経験と度胸」ですね。そこでの経験を踏まえて転職にあたって考えられたポイントはどういった点でしょうか。

[岡川]分析の結果と施策が直結している分野ということで、ネット業界を選択しました。先ほどの実験計画法などはLP検証に使えますし、回帰分析は予算シミュレーションに使えそうだな、といった肌感覚は外の業界から見ていても想定ができました。
また、データが豊富であるということは、言うまでもないでしょう。偶然にも、求人があったので応募し、採用に致りました。

[豊澤]サイバーエージェントに移られてからはどのような仕事に取り組まれたのでしょうか?

[岡川]2011年2月に転職し、リスティング広告を扱うSEMコンサルタントとなりました。
分析力を活かすということで、キーワード入札ルールの開発なども手掛け、その後は、DMP開発と(広告の買い付けを行う)メディア系部署と協業する担当や、DSPの運用経験を積んできました。

また、SEM担当に異動し、分析の観点からクリエイティブ検証や入札の方法論について取り組みました。

[豊澤]SEMについては、まだまだデータ活用の視点から取り組める余地があるということですね。

[岡川]そうですね。SEMに関しては、クリエイティブ検証や入札など、基本的な部分がまだまだ未整備であると感じています。

[豊澤] 今はどのような業務をおこなっていますか。

[岡川]ディスプレイ戦略局で、引き続きDMP関連の業務やデータ分析一般についての業務を行っています。
今では様々な部署からも声がかかるようになり、例えば、アトリビューション分析やクリエイティブ検証、過去にはゲームのアルゴリズム開発まで行いました。

分析が必要とされる場合は営業にも同行し、ヒアリングも行っています。株式会社ロックオンさんともWeb広告と、TVCMやチラシなどを含めた広告効果に関する取り組みをやりましたね。

[豊澤]はい。ありがとうございます(笑)

[豊澤]昨今のビッグデータブームの印象について伺えますでしょうか。

[岡川] 広告主の方々もビッグデータブームで何か革新的な事ができるのではないかと、過剰な期待を抱いているケースもままあります。
ですが、まずは身近にあるスモールデータの活用をやるべきだと考えています。

データサイエンティストという肩書についても、定義が曖昧なまま、言葉だけが広まってしまっているようで、例えば、回帰分析など基本的な手法すら身に付けていない方が、データサイエンティストとして、人材紹介会社から応募されてきたこともありました。

会社として、データサイエンティストのスキルセットを学術的な方面からも持っておくべきではないかと考えています。

[豊澤]データサイエンティスト協会の設立などの動きもありますね。

[岡川]素粒子物理をやっていた私にとって、機械学習の分野は新しい学びでした。
学ぶにつれて、機械学習がDMPや第三者配信の分析に役に立つことがわかりました。これからも新しい手法に取り組んで、守備範囲を広げ、応用できる領域を拡大していきたいと思います。

また、マーケッターと呼ばれる方々のデータ分析のリテラシーの低さに、やや不満を持っています。
新しい世代の人達、もしくは分析に強い異業種からきた人達の力で定量的な判断も重視されるように、業界を変えていきたいと考えています。

そのような動きはクライアントにとっても、プラスの側面が大きいでしょう。

[豊澤]業界全体の啓蒙という視点ですね。当サイトも一助になれればと思います。

[岡川]まとめますと、新しい分析の観点をインターネットの分野に広めて、それが標準となるような啓蒙活動やモデル作りをやっていきたいと思っています。

[豊澤]定量的な側面も活かした先進的な取組みができている会社様が少ないながらも存在する一方で、中間層が抜けていて、データ活用について取り組み始めたばかりか、検討中といった2極化している印象を持っています。

これまでのご経験で、データを現場で活用してもらうために必要なことは何だとお考えでしょう?

[岡川]端的に言うと結果を出すことだと思います。
「結果を出す。」と工場で言えば、ラインエンジニアの方々にも使って頂くことができました。DSPのコンサルティングでも、結果が出せるのであれば、ロジックは理解できなくとも使ってもらうことはできます。

小さい結果を積み重ねて、信頼を勝ち取っていくことが大事なのではないでしょうか。

また、データ分析をする側が、分析して終わりではなく、成果に対して粘り強く進捗を追いかけることが必要ではないでしょうか。

[豊澤]現場主導ということですね。

[岡川]はい。それに加えて、組織としてのサポートがなければ、そもそも誰も分析をやらないという問題もあります。極力、仕事は受けるようにして、結果を出すように努めています。組織として注力分野となると、コツコツ積み上げてきたデータ分析の活用が一気に広がるケースもあります。

地道な現場活動と組織的な対応の両輪が欠かせないと考えています。

岡川さんおススメの書籍

■1冊目: 数学の読み物

素数の音楽 (新潮文庫) [文庫]

マーカス デュ・ソートイ (著), Marcus du Sautoy (原著), 冨永 星 (翻訳)
http://amzn.to/1aKn2yI

コメント

リーマン予想は「ゼータ関数の零点の分布についての予想」で、現在も証明されていない難問です。この本に登場する証明に挑戦する数学者たちは、情熱に満ち溢れています。彼らに習うべく、日々の業務で、研究に対する情熱がなくなりそうなときに読んでいます。

—————————————————————————————————————————————————

■2冊目: データ分析の読み物
データ・サイエンティストに学ぶ「分析力」 ビッグデータからビジネス・チャンスをつかむ [単行本]
ディミトリ・マークス (著), ポール・ブラウン (著), 馬渕邦美 (監修), 小林啓倫 (翻訳)
http://amzn.to/1arB37S

コメント
昨今、「ビッグデータ」を活用すれば革新的な仕事ができると期待されています。
この本は、インターネット広告代理店でのスモールデータを活用したデータ分析事例が書いてあります。
現場で働く私としては、業態に依りますが、スモールデータの活用が先決である
と感じています。データ分析の足元で大切なことが書いてある本です。
インターネット広告代理店勤務のデータアナリスト・コンサルタントは必読です。

—————————————————————————————————————————————————

■3冊目: 機械学習の教科書
パターン認識と機械学習 上・下 [単行本(ソフトカバー)]
C.M. ビショップ (著)

http://amzn.to/1cs0S5t

http://amzn.to/11xlfvv
コメント
機械学習の教科書はたくさんありますが、結局は読まなければならない本です。買って損なしの本です。

—————————————————————————————————————————————————

■4冊目: 計量経済学の教科書
経済・ファイナンスデータの計量時系列分析 (統計ライブラリー) [単行本]
沖本 竜義 (著)
http://amzn.to/Hi7OYH

コメント
最近、インターネット広告代理店でのデータ分析に、計量時系列分析の相性が良い事が分かりました。経済学の例題が楽しく、仕事にも役立ち、数学上の帰結も興味深い、など一石三鳥の本です。

—————————————————————————————————————————————————

■5冊目: 小説
伝奇集 (岩波文庫) [文庫]
J.L. ボルヘス (著), 鼓 直 (翻訳)
http://amzn.to/1ctjOov

コメント
ボルヘスはアルゼンチンの短編小説家で、「バベルの図書館」や「砂の本」が好きです。数学の集合論には可算無限と連続体無限のように、無限に様々な濃度がありますが、バベルの図書館は可算無限、砂の本は連続体無限に限りなく肉薄していて、読む毎に想像力を掻き立てられます。日々の業務で、想像力がなくなりそうなときに読んでいます。