#CROSS2014 「機械学習 CROSS」セッションでお話しました

はじめに

さる 1/17(金)に開催された CROSS 2014 の「機械学習 CROSS」にパネラーとして登壇し、マーケティング分野における機械学習の活用状況について語ってきました。このエントリでは、同セッションで語ったことを整理し、また語りきれなかったディスカッショントピックについて、わりと個人的な想いを綴っています。

なお、セッション中のツイートは 機械学習CROSSまとめ こちらにまとめられていますので、あわせてご覧いただけると幸いです。

また、セッションオーナーの PFI 比戸さんや、パネラーとして同席された FFRI 村上さん、CROSS のセッションレポーターによるレポート記事が各種ブログ・メディアに掲載されています。

他のパネラーのご意見も掲載されていますので、こちらもぜひお読みください。

ALBERT とマーケティング

今回のセッションでは「マーケティング」という分野で「機械学習」がどのように利用・活用されているのかをお話ししました。そのまず手始めとして、ALBERT がマーケティングにどのように関わっているかを説明していきます。

上の図はつい最近公開された、2014 年 1 月版の Marketing Technology Landscape からの引用です。ご覧のとおり、多種多様なテクノロジがひしめき合うように混在しているのがマーケティング・ソリューションの分野となりますが、弊社は

albert-solutions-on-mtl

上記のマッピングにあるとおり、主に

  • ディスプレイ広告 (Display Advertising)
  • プライベート DMP (Data Management Platform)
  • CRM / マーケティング・オートメーション (Marketing Automation)

のカテゴリにて数々のソリューションを提供しています。このうち「ディスプレイ広告」や「CRM / マーケティング・オートメーション」のカテゴリにて機械学習の活用が進んでいます。

セッション中に提示した弊社における機械学習の活用事例は、 PFI 比戸さんの資料 に掲載されておりますので、こちらをご覧ください。

マーケティングにおける「機械学習」

マーケティングの分野における「機械学習」は「マーケティング課題を解決する手段の一つ」、という捉え方を弊社はしています。つまりは、マーケティングの課題に対して盲目的に機械学習を適用するのではなく、機械学習の適用が望ましいか否かを判断し、適切と思われる場合に利用する (適切でないと思われる場合にはルールベースのロジックなどを検討する)、という活用をしています。

また、「機械学習」はマーケティング分野では以下のように、大きく 2 つの活用方法があると考えています。

  • マーケティング・オートメーション を実現する手段としての「機械学習」
  • オーディエンスデータ、閲覧ログや購買ログなどの蓄積データを アドホックに分析する 手段としての「機械学習」

私はエンジニアとしてマーケティング・ソリューションの開発・運用に関わっている関係上、前者の「マーケティング・オートメーションを実現する手段」として機械学習を利用することが多くあります。一方で、弊社にいるデータアナリスト/分析者は後者のアドホック分析としての機械学習の利用が多いように思われます。

トピック1「機械学習導入の展望:どこから導入が進むのか」

ここから 後半セッションのディスカッショントピック で話した・話す予定だった内容を記述しています。

マーケティング分野においては、都市伝説的に語られている「おむつとビール」のバスケット分析のように、かなり早い時期から機械学習的な手法の利用が積極的であったのではないかと思われます。その背景には、購買データなどを活用しようとした場合、そのデータの規模が大きいがために人手での処理が難しく、計算機の力を借りざるを得ないという事情もあったのではないかと推測されます。

また、どのような目的をもって機械学習が実際にマーケティングの現場で用いられているかというと、全体的な傾向として「売上・利益」を向上・最大化させる目的で使われることが多い感触があります。特に Web に代表されるデジタルマーケティングにおけるレコメンデーションエンジンのように、利益アップを狙った機械学習の活用が多いでしょう。一方でリアルマーケティングの分野においては、利益アップを目的とする以外にも、コストカットを目的とした需要予測などでの機械学習の活用が見受けられます。

トピック2「機械学習は精度で人間に勝てるのか」

前述したとおり「機械学習はマーケティング課題を解決する手段の一つ」という捉え方をしているため、マーケティングの分野においては「精度」に重きを置くよりも (ないがしろにするわけでもなく)、ビシネス的に重要な売上・利益に関する KGI / KPI を重視する傾向にあります。そのため、アカデミックな世界でよく耳にする再現率 (recall)、適合率 (precision)、MAE などの指標値はマーケティング界隈ではあまり耳にすることはありません。

またそもそもの話として、レコメンデーションのように、機械学習によって得られたアウトプットを活用する先がクライアント企業の顧客である場合、その顧客から観たときに適切なアウトプットなのかどうか、すなわち適切かつ価値のあるレコメンド結果なのかどうかを精度よりも重視する必要があるでしょう。

このトピックに対する私の回答は上記より、「マーケティングの分野においては精度を KPI とすることが必ずしもあるわけではなく、むしろ多くない。精度以外の KPI を意識したり、顧客観点でみたときに適切かつ顧客に価値を提供できるかどうかを精度の代わりの判断材料とするべき」です。

トピック3「役立つケースとそうでないケースの違いは何か」

トピックの主題とちょっとずれた回答になりますが、レコメンデーションの分野に限って言えば、アソシエーション・ルール・マイニングや協調フィルタリングなど機械学習のアウトプットをそのまま顧客に提供・提示することは適切とは言えません。機械学習のアウトプットに対して、ドメイン知識を用いたルールベースのフィルタリングなどを加えた上で、顧客に提供するのが適切な結果になる場合が私の経験上、多いように思われます。

上記の例として、「これはひどい」という他社事例をセッション中に紹介しました。とある Web ショッピングサイトでのレコメンデーションの話です。家電を取り扱っている Web ショッピングサイトにて、ある冷蔵庫を購入しようとしてカートに入れたとき、カート投入後のページに表示される『この商品を買った人はこんな商品も買っています』のレコメンド枠に、別の冷蔵庫がレコメンドされてしまう問題がありました。この問題は主に 2 つの要素に分解することができます。

  • 相応しくないアイテムがレコメンドされうるルールとなっていること
    • 普通に考えて、冷蔵庫を同時に 2 つ以上購入する人はほとんどいませんよね…
  • Web ページの閲覧ログと購買ログを一緒くたに取り扱ってしまっている (と推測される) こと
    • このような異常なレコメンドルールを生成してしまっている背景には、顧客が製品の比較検討のために閲覧した「Web ページの閲覧ログ」をレコメンドに利用していることが推測されます。

前者の問題については、家電という耐久消費財を取り扱っていることを意識して、「同ジャンルの商品は同時購入のレコメンド対象にするべきではない」というドメイン特化のルールを適用するべきでしょう。一方で後者の問題については、取り扱っている購買ログと Web ページ閲覧ログの性質が異なることを意識して、閲覧ログは『この商品を見た人は他にこんな商品を見ています』など、比較検討のためのレコメンドにのみ利用するのが適切と考えられるでしょう。

このように、機械学習をベースにしつつも、その上にドメイン知識などを重ねることによって、初めて機械学習は実ビジネスに「役立つ」ようになるのではないかと考えています。

トピック4「それを支える技術やツールとしては何が有望か」

これ以降が時間の都合上、ディスカッションされなかったトピックとなります。

「マーケティングにおける機械学習」で述べているとおり、

  • マーケティング・オートメーション を実現する手段としての「機械学習」
  • オーディエンスデータ、閲覧ログや購買ログなどの蓄積データを アドホックに分析する 手段としての「機械学習」

の 2 つの活用ケースがありますが、それぞれで求められるツール・システムは異なります。

マーケティング・オートメーションで必要とされるのは、ソリューションに組み込み可能かつ自動化に対応できる製品であり、その要件をよく満たすのが SciPy などの機械学習ライブラリとなります。大規模データを取り扱う必要がある場合には、Mahout などの利用を検討したり、またリアルタイムな機械学習が要求される場合には Jubatus などを使うのが適切な手段となるでしょう。

一方のアドホック分析においては、アナリスト/分析者が容易に扱いやすい Visual Mining Studio などの GUI が充実した製品や R を利用することが多いかと思われます。また、Python などのプログラミング言語に通じた分析者であれば、SciPy などを利用して半自動化した分析を実現することもあります。

なお弊社においては、アドホック分析には R や Visual Mining Studio を利用し、一方でマーケティング・オートメーションには機械学習ライブラリを使用しつつも、ALBERT 独自のロジックを実現するためにフルスクラッチでライブラリ/ソリューションを実装することがよくあります。

トピック5「どのように導入を進めていけば良いのか」

本トピックについては、実は私自身が導入を進める立場におらず、弊社では営業/分析者がその役割を担っている傾向にあるため、しかるべき同僚にヒアリングをして回答を用意した、という経緯があります。その点ご承知おきください。

弊社の事情を前提として話を進めると、弊社は機械学習を活用したマーケティング・ソリューションをクライアント企業に提案し、導入を進める立場となります。

そのような立場において、「やってみなければ効果がわからない」という回答をクライアント企業の意思決定者よりいただいた場合、公開許可を頂いている他社の活用事例を提示し、ご説明をする対応をすることがあるそうです。

また、マーケティング担当者や意思決定者が統計や機械学習などに詳しくない場合は、その基礎的な説明を添えてソリューションの提案をするとのことです。場合によっては、継続的に統計・機械学習の説明をすることで、クライアント企業の担当者の成長を手助けしていくこともあるとのことです。

まとめ

長々と想いを綴ってきましたが、言いたいことを 3 つにまとめると、

  • マーケティングの分野でも、機械学習は活用できるよ!
  • 機械学習の精度も大切だけど、売上や利益などに貢献できる形で活用することがより重要だよ!
  • 顧客視点で機械学習のアウトプットを見て、価値が提供できるといいよね!

となります。

なお、セッションの最後に宣伝をさせていただきましたが、弊社会長の山川が執筆に関わっている ビッグデータの使い方・活かし方 という本が先日発売されました。この本を読めば、マーケティングにおける機械学習の活用事例をより深く、より詳しく知ることができるものと思われます。

最後に

まずは会場にいらっしゃった聴講者のみなさま、同席されたパネラーのみなさま、ありがとうございました。また今回の「機械学習 CROSS」への登壇オファーをくださった PFI 比戸さん、貴重な機会を提供してくださいまして感謝しております。ありがとうございました。

そして、エンジニアサポート CROSS を企画してくださった Nifty エンジニアサポートを始めとする実行委員会のみなさま、スポンサー各社に感謝です!