「実践！機械学習 - Web系企業 CTO が実例を公開」参加メモ

forkwell.doorkeeper.jp

各社のサービスの中で、機械学習をどのように取り入れているかという事が中心のセッションでした。そもそものサービスの目的について各社が熟慮されてその手段として機械学習を取り入れているのかなという感覚を持ちました。
こだわり過ぎると、危ういのかな。

フロムスクラッチ井戸端氏「マーケティングプラットフォームにおけるレコメンドサービス」

B-Dash（マーケティングプラットフォーム）
データの取得、統合、活用が強み
機能はいくつがあるが、レコメンドについて今日は話す
レコメンドエンジンとは、
協調フィルタリング型
- アイテム利用者の行動履歴を元にレコメンドする方法
- 他のユーザのデータがたくさんないとできない
- 新商品、新ユーザに適切な推薦ができない
内容ベース型
- アイテムの特徴ベクトルで類似度ソートしてレコメンドする方法
データ処理方法
- バッチ処理
- リアルタイム
協調フィルタリング〜ユーザベース〜
- 類似度の計算
協調フィルタリング〜アイテムベース
- アイテム同士の関連性を計算する
- 類似のマトリックスを作る
応用例
- 海外旅行航空券の推薦　アイテムベースの組み合わせ
- メルマガタイトルの最適化
- ユーザが興味を持ちそうなキーワードをタイトルにねじ込む
アーキテクチャ、メモ
- spark、mahout、embulk、fluentd
レコメンドサービスのポイント
- データの取得
  - WEBサイトのアクセスログ、Google Analyticsだけでは不十分
  - 詳細ページの閲覧、レコメンド閲覧、クリック数を取得する必要がある
- データの統合がかなり大変
  - WEBログと他データの統合は共通ぷらっとフォームが処理
  - 顧客データ、ビジネスデータの内容を理解する必要がある、
  - レコメンド独自の考慮の必要
  - レコメンド用商品グループID、商品ページのURLのパターン判定 →色違いは別々だけど、サイズ違いが同じになるような商品のこと
まとめ
- どんなアルゴリズムを使うかより、マーケディングとしての設計が必要
- ユーザがイメージしている内容と実際の抽出結果が一致しない場合がある
  - マーケッターの感覚？
- 施策の結果を分析して示唆を抽出し、次の施策へと生かすプロセスが重要
今後の展望
- 外部サービスを強めたい
- プラットフォームの拡張

プレイド柴山氏「トラッキングデータを使った機械学習活用」

karte
- 実手紙を出すなどもできる
アルゴリズム要件
- リアルタイム推論
- オートスケールする形に沿った学習、推論実装可能
- サイト／施策ごとの最適化をするためのオンライン学習
利用シーン１
- 配信比率を自動収束させたい
- 探索
  - None
  - Epsilon Greedy
  - softmax good
- 価値関数計算
利用シーン２
- 顧客満足度、購入確率予測、離脱確率予測などの指標を暗黙的な形で数値化する
- ２クラス分類　SGDがベース
  - logistic regression
  - ridge
  - negative sampling

フロムスクラッチ 井戸端 氏「マーケティングプラットフォームにおけるレコメンドサービス」

プレイド 柴山 氏「トラッキングデータを使った機械学習活用」

フロムスクラッチ井戸端氏「マーケティングプラットフォームにおけるレコメンドサービス」

プレイド柴山氏「トラッキングデータを使った機械学習活用」