「実践!機械学習 - Web系企業 CTO が実例を公開」参加メモ

forkwell.doorkeeper.jp

  • 各社のサービスの中で、機械学習をどのように取り入れているか という事が中心のセッションでした。 そもそものサービスの目的について 各社が熟慮されて その手段として 機械学習を取り入れているのかなという感覚を持ちました。
  • こだわり過ぎると、危ういのかな。

フロムスクラッチ 井戸端 氏「マーケティングプラットフォームにおけるレコメンドサービス」

  • B-Dashマーケティングプラットフォーム)
  • データの取得、統合、活用が強み
  • 機能はいくつがあるが、レコメンドについて今日は話す
  • レコメンドエンジンとは、
  • 協調フィルタリング

    • アイテム利用者の行動履歴を元にレコメンドする方法
    • 他のユーザのデータがたくさんないとできない
    • 新商品、新ユーザに適切な推薦ができない
  • 内容ベース型

    • アイテムの特徴ベクトルで類似度ソートしてレコメンドする方法
  • データ処理方法

  • 協調フィルタリング〜ユーザベース〜

    • 類似度の計算
  • 協調フィルタリング〜アイテムベース

  • 応用例

    • 海外旅行航空券の推薦 アイテムベースの組み合わせ

    • メルマガタイトルの最適化

    • ユーザが興味を持ちそうなキーワードをタイトルにねじ込む
  • アーキテクチャ、メモ

    • spark、mahout、embulk、fluentd
  • レコメンドサービスのポイント

    • データの取得

      • WEBサイトのアクセスログGoogle Analyticsだけでは不十分
      • 詳細ページの閲覧、レコメンド閲覧、クリック数を取得する必要がある
    • データの統合がかなり大変

      • WEBログと他データの統合は共通ぷらっとフォームが処理
      • 顧客データ、ビジネスデータの内容を理解する必要がある、
      • レコメンド独自の考慮の必要
      • レコメンド用商品グループID、商品ページのURLのパターン判定 →色違いは別々だけど、サイズ違いが同じになるような商品のこと
  • まとめ

    • どんなアルゴリズムを使うかより、マーケディングとしての設計が必要
    • ユーザがイメージしている内容と実際の抽出結果が一致しない場合がある
      • マーケッターの感覚?
    • 施策の結果を分析して示唆を抽出し、次の施策へと生かすプロセスが重要
  • 今後の展望

    • 外部サービスを強めたい
    • プラットフォームの拡張

プレイド 柴山 氏「トラッキングデータを使った機械学習活用」

  • karte
    • 実手紙を出すなどもできる
  • アルゴリズム要件

    • リアルタイム推論
    • オートスケールする形に沿った学習、推論実装可能
    • サイト/施策ごとの最適化をするためのオンライン学習
  • 利用シーン1

    • 配信比率を自動収束させたい
    • 探索
      • None
      • Epsilon Greedy
      • softmax good
    • 価値関数計算
  • 利用シーン2

    • 顧客満足度、購入確率予測、離脱確率予測などの指標を暗黙的な形で数値化する
    • 2クラス分類 SGDがベース
      • logistic regression
      • ridge
      • negative sampling