「実践!機械学習 - Web系企業 CTO が実例を公開」参加メモ
- 各社のサービスの中で、機械学習をどのように取り入れているか という事が中心のセッションでした。 そもそものサービスの目的について 各社が熟慮されて その手段として 機械学習を取り入れているのかなという感覚を持ちました。
- こだわり過ぎると、危ういのかな。
フロムスクラッチ 井戸端 氏「マーケティングプラットフォームにおけるレコメンドサービス」
- B-Dash(マーケティングプラットフォーム)
- データの取得、統合、活用が強み
- 機能はいくつがあるが、レコメンドについて今日は話す
- レコメンドエンジンとは、
-
- アイテム利用者の行動履歴を元にレコメンドする方法
- 他のユーザのデータがたくさんないとできない
- 新商品、新ユーザに適切な推薦ができない
内容ベース型
- アイテムの特徴ベクトルで類似度ソートしてレコメンドする方法
データ処理方法
- バッチ処理
- リアルタイム
協調フィルタリング〜ユーザベース〜
- 類似度の計算
協調フィルタリング〜アイテムベース
- アイテム同士の関連性を計算する
- 類似のマトリックスを作る
応用例
海外旅行航空券の推薦 アイテムベースの組み合わせ
メルマガタイトルの最適化
- ユーザが興味を持ちそうなキーワードをタイトルにねじ込む
アーキテクチャ、メモ
- spark、mahout、embulk、fluentd
レコメンドサービスのポイント
データの取得
- WEBサイトのアクセスログ、Google Analyticsだけでは不十分
- 詳細ページの閲覧、レコメンド閲覧、クリック数を取得する必要がある
データの統合がかなり大変
- WEBログと他データの統合は共通ぷらっとフォームが処理
- 顧客データ、ビジネスデータの内容を理解する必要がある、
- レコメンド独自の考慮の必要
- レコメンド用商品グループID、商品ページのURLのパターン判定 →色違いは別々だけど、サイズ違いが同じになるような商品のこと
まとめ
- どんなアルゴリズムを使うかより、マーケディングとしての設計が必要
- ユーザがイメージしている内容と実際の抽出結果が一致しない場合がある
- マーケッターの感覚?
- 施策の結果を分析して示唆を抽出し、次の施策へと生かすプロセスが重要
今後の展望
- 外部サービスを強めたい
- プラットフォームの拡張