RLS Meetup #3 売上を上げるためのデータ×エンジニアリング参加メモ

recruit-lifestyle.connpass.com - ハッシュタグ:#RLSmeetup

セミナーを聞いての気づき

  • 社内システムであっても、KGIやKPIを意識したエンジニアリングを実施しており意識高い。
  • データに関わる人が事業に対して縦串、横串でかかわる組織構造になっていて自然とデータの利用方法や施策への活用方法ついてノウハウが共有される組織づくりをしている。
  • データ分析が、エンジニア以外も当たり前になっている(社内ユーザ300人)文化である。
  • ビッグデータを扱っている会社の採用記事で技術傾向を見て採用技術を決めている(ユニークだと感じた)
  • データレイクという言葉を初めて知った。

メモ

リクルートライフスタイルの売上を支える共通分析基盤』 by 山田

リクルートライフスタイルの売上を支える共通分析基盤

分析基盤の続け方
  • ユーザファーストの基盤を作る、使ってくれる人がいないと分析基盤は継続しない
  • ユーザの声を常に聞ける環境を整える
  • slackチャネル、ユーザアンケート、基盤を使う立場になる
  • データを使うチームを近くにおく
  • 毎月メルマガを発行する
  • 社内散歩する
  • エンジニアよがりにならない
    売上の上がる基盤を作る
  • 売上をあげないと予算がつかない
  • ROIは計算しなくて良い、KPIは持つようにしている
    運用コストを下げる
  • キャパシティ管理はしなくていいようにする
  • 障害が起きた時にデータパイプラインを作る
  • クラウドに任せるところを任せる
  • 魔改造をしない
  • SLAは緩く
    ユーザの教育を行う。
  • DWHごとに最適なクエリ意識してユーザ(社内で分析する人)はSQLを実行しないので、教育が必要。
  • 半期に一度の勉強会
    データレイク構成
  • あとあと楽になる

『売上に効くデータ「組織」』 by 井原

  • データマネジメントG マネージャー
  • 案件、LPO 0.2秒でクッキー読んで最適なランディングページを作るなどを担当
データマネジメントGで実施している事
  • pdcaを高速に回す
  • データプロデュースチームを作った
  • セルフBI の支援を実施している
  • ホットペッパーグルメの施策
    • 2週間で2年目の子がやった
    • リクルートに対して未払いがあった会社のデータを利用
  • 店舗でのオペレーションを徹底する事ができれば、施策の狙い通りにデータを活用する事ができる。
    • オペレーションを実施した店舗売上ランキングを店舗に配布してオペレーションを促す。
大事にしていること
  • 事業価値
  • データ介在度
  • 可変かどうか(現場のオペレーションが可変かどうか)
    • 営業にチケット行動をしてもらい。行動を可視化
    • ビッグデータを扱っている会社の採用記事で技術の傾向を見て採用技術を決める。

『データプランナーによるデータ系施策について』 by 本庄

  • データマネジメントGのなかで、セカンダリという役割で働いている
  • データを活用した広告提案の自動化
    • じゃらん 営業200人
    • 営業の移動時間が多い
    • クライアントには年3回くらいの訪問しかしていない

    • 課題

      • 営業人材は不足して行く、テールクライアントは増やそうとしている
        • 広告提案書生成の自動化を提案した
        • 型化する
データマネジメントで必要なスキル
  • 論点思考、仮説思考、構造化スキル
  • 問題解決スキル
  • 推進スキル
  • リーダーシップ

帰宅後

  • 山田さんのカップ焼きそば刷り込みにより、誘惑されてしまいました f:id:masaji0912:20170713144819j:plain

「ベースボールからみる技術」参加メモ

グラレコしました。

f:id:masaji0912:20170607125248j:plain

www.slideshare.net

「AWS Summit Tokyo 2017 3日目」参加メモ

今年も行ってきた、AWSSummit www.awssummit.tokyo

去年は、最終日にしたけど会社の人が最終日に行くってことで
3日目に行ってきました。3日目の印象や聞いてきたセッションのメモなど共有。

全体の印象

  • 去年より、だいぶ人が増えた。
  • 今年の事前登録者数は20,000人超えたみたいです。
  • スポンサーの展示ブースにも人がごった返していて
    行きたいブースにたどり着くまでに、各社の誘惑をかいくぐるのが大変でした。
  • 様々な事業会社の導入事例が数多く展開されるとともに、
    登壇した事業会社の部長さんがAWSの資格取りましたみたいな話もあり、
    世間的には当たり前の技術になりつつあるなーという危機感を感じた。

戦利品

  • まい泉のお弁当(炭水化物多め)
  • AWSパートナー事例大全集 vol.2
  • NTTデータ社のボールペン
  • トレジャーデータ社の手提げかばん
  • AWSの手帳

聞いてきたセッションとメモ

Day 3 基調講演(キーノート)

AWS によるマイクロソフトアーキテクチャの最適化

クックパッド機械学習を支える基盤のつくりかた(仮)

– 新しい事に挑戦するために、いろいろ準備できる組織の考え方は素敵です。

業種・業界を超えた AWS 活用事例とミッションクリティカルシステムへの挑戦

  • http://www.awssummit.tokyo/summit/index.html#D3T4-4
  • 去年、AWSのプレミアパートナーになった
  • 我々には、インフラコーディネータがいる
  • インフラコーディネータは、オンプレとは違う視点でシステムを運用管理できるノウハウが必要
  • 公共、金融系にもクラウド導入を推進中
  • テクノロジーズでは、プライベートクライドを10年前に作った。いろいろ自動化しすぎて属人化がひどい。
  • エクセルプロトコルがまだ残っていてどうにかしたい

JJUG CCC 2017 スライドまとめ

纏め中。間違いがあったら、ご指摘ください。

午前

時間 部屋
    A+B E F G+H
9:30- 日本Javaユーザーグループ 年次総会
10:00- JJUG CCC 20th fireside chat ふつうのJavaコーディング JHipsterで学ぶ!Springによるサーバサイド開発手法 非機能要件とSpring Boot
11:00- Java EE 8 and its latest topics Java Clientで入門するApache Kafka エンプラ開発におけるレガシーアプリケーションの巻き取りとモジュール分割の戦い Vue.js + Spring Bootで楽しくフルスタック開発やってみた

午後

時間 部屋
    A+B C+D E F G+H I L M
13:30- Scala製機械学習基盤PredictionIOとSparkによるレコメンドシステム 新しいTERASOLUNA Batch Frameworkとは Java libraries you can’t afford to miss SpotBugs(FindBugs)による大規模ERPのコード品質改善 データ履歴管理のためのテンポラルデータモデルとReladomoの紹介 全部 Java で作っちゃえ!! Vaadin 8 による “オール Java” Web アプリ開発のしくみと実践 How to use MicroProfile and a way to rebirth Japanese enterprise computing JavaエンジニアのためのPostgreSQLステップアップ
14:30- ヤフーの広告レポートシステムをSpring Cloud Stream化するまで Unified JVM Logging: Java 9 から変わる JVM ログ What you need to know about HotSpot and Your Code ナビタイムも導入!!ボットで始発・終電案内から観光ガイドまで 〜 Java でも日本語自然言語処理をカンタンに利用可能 Microsoft LUIS!! Javaエンジニアに知って欲しいRDBアンチパターン Polyglot on the JVM with Graal JavaエンジニアのためのScala入門 文型さえおさえれば英語を読む力は上がる!
14:55- 新卒2年目が鍛えられたコードレビュー道場の軌跡 Selenideを使ってみた 〜 ブラウザテスト自動化 〜
15:45- Scalaによるサービス開発現場での継続的リファクタリングの実践 Javaエンジニアから見たKotlinの魅力 Javaで実装して学ぶOAuth 2.0! Seasar2からSpringへ移行した俺たちのアプリケーションがマイクロサービスアーキテクチャへ歩み始めた Introduction of Project Jigsaw Androidアプリ開発からみたRxJavaの使いどころ SIプロジェクトでよくあるフレームワークのカスタム開発ってまだ必要なの? 今日からDL4J
16:10- Java8移行は怖くない~エンタープライズ案件でのJava8移行事例について~ グラフデータベース入門
16:45- Java8プログラミング ベストプラクティス & きしだが働いてるかどうかIDEのメモリ使用状況から機械学習で判定する 劇的!データベース・ビフォーアフター 時代はディスクからインメモリーへ―― Spark + DeepLearning4J の特長と最新動向(仮) U-NEXT学生インターン、過激なJavaの学び方と過激な要求 Engineers can change the world ~ “世界” で活躍するエンジニアになるために Javaとアイドルのコラボ!?某アイドルBot開発の裏側 Javaとアイドルのコラボ!?某アイドルBot開発の裏側 JavaFXでデスクトップガジェット風プログラムを作る
17:10- Javaチョットデキルへの道~JavaコアSDKに見る真似したいコード10選~ 新卒2年目から始めるOSSのススメ 〜明日からできるコミットデビュー〜
17:45- VMの歩む道。Dalvik、ART、そしてJava VM マチコ&河村の怒り新党 〜真の最終回〜 ハックで生きる:オープンソースで会社を興すには Java x Arduinoで始めるIoT / フィジカルコンピューティング 思ったほど怖くない!Haskell on JVM 超入門 Ordinary Object Pointer について調べてみた

「TensorFlow User Group #4」参加メモ

機械学習初心者ですが、「TensorFlow User Group #4」に参加してきました。
tfug-tokyo.connpass.com

googleさんに来るのは初めてです、会場はgoogleさんの食堂でした。
なかなかオシャレな食堂です。

TensorFlow GPU 101

有山 圭二 さん(有限会社シーリス)
  • gpu 180ms
  • cpu 3800 ms
  • sakura の高火力gpu 40 ms
  • ubuntuのアップデートでgpuのドライバが外れる
  • tensorflowのアップデート
  • allrow
  • ML Engine

TensorFlowを使ったCNNの可視化手法

芦原 佑太 さん(株式会社クロスコンパス・インテリジェンス 研究員 電気通信大学大学院 博士後期課程)
  • 逆伝播
  • grand cam

分散GPU環境における深層学習フレームワークの性能比較

松岡 佑磨 さん(法政大学)

懇親会で入手した情報

TensorFlowにおけるRNN実装あれこれ(2)

新村 拓也 さん(シンギュラリティ株式会社)

TensorFlow & DeepMind Lab

三好 康祐さん (Narrative Nights株式会社)
AFURI

帰りは、こちらでラーメン食べて帰りました。 afuri.com

「実践!機械学習 - Web系企業 CTO が実例を公開」参加メモ

forkwell.doorkeeper.jp

  • 各社のサービスの中で、機械学習をどのように取り入れているか という事が中心のセッションでした。 そもそものサービスの目的について 各社が熟慮されて その手段として 機械学習を取り入れているのかなという感覚を持ちました。
  • こだわり過ぎると、危ういのかな。

フロムスクラッチ 井戸端 氏「マーケティングプラットフォームにおけるレコメンドサービス」

  • B-Dashマーケティングプラットフォーム)
  • データの取得、統合、活用が強み
  • 機能はいくつがあるが、レコメンドについて今日は話す
  • レコメンドエンジンとは、
  • 協調フィルタリング

    • アイテム利用者の行動履歴を元にレコメンドする方法
    • 他のユーザのデータがたくさんないとできない
    • 新商品、新ユーザに適切な推薦ができない
  • 内容ベース型

    • アイテムの特徴ベクトルで類似度ソートしてレコメンドする方法
  • データ処理方法

  • 協調フィルタリング〜ユーザベース〜

    • 類似度の計算
  • 協調フィルタリング〜アイテムベース

  • 応用例

    • 海外旅行航空券の推薦 アイテムベースの組み合わせ

    • メルマガタイトルの最適化

    • ユーザが興味を持ちそうなキーワードをタイトルにねじ込む
  • アーキテクチャ、メモ

    • spark、mahout、embulk、fluentd
  • レコメンドサービスのポイント

    • データの取得

      • WEBサイトのアクセスログGoogle Analyticsだけでは不十分
      • 詳細ページの閲覧、レコメンド閲覧、クリック数を取得する必要がある
    • データの統合がかなり大変

      • WEBログと他データの統合は共通ぷらっとフォームが処理
      • 顧客データ、ビジネスデータの内容を理解する必要がある、
      • レコメンド独自の考慮の必要
      • レコメンド用商品グループID、商品ページのURLのパターン判定 →色違いは別々だけど、サイズ違いが同じになるような商品のこと
  • まとめ

    • どんなアルゴリズムを使うかより、マーケディングとしての設計が必要
    • ユーザがイメージしている内容と実際の抽出結果が一致しない場合がある
      • マーケッターの感覚?
    • 施策の結果を分析して示唆を抽出し、次の施策へと生かすプロセスが重要
  • 今後の展望

    • 外部サービスを強めたい
    • プラットフォームの拡張

プレイド 柴山 氏「トラッキングデータを使った機械学習活用」

  • karte
    • 実手紙を出すなどもできる
  • アルゴリズム要件

    • リアルタイム推論
    • オートスケールする形に沿った学習、推論実装可能
    • サイト/施策ごとの最適化をするためのオンライン学習
  • 利用シーン1

    • 配信比率を自動収束させたい
    • 探索
      • None
      • Epsilon Greedy
      • softmax good
    • 価値関数計算
  • 利用シーン2

    • 顧客満足度、購入確率予測、離脱確率予測などの指標を暗黙的な形で数値化する
    • 2クラス分類 SGDがベース
      • logistic regression
      • ridge
      • negative sampling

「Oisix・機械学習勉強会」参加メモ

https://oi-study.connpass.com/event/48753/
行ってきました。

今はやり?のグラッフィックレコーディングで記事を書いてみました。

準備した道具

f:id:masaji0912:20170130232818j:plain:w300

  • キャンドゥ レミィ五反田店で買った方眼用紙
  • 無印良品 水性六角ミニカラーペンセット ¥500

「レビューのネガポジ RandomForest vs LSTM」

f:id:masaji0912:20170130232726j:plain:w300

  • 限られた紙面の中に、話を聞きながらまとめるのは無理ゲーじゃないか?
  • LT全体の構成がわからないと、紙面をどう使っていいのかわからなくなる。
  • 肝心な課題部分が聞き取れなかった。
  • 途中から、下書きして、後から色塗った。
  • 色を使いすぎ?