Skip to content

Instantly share code, notes, and snippets.

@kztakuro
Last active December 21, 2015 10:45
Show Gist options
  • Star 0 You must be signed in to star a gist
  • Fork 0 You must be signed in to fork a gist
  • Save kztakuro/f8ecc0df7353f22eadee to your computer and use it in GitHub Desktop.
Save kztakuro/f8ecc0df7353f22eadee to your computer and use it in GitHub Desktop.
CyberAgent エンジニア Advent Calendar 2015 21日目

サイバーエージェント秋葉原ラボのデータ分析とか機械学習とか2015


21日目は,秋葉原ラボの@k66dangoが担当します.
業務では,機械学習プロダクトとかデータ分析業務に関わっています.
また,社会人ドクターをしております.こちらの社会人ドクターの記事もぜひご覧ください.

はじめに

秋葉原ラボは,弊社の研究開発組織で,大規模データの収集・解析基盤の開発,データ分析や機械学習を活用したサービスの改善を主眼としています.
21日目の記事では,秋葉原ラボで取り組んでいるデータ分析や機械学習プロダクトについて簡単にご紹介したいと思います. 秋葉原ラボのメンバーによる,対外的な報告はこちらをご参照ください.

レコメンド

秋葉原ラボでは,ソーシャルゲームでのギルドマッチや,キュレーションメディアでの記事レコメンドなど,社内の多くのプロダクトにレコメンドを提供しています.
ここの分野は,あまり対外発表はされていませんが,第9回のsig-docmasでAWAのデータを使ったレコメンドについて発表を行ないました.

アドテク

社内のアドテク関連プロダクトに顔を出すことがあります.レコメンド,CTR予測やデモグラ類推などに取り組んでいます.
また,秋葉原ラボでは,弊社のアドテクスタジオと共同でプロダクトの開発・実験を行なうこともあります. 過去には,隠れマルコフモデルによるユーザの位置測定予測について人工知能学会において報告を行ないました.
同じ大量データを扱う部署であるので,シナジー効果を目指して,どんどん共同しいきたい分野です.

画像認識

弊社では,アメブロなどのユーザ投稿サービスを多数運営しています. そこで投稿される画像を自動的に認識し,タグをつけることは,マーケティングあるいは,スパム対策の文脈で非常に重要です.
秋葉原ラボでは,画像認識に積極的に取り組んでいます.
先日,@ceeflyerさんが顔認識について書いてみるでも画像認識について書いています.ぜひ,ご覧ください.

スパム対策

上記の画像認識と被りますが,ユーザ投稿サービスにおけるスパムフィルタの一部に機械学習を利用しています.

データ分析

社内では,多くのデータ分析を行なっております.そのレポートのほとんどは社外秘ですが,一部対外的に報告することがあります. 直近の報告ですが,ガールフレンド(仮)のデータを利用したユーザ行動モデリングをWI 2015で報告しました.

チャットボットの試作

R&Dで,チャットボットの試作に取り組んでいます.研究成果などは,国内・国外のカンファレンスなどで報告をしています.弊社サービスのピグの会話コーパスだけではなく,近年注目されているリカレントニューラルネットワークによる返答生成にも挑戦しています.

おわりに

あっさりした説明になってしまいましたが,少しでも弊社にご興味をもたらた方がいらっしゃると幸いです.
こうしたデータマイニング・機械学習ができるのは,各プロダクトにおけるログ設計や収集,それを横断的に集計する基盤などがしっかりしているからだと思います.
今回は説明しませんでしたが,収集基盤などに興味をもたれた方は,ぜひ下記の記事もご覧ください.

それでは,よいお年を!

Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment