Skip to content

Instantly share code, notes, and snippets.

@snj
Created June 3, 2015 04:13
Show Gist options
  • Star 0 You must be signed in to star a gist
  • Fork 0 You must be signed in to fork a gist
  • Save snj/6e2cee8165b3f5e6bf79 to your computer and use it in GitHub Desktop.
Save snj/6e2cee8165b3f5e6bf79 to your computer and use it in GitHub Desktop.
AWS Summit 2015 Day2
機械学習の導入を容易にする。
例:スパム判定。送信者ドメインやIP,時刻、言語といったファクト(教師データ)をもとにモデルをトレーニングし、未来予測対象のデータのスパム判定を行う。二項分類。
例2:ECサイトの商品のカテゴライズ。商品名、価格、メーカーなどの教師データをもとに、日用品なのか、食品、本なのかなどを予測対象データにたいして判定する。
例3:明日の売上はどのくらいか。過去の売上データ群から、一番もっともらしい範囲で。曜日、天気、気温などの要素。数値を元に。線形回帰分析。
スマートアプリケーションを作るには
1.機械学習への理解
2.R,Pythonなどの知識
3.特定のビジネス分野への知見(金融、広告など)
AMLはこれらを容易にする。
提供するもの:
・アルゴリズム
・パッケージサービスとしての提供
・スケーラビリティ
扱える予測モデルとアルゴリズム
1.二項分類
2.他クラス分類
3.回帰分析
モデルの品質評価
料金
分析、評価、モデルトレーニング $0.42/インスタンス時
バッチ予測 $0.10/1000
リアルタイム $0.10/1000
リージョンはus-east-1のみだが、他のリージョンのS3も利用可能
機械学習を活用するために’解決したい問題を落としこむ必要がある。
広告の不正クリック選出:クリックログ。不正かどうかを別の手法で判断してフラグがついたもの。問題の分類:二項分類。出力:ログ一行ごとに不正クリックかそうでないか。
デモグラ推定:でもグラがわかっているユーザーの行動ログ。他クラス分類。ユーザーのかとごライズされたデモグラ。
顔写真から特定の人物かどうか判定する。
教師データの例:教師データの形式、入力値、
・顔写真から特定の人物を判定するデモ
教師データ:画像情報のビットマップのCSV。末尾に 1 or 0 (Binary)
予測方法にはバッチ処理とリアルタイムAPIの二種類がある。
Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment