Skip to content

Instantly share code, notes, and snippets.

kddcup2012で年齢性別予測!

hivemallを使ってkddcup2012のデータセットで年齢と性別を予測するよー。

dataset

kddcup2012

training 1億5000万レコード

TreasureWorkflowでleadscoringを試してみる。

RandomForestを使用しCV確率を予測。
ユーザーを予測CV確率に応じてA,B,C,D,Fの5階級に分けをし、
各階級の人数をカウントするところまでをWorkflow化する。

dataset

leads-and-customers.csv

Sorry, something went wrong. Reload?
Sorry, we cannot display this file.
Sorry, this file is invalid so it cannot be displayed.