hivemallを使ってkddcup2012のデータセットで年齢と性別を予測するよー。
training 1億5000万レコード
hivemallを使ってkddcup2012のデータセットで年齢と性別を予測するよー。
training 1億5000万レコード
RandomForestを使用しCV確率を予測。
ユーザーを予測CV確率に応じてA,B,C,D,Fの5階級に分けをし、
各階級の人数をカウントするところまでをWorkflow化する。
[1]lead_scoring_demo_shape
https://console.treasuredata.com/app/queries/editor?queryId=161457
CVに関係のありそうな変数のみを選択して使用する。