自我學習,以目前限有材料規劃的 learning path
這只是工具的用法,別忘了吸收資料科學的知識 yo
- 用 Hadoop MapReduce Framework 寫程式出來跑得動,跟你想的結果一樣
- 參考 popcorny 分享的 word count 專案 https://github.com/popcornylu/hadoop-wordcount
- Map Reduce 演算法概念
- 弄懂 Map Reduce 演算法各資料處理階段對應至 Hadoop MapReduce Framework 上的 Job Template (之後最佳化會用到)