Instantly share code, notes, and snippets.
常見的資料前處理如下所示: 1,缺失值的處理
2,類別資料的處理(有序、無序) One-hot encoding 3,資料特徵縮放
經過Standardization之後,資料會符合常態分佈,不會有偏單邊的形況,由於常態分佈機器學習的加權迭代學習(梯度下降)可以更容易完成。另外Standardization還可以使離群值(outlier)對整個model的影響大大減低。
Sorry, something went wrong.
常見的資料前處理如下所示:
1,缺失值的處理
2,類別資料的處理(有序、無序) One-hot encoding
3,資料特徵縮放
經過Standardization之後,資料會符合常態分佈,不會有偏單邊的形況,由於常態分佈機器學習的加權迭代學習(梯度下降)可以更容易完成。另外Standardization還可以使離群值(outlier)對整個model的影響大大減低。