- Linear Regression
- Logistic Regression
- Classification
- Decision Trees
- Support Vector Machines
- Neural Networks.
- Binary Classification
- Multiclass Classification
- Decision Tree
- Linear Regression
- Logistic Regression
- Polynomial Regression
- Stepwise Regression
- Ridge Regression
- Lasso Regression
- ElasticNet Regression
- regresi
- clustering
- Linear
- RBF (Radial Basis Function) atau Gaussian kernel
- Polinomial
- Sigmoid
- Fast R-CNN
- Faster R-CNN
- Histogram of Oriented Gradients (HOG)
- Region-based Convolutional Neural Networks (R-CNN)
- Region-based Fully Convolutional Network (R-FCN)
- Single Shot Detector (SSD)
- Pyramid Pooling (SPP-net)
- YOLO (You Only Look Once) :
- Tiny
proses pengumpulan data -> exploratory data analysis => Data preprocessing => seleksi Model => evaluasi model => deployment => monitoring
- Similarity Calculate
"Overfitting terjadi ketika model memiliki prediksi yang terlalu baik pada data training, namun prediksinya buruk pada data testing. Ketika sebuah model overfit, model tidak dapat melakukan generalisasi dengan baik sehingga akan membuat banyak kesalahan dalam memprediksi data-data baru yang ditemui pada tahap produksi."
Dimensionality Reduction : LDA, PCA, t-SNE
-
Principal Component Analysis (PCA) PCA adalah mereduksi dimensi atau mengurangi jumlah atribut pada dataset tanpa mengurangi informasi. Contohnya pada sebuah dataset harga rumah. Pada PCA setiap atribut disebut sebagai principal component. Jika terdapat 10 atribut pada dataset, berarti terdapat 10 principal component.
-
Linear Discriminant Analysis (LDA) analisis diskriminan linier adalah teknik statistika yang dipakai untuk reduksi dimensi. LDA bekerja dengan mencari kombinasi atribut terbaik yang dapat memisahkan kelas-kelas pada dataset dan meminimalkan varian pada masing-masing kelas. Kontras dengan PCA yang bekerja dengan mencari atribut komponen yang memiliki varian tertinggi.
-
t-Distributed Stochastic Neighbor Embedding (t-SNE) t-SNE dikembangkan oleh Laurens van der Maaten dan Geoffrey Hinton pada tahun 2008. t-SNE adalah teknik non linear unsupervised yang digunakan untuk reduksi dimensi, eksplorasi data, dan visualisasi data berdimensi tinggi. Laurens van der Maaten
-
Support Vector Machine algoritma training yang bertujuan untuk memaksimalkan margin antara pola pelatihan dan batas keputusan (decision boundary) [10]. Algoritma ini kemudian dikenal luas sebagai Support Vector Machine (SVM). Support Vector Machine adalah model ML multifungsi yang dapat digunakan untuk menyelesaikan permasalahan klasifikasi, regresi, dan pendeteksian outlier. Termasuk ke dalam kategori supervised learning, SVM adalah salah satu metode yang paling populer dalam machine learning. Siapa pun yang tertarik untuk masuk ke dalam dunia ML, perlu mengetahui SVM.
Tujuan dari algoritma SVM adalah untuk menemukan hyperplane terbaik dalam ruang berdimensi-N (ruang dengan N-jumlah fitur) yang berfungsi sebagai pemisah yang jelas bagi titik-titik data input.
https://data-flair.training/blogs/svm-kernel-functions/ https://www.stat.cmu.edu/~hseltman/309/Book/chapter4.pdf https://www.kite.com/blog/python/data-analysis-visualization-python/ https://datascienceguide.github.io/exploratory-data-analysis https://www.youtube.com/watch?v=zHcQPKP6NpM
https://arxiv.org/pdf/1406.4729.pdf)%C3%AC%20%CB%9C https://arxiv.org/pdf/1512.02325.pdf%EF%BC%89 https://arxiv.org/pdf/1512.02325.pdf%EF%BC%89 https://arxiv.org/pdf/1605.06409.pdf https://www.cv-foundation.org/openaccess/content_cvpr_2016/papers/Redmon_You_Only_Look_CVPR_2016_paper.pdf https://software.intel.com/content/www/us/en/develop/documentation/ipp-dev-reference/top/volume-2-image-processing/computer-vision/feature-detection-functions/histogram-of-oriented-gradients-hog-descriptor.html http://papers.nips.cc/paper/5638-faster-r-cnn-towards-real-time-object-detection-with-region-proposal-networks.pdf http://openaccess.thecvf.com/content_iccv_2015/papers/Girshick_Fast_R-CNN_ICCV_2015_paper.pdf