naagaraa/learning-ml.md

## learning-ml.md

      
    Raw
  

              learning-ml.md
            
          
    Berikut adalah beberapa algoritma supervised learning yang penting Anda ketahui,


Linear Regression
Logistic Regression
Classification
Decision Trees
Support Vector Machines
Neural Networks.
Binary Classification
Multiclass Classification
Decision Tree

types of Regressions :


Linear Regression
Logistic Regression
Polynomial Regression
Stepwise Regression
Ridge Regression
Lasso Regression
ElasticNet Regression

2 model machine learning


regresi
clustering

matematematika dasar untuk SVM


Linear
RBF (Radial Basis Function) atau Gaussian kernel
Polinomial
Sigmoid

Top Algorithms For Object Detection


Fast R-CNN
Faster R-CNN
Histogram of Oriented Gradients (HOG)
Region-based Convolutional Neural Networks (R-CNN)
Region-based Fully Convolutional Network (R-FCN)
Single Shot Detector (SSD)
Pyramid Pooling (SPP-net)
YOLO (You Only Look Once) :
Tiny

machine learning flow

proses pengumpulan data -> exploratory data analysis => Data preprocessing => seleksi Model => evaluasi model => deployment => monitoring
NLP


Similarity Calculate

http://www.catalysoft.com/articles/StrikeAMatch.html
https://itnext.io/string-similarity-the-basic-know-your-algorithms-guide-3de3d7346227
https://stackoverflow.com/questions/653157/a-better-similarity-ranking-algorithm-for-variable-length-strings
https://pastebin.com/EfcmR3Xx


"Overfitting terjadi ketika model memiliki prediksi yang terlalu baik pada data training,
namun prediksinya buruk pada data testing. Ketika sebuah model overfit, model tidak dapat
melakukan generalisasi dengan baik sehingga akan membuat banyak kesalahan dalam memprediksi
data-data baru yang ditemui pada tahap produksi."
Dimensionality Reduction : LDA, PCA, t-SNE


Principal Component Analysis (PCA)
PCA adalah mereduksi dimensi atau mengurangi jumlah atribut pada dataset tanpa mengurangi informasi.
Contohnya pada sebuah dataset harga rumah. Pada PCA setiap atribut disebut sebagai principal component.
Jika terdapat 10 atribut pada dataset, berarti terdapat 10 principal component.


Linear Discriminant Analysis (LDA)
analisis diskriminan linier adalah teknik statistika yang dipakai untuk reduksi dimensi.
LDA bekerja dengan mencari kombinasi atribut terbaik yang dapat memisahkan kelas-kelas pada dataset dan
meminimalkan varian pada masing-masing kelas. Kontras dengan PCA yang bekerja dengan mencari atribut komponen
yang memiliki varian tertinggi.


t-Distributed Stochastic Neighbor Embedding (t-SNE)
t-SNE dikembangkan oleh Laurens van der Maaten dan Geoffrey Hinton pada tahun 2008. t-SNE adalah teknik
non linear unsupervised yang digunakan untuk reduksi dimensi, eksplorasi data, dan visualisasi data berdimensi tinggi.
Laurens van der Maaten


Support Vector Machine
algoritma training yang bertujuan untuk memaksimalkan margin antara pola pelatihan dan batas keputusan (decision boundary) [10].
Algoritma ini kemudian dikenal luas sebagai Support Vector Machine (SVM). Support Vector Machine adalah model ML multifungsi yang
dapat digunakan untuk menyelesaikan permasalahan klasifikasi, regresi, dan pendeteksian outlier. Termasuk ke dalam kategori
supervised learning, SVM adalah salah satu metode yang paling populer dalam machine learning. Siapa pun yang tertarik untuk
masuk ke dalam dunia ML, perlu mengetahui SVM.


Tujuan dari algoritma SVM adalah untuk menemukan hyperplane terbaik dalam ruang berdimensi-N (ruang dengan N-jumlah fitur)
yang berfungsi sebagai pemisah yang jelas bagi titik-titik data input.
address for learning theori

https://data-flair.training/blogs/svm-kernel-functions/
https://www.stat.cmu.edu/~hseltman/309/Book/chapter4.pdf
https://www.kite.com/blog/python/data-analysis-visualization-python/
https://datascienceguide.github.io/exploratory-data-analysis
https://www.youtube.com/watch?v=zHcQPKP6NpM
address for read about research Object Detection

https://arxiv.org/pdf/1406.4729.pdf)%C3%AC%20%CB%9C
https://arxiv.org/pdf/1512.02325.pdf%EF%BC%89
https://arxiv.org/pdf/1512.02325.pdf%EF%BC%89
https://arxiv.org/pdf/1605.06409.pdf
https://www.cv-foundation.org/openaccess/content_cvpr_2016/papers/Redmon_You_Only_Look_CVPR_2016_paper.pdf
https://software.intel.com/content/www/us/en/develop/documentation/ipp-dev-reference/top/volume-2-image-processing/computer-vision/feature-detection-functions/histogram-of-oriented-gradients-hog-descriptor.html
http://papers.nips.cc/paper/5638-faster-r-cnn-towards-real-time-object-detection-with-region-proposal-networks.pdf
http://openaccess.thecvf.com/content_iccv_2015/papers/Girshick_Fast_R-CNN_ICCV_2015_paper.pdf