Supervise Learning (Klasifikasi) dan Contoh Algoritma Yang Ada Didalamnya
Supervised learning adalah metode dalam machine learning di mana model belajar dari data yang sudah memiliki label atau kategori. Dalam supervised learning, terdapat dua jenis utama yaitu klasifikasi, di mana model akan memprediksi label atau kategori dari data baru, dan regresi, di mana model akan memprediksi nilai numerik. Kali ini, kita akan fokus membahas tentang klasifikasi.
Dalam metode Supervised Learning, klasifikasi adalah proses di mana model belajar untuk mengidentifikasi dan mengelompokkan data baru ke dalam kategori atau kelas yang telah ditentukan sebelumnya berdasarkan pola-pola yang ditemukan dalam data pelatihan berlabel.
Contohnya, jika kita ingin membuat model untuk mengklasifikasikan email sebagai spam atau bukan spam, kita akan memberikan model dengan banyak contoh email yang sudah diberi label sebagai spam atau bukan spam. Model akan belajar dari contoh-contoh ini untuk mengenali karakteristik email spam dan bukan spam, sehingga nantinya dapat mengklasifikasikan email baru dengan benar.
Berikut ini merupakan berbagai macam algoritma supervised learning yang dapat digunakan, baik untuk klasifikasi:
- Logistic Regression: Model linier yang digunakan untuk klasifikasi biner (dua kelas).
- Naive Bayes: Model probabilistik sederhana berdasarkan teorema Bayes.
- K-Nearest Neighbors (KNN): Model yang mengklasifikasikan data baru berdasarkan kedekatannya dengan tetangga terdekatnya.
- Support Vector Machine (SVM): Model yang mencari hyperplane terbaik untuk memisahkan kelas-kelas.
- Decision Tree: Model yang menggunakan struktur pohon untuk membuat keputusan klasifikasi.
- Random Forest: Ensemble dari banyak decision tree.
- Gradient Boosting: Ensemble dari banyak model lemah (weak learners) yang dilatih secara berurutan.
- XGBoost: Implementasi yang efisien dari gradient boosting.
- LightGBM: Implementasi lain yang efisien dari gradient boosting.
- CatBoost: Implementasi gradient boosting yang dirancang untuk menangani data kategorikal.
- Neural Network: Model yang terinspirasi oleh jaringan saraf biologis.
- Multilayer Perceptron (MLP): Jenis neural network yang paling sederhana.
- Convolutional Neural Network (CNN): Jenis neural network yang efektif untuk pengolahan gambar.
- Recurrent Neural Network (RNN): Jenis neural network yang efektif untuk pengolahan data sekuensial (misalnya, teks atau time series).
- Long Short-Term Memory (LSTM): Jenis RNN yang dirancang untuk mengatasi masalah vanishing gradient.
- Gated Recurrent Unit (GRU): Jenis RNN yang mirip dengan LSTM.
- AdaBoost: Ensemble dari banyak model lemah yang dilatih dengan memberikan bobot lebih pada data yang salah diklasifikasikan.
- Bagging: Ensemble dari banyak model yang dilatih pada sampel bootstrap dari data.
- Linear Discriminant Analysis (LDA): Model yang mencari kombinasi linier dari fitur yang memaksimalkan pemisahan kelas.
- Quadratic Discriminant Analysis (QDA): Mirip dengan LDA, tetapi memungkinkan batas keputusan kuadratik.
- Hidden Markov Model (HMM): Model probabilistik untuk data sekuensial.
- Conditional Random Field (CRF): Mirip dengan HMM, tetapi dengan fleksibilitas lebih dalam memodelkan dependensi antar label.
- Maximum Entropy Markov Model (MEMM): Mirip dengan CRF, tetapi dengan perbedaan dalam perhitungan probabilitas.
- Gaussian Mixture Model (GMM): Model probabilistik yang mengasumsikan bahwa data dihasilkan dari campuran distribusi Gaussian.
- Discriminative Restricted Boltzmann Machine (DRBM): Jenis neural network yang digunakan untuk klasifikasi.
- One-vs-Rest (OvR): Strategi untuk mengubah masalah klasifikasi multikelas menjadi beberapa masalah klasifikasi biner.
- One-vs-One (OvO): Strategi lain untuk mengubah masalah klasifikasi multikelas menjadi beberapa masalah klasifikasi biner.
- Error-Correcting Output Codes (ECOC): Strategi untuk meningkatkan kinerja klasifikasi multikelas.
- CalibratedClassifierCV: Metode untuk mengkalibrasi probabilitas yang dihasilkan oleh model klasifikasi.
- StackingClassifier: Ensemble dari beberapa model yang berbeda, di mana model meta digunakan untuk menggabungkan prediksi dari model-model individual.
Komentar
Posting Komentar