Metode Algoritma Supervised Learning
11 Februari 2022
11 Februari 2022
Supervised learning adalah salah satu pendekatan dalam pembuatan artificial intelligence atau AI. Pendekatan ini terkadang juga disebut dengan istilah supervised machine learning. Lalu, sebenarnya bagaimana supervised learning bekerja dan menghasilkan AI? Untuk mengetahui jawabannya, mari simak penjelasan berikut ini!
Supervised learning adalah suatu metode untuk menciptakan artificial intelligence (AI). Dalam supervised learning, algoritma komputer dilatih dengan input data yang telah diberi label khusus sehingga menghasilkan output tertentu.
Algoritma tersebut dilatih hingga dapat mengenali pola dan mendeteksi hubungan yang mendasari antara data input dan label output. Dengan begitu, nantinya algoritma dapat memberikan hasil pelabelan yang akurat meski data yang disajikan belum pernah ada sebelumnya.
Ada berbagai macam algoritma sekaligus teknik komputasi yang digunakan dalam proses supervised learning. Berikut adalah beberapa jenis metode algoritma yang paling sering digunakan beserta penjelasan singkatnya.
Metode algoritma supervised learning yang satu ini biasanya digunakan dalam identifikasi hubungan antara variabel dependen dengan satu (atau lebih) variabel independen. Identifikasi tersebut kemudian digunakan untuk memprediksi hasil di masa depan.
Jika hanya ada satu variabel dependen dan satu variabel independen, maka disebut dengan simple Regresi Linear. Namun, jika terdapat banyak variabel sekaligus, disebut dengan istilah multiple Regresi Linear.
Berikutnya ada metode K-nearest neighbor atau algoritma KNN. Metode ini menggunakan algoritma non-parametrik yang mengelompokkan poin data berdasarkan kedekatan dan juga asosiasi mereka dengan data lain yang tersedia.
Algoritma K-nearest neighbour ini mengasumsikan bahwa titik data yang serupa akan selalu bisa ditemukan di sekitarnya. Konsekuensinya, algoritma ini pun selalu berupaya untuk menghitung jarak antar titik data (biasanya dengan jarak Euclidean) dan kemudian menentukan kategori berdasarkan jenis yang paling sering muncul.
Algoritma supervised learning K-nearest neighbor ini disukai banyak data scientists. Sebab, penggunaannya relatif mudah dan waktu perhitungannya pun cukup rendah. Namun, saat dataset uji terus tumbuh, otomatis waktu pemrosesan pun menjadi semakin lama. Akibatnya, KNN menjadi kurang menarik. Oleh karenanya, KNN lebih sering dimanfaatkan untuk mesin rekomendasi dan pengenalan gambar.
Support vector machine merupakan metode algoritma supervised learning yang dikembangkan oleh Vladimir Vapnik. Metode ini biasanya digunakan dalam data classification dan juga regression. Metode support vector machine sering dimanfaatkan dalam masalah klasifikasi serta pembangunan hyperplane atau batas keputusan yang memisahkan kelas-kelas titik data.
Berikutnya ada Naïve Bayes. Metode ini mengadopsi prinsip kemandirian kelas bersyarat dari Teorema Bayes. Dalam prinsip tersebut, ada tidaknya satu elemen tidak akan memengaruhi komponen lain dalam probabilitas hasil yang akan diberikan. Pun begitu dengan predictor yang mendapatkan efek yang sama.
Naïve Bayes kemudian dibagi menjadi tiga menurut penggolonganya: Multinomial Naïve Bayes, Bernoulli Naïve Bayes, dan Gaussian Naïve Bayes. Teknik ini umumnya digunakan dalam klasifikasi teks, sistem rekomendasi, serta deteksi spam.
Random forest merupakan algoritma supervised learning yang fleksibel karena dapat digunakan untuk data classification maupun regression. “Forest” di sini menggambarkan kumpulan “pohon” keputusan yang tidak saling berkorelasi, yang kemudian digabungkan menjadi satu guna mengurangi perbedaan dan menghasilkan prediksi data yang jauh lebih akurat.
Neural networks paling sering digunakan untuk algoritma pembelajaran yang mendalam. Metode ini melatih data dengan meniru interkonektivitas otak manusia yang saling terhubung melalui lapisan-lapisan node.
Tiap node neural networks terdiri atas input, output, weights, dan bias (atau threshold). Apabila nilai output melebihi threshold yang diberikan, secara otomatis node akan aktif. Setelah node aktif, maka bisa langsung melewati data di lapisan selanjutnya yang ada pada jaringan.
Neural networks mempelajari fungsi tersebut melalui supervised learning, menyesuaikan berdasarkan fungsi yang hilang saat proses gradient descent. Ketika posisi fungsi biaya pada angka (atau mendekati) 0, maka tingkat akurasi model untuk menghasilkan jawaban yang benar pun tinggi.
Dari sini, bisa disimpulkan bahwa supervised learning merupakan suatu pendekatan dalam pembuatan AI. Bedanya dengan unsupervised learning, pendekatan ini “melatih” algoritma komputer dengan input data dan output label khusus. Metode penerapannya pun sangat beragam, namun yang paling sering digunakan ada enam, yakni neural networks, naïve Bayes, linear regression, support vector machine, K-nearest neighbour, dan random forest.
Selain supervised learning, ada juga pendekatan unsupervised learning dalam pembuatan AI. Tertarik mempelajari pembuatan AI lebih lanjut? Anda bisa mengikuti kelas data science dari Algoritma Data Science School. Algoritma, menyediakan beragam kelas mengenai data science yang bisa Anda pilih sesuai kebutuhan atau level expertise.
Referensi:
Supervised learning adalah salah satu pendekatan dalam pembuatan artificial intelligence atau AI. Pendekatan ini terkadang juga disebut dengan istilah supervised machine learning. Lalu, sebenarnya bagaimana supervised learning bekerja dan menghasilkan AI? Untuk mengetahui jawabannya, mari simak penjelasan berikut ini!
Supervised learning adalah suatu metode untuk menciptakan artificial intelligence (AI). Dalam supervised learning, algoritma komputer dilatih dengan input data yang telah diberi label khusus sehingga menghasilkan output tertentu.
Algoritma tersebut dilatih hingga dapat mengenali pola dan mendeteksi hubungan yang mendasari antara data input dan label output. Dengan begitu, nantinya algoritma dapat memberikan hasil pelabelan yang akurat meski data yang disajikan belum pernah ada sebelumnya.
Ada berbagai macam algoritma sekaligus teknik komputasi yang digunakan dalam proses supervised learning. Berikut adalah beberapa jenis metode algoritma yang paling sering digunakan beserta penjelasan singkatnya.
Metode algoritma supervised learning yang satu ini biasanya digunakan dalam identifikasi hubungan antara variabel dependen dengan satu (atau lebih) variabel independen. Identifikasi tersebut kemudian digunakan untuk memprediksi hasil di masa depan.
Jika hanya ada satu variabel dependen dan satu variabel independen, maka disebut dengan simple Regresi Linear. Namun, jika terdapat banyak variabel sekaligus, disebut dengan istilah multiple Regresi Linear.
Berikutnya ada metode K-nearest neighbor atau algoritma KNN. Metode ini menggunakan algoritma non-parametrik yang mengelompokkan poin data berdasarkan kedekatan dan juga asosiasi mereka dengan data lain yang tersedia.
Algoritma K-nearest neighbour ini mengasumsikan bahwa titik data yang serupa akan selalu bisa ditemukan di sekitarnya. Konsekuensinya, algoritma ini pun selalu berupaya untuk menghitung jarak antar titik data (biasanya dengan jarak Euclidean) dan kemudian menentukan kategori berdasarkan jenis yang paling sering muncul.
Algoritma supervised learning K-nearest neighbor ini disukai banyak data scientists. Sebab, penggunaannya relatif mudah dan waktu perhitungannya pun cukup rendah. Namun, saat dataset uji terus tumbuh, otomatis waktu pemrosesan pun menjadi semakin lama. Akibatnya, KNN menjadi kurang menarik. Oleh karenanya, KNN lebih sering dimanfaatkan untuk mesin rekomendasi dan pengenalan gambar.
Support vector machine merupakan metode algoritma supervised learning yang dikembangkan oleh Vladimir Vapnik. Metode ini biasanya digunakan dalam data classification dan juga regression. Metode support vector machine sering dimanfaatkan dalam masalah klasifikasi serta pembangunan hyperplane atau batas keputusan yang memisahkan kelas-kelas titik data.
Berikutnya ada Naïve Bayes. Metode ini mengadopsi prinsip kemandirian kelas bersyarat dari Teorema Bayes. Dalam prinsip tersebut, ada tidaknya satu elemen tidak akan memengaruhi komponen lain dalam probabilitas hasil yang akan diberikan. Pun begitu dengan predictor yang mendapatkan efek yang sama.
Naïve Bayes kemudian dibagi menjadi tiga menurut penggolonganya: Multinomial Naïve Bayes, Bernoulli Naïve Bayes, dan Gaussian Naïve Bayes. Teknik ini umumnya digunakan dalam klasifikasi teks, sistem rekomendasi, serta deteksi spam.
Random forest merupakan algoritma supervised learning yang fleksibel karena dapat digunakan untuk data classification maupun regression. “Forest” di sini menggambarkan kumpulan “pohon” keputusan yang tidak saling berkorelasi, yang kemudian digabungkan menjadi satu guna mengurangi perbedaan dan menghasilkan prediksi data yang jauh lebih akurat.
Neural networks paling sering digunakan untuk algoritma pembelajaran yang mendalam. Metode ini melatih data dengan meniru interkonektivitas otak manusia yang saling terhubung melalui lapisan-lapisan node.
Tiap node neural networks terdiri atas input, output, weights, dan bias (atau threshold). Apabila nilai output melebihi threshold yang diberikan, secara otomatis node akan aktif. Setelah node aktif, maka bisa langsung melewati data di lapisan selanjutnya yang ada pada jaringan.
Neural networks mempelajari fungsi tersebut melalui supervised learning, menyesuaikan berdasarkan fungsi yang hilang saat proses gradient descent. Ketika posisi fungsi biaya pada angka (atau mendekati) 0, maka tingkat akurasi model untuk menghasilkan jawaban yang benar pun tinggi.
Dari sini, bisa disimpulkan bahwa supervised learning merupakan suatu pendekatan dalam pembuatan AI. Bedanya dengan unsupervised learning, pendekatan ini “melatih” algoritma komputer dengan input data dan output label khusus. Metode penerapannya pun sangat beragam, namun yang paling sering digunakan ada enam, yakni neural networks, naïve Bayes, linear regression, support vector machine, K-nearest neighbour, dan random forest.
Selain supervised learning, ada juga pendekatan unsupervised learning dalam pembuatan AI. Tertarik mempelajari pembuatan AI lebih lanjut? Anda bisa mengikuti kelas data science dari Algoritma Data Science School. Algoritma, menyediakan beragam kelas mengenai data science yang bisa Anda pilih sesuai kebutuhan atau level expertise.
Referensi: