6 Metode Algoritma Supervised Learning dalam Data Science

Metode Algoritma Supervised Learning

11 Februari 2022

Supervised learning adalah salah satu pendekatan dalam pembuatan artificial intelligence atau AI. Pendekatan ini terkadang juga disebut dengan istilah supervised machine learning. Lalu, sebenarnya bagaimana supervised learning bekerja dan menghasilkan AI? Untuk mengetahui jawabannya, mari simak penjelasan berikut ini!

Apa itu supervised learning?

Supervised learning adalah suatu metode untuk menciptakan artificial intelligence (AI). Dalam supervised learning, algoritma komputer dilatih dengan input data yang telah diberi label khusus sehingga menghasilkan output tertentu.

Algoritma tersebut dilatih hingga dapat mengenali pola dan mendeteksi hubungan yang mendasari antara data input dan label output. Dengan begitu, nantinya algoritma dapat memberikan hasil pelabelan yang akurat meski data yang disajikan belum pernah ada sebelumnya.

Metode algoritma supervised learning

Ada berbagai macam algoritma sekaligus teknik komputasi yang digunakan dalam proses supervised learning. Berikut adalah beberapa jenis metode algoritma yang paling sering digunakan beserta penjelasan singkatnya.

1. Regresi Linear

Metode algoritma supervised learning yang satu ini biasanya digunakan dalam identifikasi hubungan antara variabel dependen dengan satu (atau lebih) variabel independen. Identifikasi tersebut kemudian digunakan untuk memprediksi hasil di masa depan.

Jika hanya ada satu variabel dependen dan satu variabel independen, maka disebut dengan simple Regresi Linear. Namun, jika terdapat banyak variabel sekaligus, disebut dengan istilah multiple Regresi Linear.

2. K-nearest neighbor

Berikutnya ada metode K-nearest neighbor atau algoritma KNN. Metode ini menggunakan algoritma non-parametrik yang mengelompokkan poin data berdasarkan kedekatan dan juga asosiasi mereka dengan data lain yang tersedia.

Algoritma K-nearest neighbour ini mengasumsikan bahwa titik data yang serupa akan selalu bisa ditemukan di sekitarnya. Konsekuensinya, algoritma ini pun selalu berupaya untuk menghitung jarak antar titik data (biasanya dengan jarak Euclidean) dan kemudian menentukan kategori berdasarkan jenis yang paling sering muncul.

Algoritma supervised learning K-nearest neighbor ini disukai banyak data scientists. Sebab, penggunaannya relatif mudah dan waktu perhitungannya pun cukup rendah. Namun, saat dataset uji terus tumbuh, otomatis waktu pemrosesan pun menjadi semakin lama. Akibatnya, KNN menjadi kurang menarik. Oleh karenanya, KNN lebih sering dimanfaatkan untuk mesin rekomendasi dan pengenalan gambar.

3. Support vector machine (SVM)

Support vector machine merupakan metode algoritma supervised learning yang dikembangkan oleh Vladimir Vapnik. Metode ini biasanya digunakan dalam data classification dan juga regression. Metode support vector machine sering dimanfaatkan dalam masalah klasifikasi serta pembangunan hyperplane atau batas keputusan yang memisahkan kelas-kelas titik data.

4. Naive Bayes

Berikutnya ada Naïve Bayes. Metode ini mengadopsi prinsip kemandirian kelas bersyarat dari Teorema Bayes. Dalam prinsip tersebut, ada tidaknya satu elemen tidak akan memengaruhi komponen lain dalam probabilitas hasil yang akan diberikan. Pun begitu dengan predictor yang mendapatkan efek yang sama.

Naïve Bayes kemudian dibagi menjadi tiga menurut penggolonganya: Multinomial Naïve Bayes, Bernoulli Naïve Bayes, dan Gaussian Naïve Bayes. Teknik ini umumnya digunakan dalam klasifikasi teks, sistem rekomendasi, serta deteksi spam.

5. Random forest

Random forest merupakan algoritma supervised learning yang fleksibel karena dapat digunakan untuk data classification maupun regression. “Forest” di sini menggambarkan kumpulan “pohon” keputusan yang tidak saling berkorelasi, yang kemudian digabungkan menjadi satu guna mengurangi perbedaan dan menghasilkan prediksi data yang jauh lebih akurat.

6. Neural networks

Neural networks paling sering digunakan untuk algoritma pembelajaran yang mendalam. Metode ini melatih data dengan meniru interkonektivitas otak manusia yang saling terhubung melalui lapisan-lapisan node.

Tiap node neural networks terdiri atas input, output, weights, dan bias (atau threshold). Apabila nilai output melebihi threshold yang diberikan, secara otomatis node akan aktif. Setelah node aktif, maka bisa langsung melewati data di lapisan selanjutnya yang ada pada jaringan.

Neural networks mempelajari fungsi tersebut melalui supervised learning, menyesuaikan berdasarkan fungsi yang hilang saat proses gradient descent. Ketika posisi fungsi biaya pada angka (atau mendekati) 0, maka tingkat akurasi model untuk menghasilkan jawaban yang benar pun tinggi.

Kesimpulan

Dari sini, bisa disimpulkan bahwa supervised learning merupakan suatu pendekatan dalam pembuatan AI. Bedanya dengan unsupervised learning, pendekatan ini “melatih” algoritma komputer dengan input data dan output label khusus. Metode penerapannya pun sangat beragam, namun yang paling sering digunakan ada enam, yakni neural networks, naïve Bayes, linear regression, support vector machine, K-nearest neighbour, dan random forest.

Selain supervised learning, ada juga pendekatan unsupervised learning dalam pembuatan AI. Tertarik mempelajari pembuatan AI lebih lanjut? Anda bisa mengikuti kelas data science dari Algoritma Data Science School. Algoritma, menyediakan beragam kelas mengenai data science yang bisa Anda pilih sesuai kebutuhan atau level expertise.

Referensi:

ibm – What is Supervised Learning?

Yuk belajar data science di Algoritma Data Science Education Center! Kamu bisa ikut berbagai kelas data science untuk pemula, salah satunya di program Academy kami.

PELAJARI LEBIH LANJUT

Related Blog

Apa Itu Data Analysis Expressions?

Cara Menjadi Data Scientist Handal

Mengenal Apa Itu Distributed Processing

Supervised learning adalah salah satu pendekatan dalam pembuatan artificial intelligence atau AI. Pendekatan ini terkadang juga disebut dengan istilah supervised machine learning. Lalu, sebenarnya bagaimana supervised learning bekerja dan menghasilkan AI? Untuk mengetahui jawabannya, mari simak penjelasan berikut ini!

Apa itu supervised learning?

Supervised learning adalah suatu metode untuk menciptakan artificial intelligence (AI). Dalam supervised learning, algoritma komputer dilatih dengan input data yang telah diberi label khusus sehingga menghasilkan output tertentu.

Algoritma tersebut dilatih hingga dapat mengenali pola dan mendeteksi hubungan yang mendasari antara data input dan label output. Dengan begitu, nantinya algoritma dapat memberikan hasil pelabelan yang akurat meski data yang disajikan belum pernah ada sebelumnya.

Metode algoritma supervised learning

Ada berbagai macam algoritma sekaligus teknik komputasi yang digunakan dalam proses supervised learning. Berikut adalah beberapa jenis metode algoritma yang paling sering digunakan beserta penjelasan singkatnya.

1. Regresi Linear

Metode algoritma supervised learning yang satu ini biasanya digunakan dalam identifikasi hubungan antara variabel dependen dengan satu (atau lebih) variabel independen. Identifikasi tersebut kemudian digunakan untuk memprediksi hasil di masa depan.

Jika hanya ada satu variabel dependen dan satu variabel independen, maka disebut dengan simple Regresi Linear. Namun, jika terdapat banyak variabel sekaligus, disebut dengan istilah multiple Regresi Linear.

2. K-nearest neighbor

Berikutnya ada metode K-nearest neighbor atau algoritma KNN. Metode ini menggunakan algoritma non-parametrik yang mengelompokkan poin data berdasarkan kedekatan dan juga asosiasi mereka dengan data lain yang tersedia.

Algoritma K-nearest neighbour ini mengasumsikan bahwa titik data yang serupa akan selalu bisa ditemukan di sekitarnya. Konsekuensinya, algoritma ini pun selalu berupaya untuk menghitung jarak antar titik data (biasanya dengan jarak Euclidean) dan kemudian menentukan kategori berdasarkan jenis yang paling sering muncul.

Algoritma supervised learning K-nearest neighbor ini disukai banyak data scientists. Sebab, penggunaannya relatif mudah dan waktu perhitungannya pun cukup rendah. Namun, saat dataset uji terus tumbuh, otomatis waktu pemrosesan pun menjadi semakin lama. Akibatnya, KNN menjadi kurang menarik. Oleh karenanya, KNN lebih sering dimanfaatkan untuk mesin rekomendasi dan pengenalan gambar.

3. Support vector machine (SVM)

Support vector machine merupakan metode algoritma supervised learning yang dikembangkan oleh Vladimir Vapnik. Metode ini biasanya digunakan dalam data classification dan juga regression. Metode support vector machine sering dimanfaatkan dalam masalah klasifikasi serta pembangunan hyperplane atau batas keputusan yang memisahkan kelas-kelas titik data.

4. Naive Bayes

Berikutnya ada Naïve Bayes. Metode ini mengadopsi prinsip kemandirian kelas bersyarat dari Teorema Bayes. Dalam prinsip tersebut, ada tidaknya satu elemen tidak akan memengaruhi komponen lain dalam probabilitas hasil yang akan diberikan. Pun begitu dengan predictor yang mendapatkan efek yang sama.

Naïve Bayes kemudian dibagi menjadi tiga menurut penggolonganya: Multinomial Naïve Bayes, Bernoulli Naïve Bayes, dan Gaussian Naïve Bayes. Teknik ini umumnya digunakan dalam klasifikasi teks, sistem rekomendasi, serta deteksi spam.

5. Random forest

Random forest merupakan algoritma supervised learning yang fleksibel karena dapat digunakan untuk data classification maupun regression. “Forest” di sini menggambarkan kumpulan “pohon” keputusan yang tidak saling berkorelasi, yang kemudian digabungkan menjadi satu guna mengurangi perbedaan dan menghasilkan prediksi data yang jauh lebih akurat.

6. Neural networks

Neural networks paling sering digunakan untuk algoritma pembelajaran yang mendalam. Metode ini melatih data dengan meniru interkonektivitas otak manusia yang saling terhubung melalui lapisan-lapisan node.

Tiap node neural networks terdiri atas input, output, weights, dan bias (atau threshold). Apabila nilai output melebihi threshold yang diberikan, secara otomatis node akan aktif. Setelah node aktif, maka bisa langsung melewati data di lapisan selanjutnya yang ada pada jaringan.

Neural networks mempelajari fungsi tersebut melalui supervised learning, menyesuaikan berdasarkan fungsi yang hilang saat proses gradient descent. Ketika posisi fungsi biaya pada angka (atau mendekati) 0, maka tingkat akurasi model untuk menghasilkan jawaban yang benar pun tinggi.

Kesimpulan

Dari sini, bisa disimpulkan bahwa supervised learning merupakan suatu pendekatan dalam pembuatan AI. Bedanya dengan unsupervised learning, pendekatan ini “melatih” algoritma komputer dengan input data dan output label khusus. Metode penerapannya pun sangat beragam, namun yang paling sering digunakan ada enam, yakni neural networks, naïve Bayes, linear regression, support vector machine, K-nearest neighbour, dan random forest.

Selain supervised learning, ada juga pendekatan unsupervised learning dalam pembuatan AI. Tertarik mempelajari pembuatan AI lebih lanjut? Anda bisa mengikuti kelas data science dari Algoritma Data Science School. Algoritma, menyediakan beragam kelas mengenai data science yang bisa Anda pilih sesuai kebutuhan atau level expertise.

Referensi:

ibm – What is Supervised Learning?

Yuk belajar data science di Algoritma Data Science Education Center! Kamu bisa ikut berbagai kelas data science untuk pemula, salah satunya di program Academy kami.

PELAJARI LEBIH LANJUT