fbpx

Naive Bayes

Naive Bayes, Metode Klasifikasi Algoritma yang Simpel dan Efektif

30 Maret 2022

Naive Bayes adalah metode klasifikasi data berdasarkan probabilitas yang bisa saja terjadi di masa depan. Metode ini dianggap simpel dan efektif untuk diterapkan dalam analisis perusahaan. Lantas, bagaimana sistem kerja klasifikasi tersebut dan bagaimana penerapannya dalam perusahaan?

Apa Itu Naive Bayes? 

Naive Bayes adalah metode yang cocok untuk klasifikasi biner dan multiclass. Metode yang juga dikenal sebagai Naive Bayes Classifier ini menerapkan teknik supervised klasifikasi objek di masa depan dengan menetapkan label kelas ke instance/catatan menggunakan probabilitas bersyarat. Probabilitas bersyarat adalah ukuran peluang suatu peristiwa yang terjadi berdasarkan peristiwa lain yang telah (dengan asumsi, praduga, pernyataan, atau terbukti) terjadi. 

Istilah supervised merujuk pada klasifikasi training data yang sudah diberi label dengan kelas. Misalnya, sebuah transaksi penipuan telah ditandai sebagai data transaksional. Kemudian, jika Anda ingin mengklasifikasikan transaksi di masa depan menjadi fraudulent/non-fraudulent (penipuan/non-penipuan), maka jenis klasifikasi itu akan disebut sebagai supervised.

Nah, model machine learning yang diterapkan pada program tersebut menggunakan teorema Bayes yang dirumuskan sebagai berikut:

P(A│B) = P(B│A)P(A)P(B)

Keterangan:

P(A│B) : Probabilitas A terjadi dengan bukti bahwa B telah terjadi (probabilitas superior)

P(B│A) : Probabilitas B terjadi dengan bukti bahwa A telah terjadi

P(A) : Peluang terjadinya A

P(B) : Peluang terjadinya B

Dalam istilah yang lebih sederhana, Teorem Bayes adalah rumus matematika sederhana untuk menemukan probabilitas ketika kita mengetahui probabilitas tertentu lainnya.

Tujuan dan Contoh Penerapan Naive Bayes

Seperti yang telah disebutkan di atas, tujuan metode ini adalah mengklasifikasikan probabilitas berdasarkan pembelajaran mesin atas probabilitas lain. Teknik ini dapat dimanfaatkan untuk mengevaluasi banyak hal, seperti misalnya prakiraan cuaca. Prakirawan cuaca dapat memprediksi apakah besok akan cerah, hujan, atau berangin berdasarkan suhu, kelembapan, tekanan, dan lain-lain. 

Media sosial juga dapat menampilkan konten-konten yang kemungkinan Anda sukai berdasarkan konten yang telah Anda lihat sebelumnya. Selain itu, metode ini juga efektif untuk menganalisis ancaman fraud/penipuan. Dengan memprediksi ancaman-ancaman yang muncul, Anda dapat mengambil solusi lebih awal untuk menghindari hal-hal yang tidak diinginkan.

Metode ini juga dapat diterapkan petugas bank untuk memprediksi apakah pemohon pinjaman akan menjadi defaulter/non-defaulter bank berdasarkan data jumlah pinjaman, angsuran bulanan, tenor, jumlah tunggakan, pendapatan tahunan, dan rasio utang. Berdasarkan pelabelan yang di-input, petugas bank mampu membuat keputusan apakah akan memberikan pinjaman pada pemohon dan berapa banyak kredit serta suku bunga yang kira-kira dapat diterima oleh pemohon.

Pada sektor medis dan kesehatan, dokter dapat memprediksi keberhasilan pengobatan atau kondisi pasien berdasarkan data seperti tekanan darah, kadar hemoglobin, kadar gula darah, nama obat yang diberikan, jenis pengobatan, dan sebagainya. Melalui data ini, dokter dapat menentukan metode pengobatan dan alternatif selanjutnya.

Tipe Naive Bayes Classifier

Metode Naive Bayes digolongkan menjadi beberapa tipe berdasarkan fungsinya. Berikut ini penjelasannya.

1. Multinomial Naive Bayes

Salah satu tipe metode Naive Bayes adalah Multinomial yang sebagian besar digunakan untuk mengklasifikasi kategori dokumen. Sebuah dokumen dapat dikategorikan bertema olahraga, politik, teknologi, atau lain-lain berdasarkan frekuensi kata-kata yang muncul dalam dokumen.

2. Bernoulli Naive Bayes

Tipe ini mirip dengan tipe Multinomial, namun klasifikasinya lebih berfokus pada hasil ya/tidak. Prediktor yang di-input adalah variabel boolean. Misalnya, prediksi atas sebuah kata muncul dalam teks atau tidak.

3. Gaussian Naive Bayes

Distribusi Gaussian adalah asumsi pendistribusian nilai kontinu yang terkait dengan setiap fitur berisi nilai numerik. Ketika diplot, akan muncul kurva berbentuk lonceng yang simetris tentang rata-rata nilai fitur.

Kesimpulan 

Berdasarkan uraian di atas, dapat ditarik kesimpulan bahwa Naive Bayes adalah metode klasifikasi data berdasarkan faktor-faktor probabilitas. Metode ini adalah solusi terbaik bagi Anda yang ingin memprediksi hal-hal penting terkait bisnis atau perusahaan Anda.

Tertarik untuk mempelajari lebih jauh tentang metode ini? Ikuti kelas data science dari Algoritma Data Science School. Algoritma Data Science School menyediakan berbagai kelas data science yang mengakomodasi berbagai kebutuhan maupun level expertise Anda.

Referensi:

Yuk belajar data science di Algoritma Data Science Education Center! Kamu bisa ikut berbagai kelas data science untuk pemula, salah satunya di program Academy kami.

PELAJARI LEBIH LANJUT

Related Blog

Distributed Processing
Apa Itu Data Analysis Expressions?
jadi data scientist
Cara Menjadi Data Scientist Handal
Distributed Processing
Mengenal Apa Itu Distributed Processing

Naive Bayes adalah metode klasifikasi data berdasarkan probabilitas yang bisa saja terjadi di masa depan. Metode ini dianggap simpel dan efektif untuk diterapkan dalam analisis perusahaan. Lantas, bagaimana sistem kerja klasifikasi tersebut dan bagaimana penerapannya dalam perusahaan?

Apa Itu Naive Bayes? 

Naive Bayes adalah metode yang cocok untuk klasifikasi biner dan multiclass. Metode yang juga dikenal sebagai Naive Bayes Classifier ini menerapkan teknik supervised klasifikasi objek di masa depan dengan menetapkan label kelas ke instance/catatan menggunakan probabilitas bersyarat. Probabilitas bersyarat adalah ukuran peluang suatu peristiwa yang terjadi berdasarkan peristiwa lain yang telah (dengan asumsi, praduga, pernyataan, atau terbukti) terjadi. 

Istilah supervised merujuk pada klasifikasi training data yang sudah diberi label dengan kelas. Misalnya, sebuah transaksi penipuan telah ditandai sebagai data transaksional. Kemudian, jika Anda ingin mengklasifikasikan transaksi di masa depan menjadi fraudulent/non-fraudulent (penipuan/non-penipuan), maka jenis klasifikasi itu akan disebut sebagai supervised.

Nah, model machine learning yang diterapkan pada program tersebut menggunakan teorema Bayes yang dirumuskan sebagai berikut:

P(A│B) = P(B│A)P(A)P(B)

Keterangan:

P(A│B) : Probabilitas A terjadi dengan bukti bahwa B telah terjadi (probabilitas superior)

P(B│A) : Probabilitas B terjadi dengan bukti bahwa A telah terjadi

P(A) : Peluang terjadinya A

P(B) : Peluang terjadinya B

Dalam istilah yang lebih sederhana, Teorem Bayes adalah rumus matematika sederhana untuk menemukan probabilitas ketika kita mengetahui probabilitas tertentu lainnya.

Tujuan dan Contoh Penerapan Naive Bayes

Seperti yang telah disebutkan di atas, tujuan metode ini adalah mengklasifikasikan probabilitas berdasarkan pembelajaran mesin atas probabilitas lain. Teknik ini dapat dimanfaatkan untuk mengevaluasi banyak hal, seperti misalnya prakiraan cuaca. Prakirawan cuaca dapat memprediksi apakah besok akan cerah, hujan, atau berangin berdasarkan suhu, kelembapan, tekanan, dan lain-lain. 

Media sosial juga dapat menampilkan konten-konten yang kemungkinan Anda sukai berdasarkan konten yang telah Anda lihat sebelumnya. Selain itu, metode ini juga efektif untuk menganalisis ancaman fraud/penipuan. Dengan memprediksi ancaman-ancaman yang muncul, Anda dapat mengambil solusi lebih awal untuk menghindari hal-hal yang tidak diinginkan.

Metode ini juga dapat diterapkan petugas bank untuk memprediksi apakah pemohon pinjaman akan menjadi defaulter/non-defaulter bank berdasarkan data jumlah pinjaman, angsuran bulanan, tenor, jumlah tunggakan, pendapatan tahunan, dan rasio utang. Berdasarkan pelabelan yang di-input, petugas bank mampu membuat keputusan apakah akan memberikan pinjaman pada pemohon dan berapa banyak kredit serta suku bunga yang kira-kira dapat diterima oleh pemohon.

Pada sektor medis dan kesehatan, dokter dapat memprediksi keberhasilan pengobatan atau kondisi pasien berdasarkan data seperti tekanan darah, kadar hemoglobin, kadar gula darah, nama obat yang diberikan, jenis pengobatan, dan sebagainya. Melalui data ini, dokter dapat menentukan metode pengobatan dan alternatif selanjutnya.

Tipe Naive Bayes Classifier

Metode Naive Bayes digolongkan menjadi beberapa tipe berdasarkan fungsinya. Berikut ini penjelasannya.

1. Multinomial Naive Bayes

Salah satu tipe metode Naive Bayes adalah Multinomial yang sebagian besar digunakan untuk mengklasifikasi kategori dokumen. Sebuah dokumen dapat dikategorikan bertema olahraga, politik, teknologi, atau lain-lain berdasarkan frekuensi kata-kata yang muncul dalam dokumen.

2. Bernoulli Naive Bayes

Tipe ini mirip dengan tipe Multinomial, namun klasifikasinya lebih berfokus pada hasil ya/tidak. Prediktor yang di-input adalah variabel boolean. Misalnya, prediksi atas sebuah kata muncul dalam teks atau tidak.

3. Gaussian Naive Bayes

Distribusi Gaussian adalah asumsi pendistribusian nilai kontinu yang terkait dengan setiap fitur berisi nilai numerik. Ketika diplot, akan muncul kurva berbentuk lonceng yang simetris tentang rata-rata nilai fitur.

Kesimpulan 

Berdasarkan uraian di atas, dapat ditarik kesimpulan bahwa Naive Bayes adalah metode klasifikasi data berdasarkan faktor-faktor probabilitas. Metode ini adalah solusi terbaik bagi Anda yang ingin memprediksi hal-hal penting terkait bisnis atau perusahaan Anda.

Tertarik untuk mempelajari lebih jauh tentang metode ini? Ikuti kelas data science dari Algoritma Data Science School. Algoritma Data Science School menyediakan berbagai kelas data science yang mengakomodasi berbagai kebutuhan maupun level expertise Anda.

Referensi:

Yuk belajar data science di Algoritma Data Science Education Center! Kamu bisa ikut berbagai kelas data science untuk pemula, salah satunya di program Academy kami.

PELAJARI LEBIH LANJUT

Related Blog

Real Time Processing
Perbedaan Batch Processing dan Real Time Processing
Metode Pengolahan Data
Tipe, Langkah, dan Metode Pengolahan Data
Batch Processing
Mengenal Batch Processing dan Implementasinya