fbpx

 Mengapa logistic regression itu penting?

Logistic regression

Mengapa logistic regression itu penting?

4 Maret 2022

Jika baru terjun ke bidang analitik data, Anda perlu meluangkan waktu untuk memahami berbagai tekniknya. Salah satu jenis analisis khusus yang digunakan data analyst adalah logistic regression. Apa itu logistic regression dan apa kegunaannya? Artikel ini akan membantu Anda memahami pengertiannya secara umum.

Apa itu logistic regression?

Logistic regression adalah jenis analisis statistik yang sering digunakan data analyst untuk pemodelan prediktif. Dalam pendekatan analitik ini, variabel dependennya terbatas atau kategoris, bisa berupa A atau B (regresi biner) atau berbagai opsi hingga A, B, C atau D (regresi multinomial). Jenis analisis statistik digunakan dalam software statistik untuk memahami hubungan antara variabel dependen dan satu atau lebih variabel independen dengan memperkirakan probabilitas. Jenis analisis ini dapat membantu Anda memprediksi kemungkinan. 

Contohnya, katakanlah Anda ingin mengetahui kemungkinan pengunjung memilih atau tidak memilih penawaran yang dibuat di website Anda (variabel terikat). Anda dapat melakukan analisis dengan melihat karakteristik pengunjung, seperti situs asal mereka, kunjungan berulang ke situs Anda, hingga perilaku di situs Anda (variabel independen).

Logistic regression membantu Anda menentukan kemungkinan jenis pengunjung apa yang cenderung menerima tawaran tersebut. Dengan begitu, Anda dapat membuat keputusan yang lebih baik untuk mempromosikan penawaran atau membuat perubahan pada penawaran itu sendiri.

Tipe-tipe logistic regression

Terdapat tiga jenis utama logistic regression yang berbeda dalam eksekusi dan teori. Berikut penjelasannya:

1. Binary logistic regression

Dalam kebutuhan mengklasifikasikan suatu objek, binary logistic regression hanya menyediakan dua kemungkinan jawaban. Konsep ini biasanya direpresentasikan sebagai 0 atau 1 dalam pengkodean. Contohnya, menilai risiko kanker (hasilnya tinggi atau rendah).

2. Multinomial logistic regression

Model ini menyediakan beberapa kelas yang dapat diklasifikasikan sebagai item. Ada satu set yang terdiri dari tiga atau lebih kelas yang telah ditentukan dan disiapkan sebelum menjalankan model. Contohnya, memprediksi apakah seorang siswa akan melanjutkan ke perguruan tinggi, sekolah perdagangan, atau ke dunia kerja.

3. Ordinal regresi logistik

Tipe ini juga merupakan model di mana ada beberapa kelas yang dapat diklasifikasikan sebagai item, namun butuh pengurutan kelas. Kelas tidak perlu proporsional dan jarak antar tiap kelas bisa berbeda-beda. Contohnya, peringkat restoran pada skala 0 hingga 5 bintang.

Mengapa logistic regression itu penting?

Model prediktif yang dibangun menggunakan pendekatan ini dapat membuat perbedaan positif dalam bisnis karena membantu Anda memahami hubungan dan memprediksi hasil, sehingga Anda dapat bertindak untuk meningkatkan pengambilan keputusan.

Contohnya, tim analitik pabrik dapat menggunakan analisis logistic regression untuk menemukan kemungkinan antara kegagalan suku cadang dalam mesin dan lamanya suku cadang tersebut disimpan dalam inventaris. Dengan informasi yang diterima dari analisis ini, tim dapat memutuskan penyesuaian jadwal pengiriman atau waktu pemasangan untuk mengeliminasi kegagalan di masa mendatang.

Penggunaan logistic regression dalam berbagai sektor pekerjaan

Logistic regression banyak digunakan dalam berbagai sektor pekerjaan, berikut beberapa contohnya:

1. Sektor perbankan

Jenis analisis statistik ini bisa dipakai untuk memprediksi kemampuan nasabah bank membayar pinjaman. Perhitungan ini dibuat bank saat memutuskan apakah bank akan memberi pinjaman kepada pelanggan atau tidak dan menilai jumlah maksimum yang akan diberikan kepada pelanggan yang dianggap layak.

Untuk melakukan perhitungan ini, bank akan melihat beberapa faktor (variabel independen berupa skor kredit, tingkat pendapatan, usia, status pekerjaan, jenis kelamin, dan lain-lain) dan menjadikan pinjaman sebagai target dalam logistic regression. Berdasarkan kemungkinan default yang dihitung, bank akan memutuskan untuk menerima atau menolak ajuan pinjaman.

 2. Sektor medis

Logistic regression juga sering digunakan untuk penelitian medis dan oleh perusahaan asuransi. Dalam menghitung risiko kanker, misalnya, peneliti akan menganalisis kebiasaan pasien dan kecenderungan genetik sebagai faktor prediktif. Untuk menilai apakah pasien berisiko tinggi terkena kanker atau tidak, faktor-faktor seperti usia, ras, berat badan, kebiasaan merokok, kebiasaan olahraga, riwayat medis secara keseluruhan, hingga riwayat keluarga kanker dan tempat tinggal akan dipertimbangkan.

Kesimpulan

Logistic regression adalah jenis analisis statistik yang digunakan oleh para profesional di banyak industri untuk mengklasifikasikan data demi beberapa tujuan berbeda. Dari sektor bank hingga peneliti medis, keinginan untuk dapat lebih memahami data dan memprediksi trend dengan lebih baik membuat jenis analisis statistik terasa manfaatnya. Data analyst bisa menggunakannya untuk membuat prediksi tentang data masa depan sebelum data tersebut tersedia.

Yuk, daftar kelas data science dari Algoritma Data Science School untuk mempelajari lebih jauh soal logistic regression dan hal-hal lain terkait data science. Algoritma Data Science School menawarkan banyak kelas mengenai data science yang bisa Anda pilih sesuai kebutuhan atau level expertise!

Referensi:

Yuk belajar data science di Algoritma Data Science Education Center! Kamu bisa ikut berbagai kelas data science untuk pemula, salah satunya di program Academy kami.

PELAJARI LEBIH LANJUT

The last comment needs to be approved.

Related Blog

Distributed Processing
Apa Itu Data Analysis Expressions?
jadi data scientist
Cara Menjadi Data Scientist Handal
Distributed Processing
Mengenal Apa Itu Distributed Processing

Jika baru terjun ke bidang analitik data, Anda perlu meluangkan waktu untuk memahami berbagai tekniknya. Salah satu jenis analisis khusus yang digunakan data analyst adalah logistic regression. Apa itu logistic regression dan apa kegunaannya? Artikel ini akan membantu Anda memahami pengertiannya secara umum.

Apa itu logistic regression?

Logistic regression adalah jenis analisis statistik yang sering digunakan data analyst untuk pemodelan prediktif. Dalam pendekatan analitik ini, variabel dependennya terbatas atau kategoris, bisa berupa A atau B (regresi biner) atau berbagai opsi hingga A, B, C atau D (regresi multinomial). Jenis analisis statistik digunakan dalam software statistik untuk memahami hubungan antara variabel dependen dan satu atau lebih variabel independen dengan memperkirakan probabilitas. Jenis analisis ini dapat membantu Anda memprediksi kemungkinan. 

Contohnya, katakanlah Anda ingin mengetahui kemungkinan pengunjung memilih atau tidak memilih penawaran yang dibuat di website Anda (variabel terikat). Anda dapat melakukan analisis dengan melihat karakteristik pengunjung, seperti situs asal mereka, kunjungan berulang ke situs Anda, hingga perilaku di situs Anda (variabel independen).

Logistic regression membantu Anda menentukan kemungkinan jenis pengunjung apa yang cenderung menerima tawaran tersebut. Dengan begitu, Anda dapat membuat keputusan yang lebih baik untuk mempromosikan penawaran atau membuat perubahan pada penawaran itu sendiri.

Tipe-tipe logistic regression

Terdapat tiga jenis utama logistic regression yang berbeda dalam eksekusi dan teori. Berikut penjelasannya:

1. Binary logistic regression

Dalam kebutuhan mengklasifikasikan suatu objek, binary logistic regression hanya menyediakan dua kemungkinan jawaban. Konsep ini biasanya direpresentasikan sebagai 0 atau 1 dalam pengkodean. Contohnya, menilai risiko kanker (hasilnya tinggi atau rendah).

2. Multinomial logistic regression

Model ini menyediakan beberapa kelas yang dapat diklasifikasikan sebagai item. Ada satu set yang terdiri dari tiga atau lebih kelas yang telah ditentukan dan disiapkan sebelum menjalankan model. Contohnya, memprediksi apakah seorang siswa akan melanjutkan ke perguruan tinggi, sekolah perdagangan, atau ke dunia kerja.

3. Ordinal regresi logistik

Tipe ini juga merupakan model di mana ada beberapa kelas yang dapat diklasifikasikan sebagai item, namun butuh pengurutan kelas. Kelas tidak perlu proporsional dan jarak antar tiap kelas bisa berbeda-beda. Contohnya, peringkat restoran pada skala 0 hingga 5 bintang.

Mengapa logistic regression itu penting?

Model prediktif yang dibangun menggunakan pendekatan ini dapat membuat perbedaan positif dalam bisnis karena membantu Anda memahami hubungan dan memprediksi hasil, sehingga Anda dapat bertindak untuk meningkatkan pengambilan keputusan.

Contohnya, tim analitik pabrik dapat menggunakan analisis logistic regression untuk menemukan kemungkinan antara kegagalan suku cadang dalam mesin dan lamanya suku cadang tersebut disimpan dalam inventaris. Dengan informasi yang diterima dari analisis ini, tim dapat memutuskan penyesuaian jadwal pengiriman atau waktu pemasangan untuk mengeliminasi kegagalan di masa mendatang.

Penggunaan logistic regression dalam berbagai sektor pekerjaan

Logistic regression banyak digunakan dalam berbagai sektor pekerjaan, berikut beberapa contohnya:

1. Sektor perbankan

Jenis analisis statistik ini bisa dipakai untuk memprediksi kemampuan nasabah bank membayar pinjaman. Perhitungan ini dibuat bank saat memutuskan apakah bank akan memberi pinjaman kepada pelanggan atau tidak dan menilai jumlah maksimum yang akan diberikan kepada pelanggan yang dianggap layak.

Untuk melakukan perhitungan ini, bank akan melihat beberapa faktor (variabel independen berupa skor kredit, tingkat pendapatan, usia, status pekerjaan, jenis kelamin, dan lain-lain) dan menjadikan pinjaman sebagai target dalam logistic regression. Berdasarkan kemungkinan default yang dihitung, bank akan memutuskan untuk menerima atau menolak ajuan pinjaman.

 2. Sektor medis

Logistic regression juga sering digunakan untuk penelitian medis dan oleh perusahaan asuransi. Dalam menghitung risiko kanker, misalnya, peneliti akan menganalisis kebiasaan pasien dan kecenderungan genetik sebagai faktor prediktif. Untuk menilai apakah pasien berisiko tinggi terkena kanker atau tidak, faktor-faktor seperti usia, ras, berat badan, kebiasaan merokok, kebiasaan olahraga, riwayat medis secara keseluruhan, hingga riwayat keluarga kanker dan tempat tinggal akan dipertimbangkan.

Kesimpulan

Logistic regression adalah jenis analisis statistik yang digunakan oleh para profesional di banyak industri untuk mengklasifikasikan data demi beberapa tujuan berbeda. Dari sektor bank hingga peneliti medis, keinginan untuk dapat lebih memahami data dan memprediksi trend dengan lebih baik membuat jenis analisis statistik terasa manfaatnya. Data analyst bisa menggunakannya untuk membuat prediksi tentang data masa depan sebelum data tersebut tersedia.

Yuk, daftar kelas data science dari Algoritma Data Science School untuk mempelajari lebih jauh soal logistic regression dan hal-hal lain terkait data science. Algoritma Data Science School menawarkan banyak kelas mengenai data science yang bisa Anda pilih sesuai kebutuhan atau level expertise!

Referensi:

Yuk belajar data science di Algoritma Data Science Education Center! Kamu bisa ikut berbagai kelas data science untuk pemula, salah satunya di program Academy kami.

PELAJARI LEBIH LANJUT

Related Blog

Real Time Processing
Perbedaan Batch Processing dan Real Time Processing
Metode Pengolahan Data
Tipe, Langkah, dan Metode Pengolahan Data
Batch Processing
Mengenal Batch Processing dan Implementasinya
The last comment needs to be approved.