Belajar Data Science Lewat Video 60 Detik!

By Safa   |   Desember 4, 2019

Belajar Data Science

Yuk belajar data science melalui Program Youtube Team Algoritma, “60 Seconds Data Science.” Program ini akan mengupas data science secara singkat selama 60 detik bersama dengan Instructor Algoritma. Pembahasan yang dipaparkan juga akan beragam, mulai dari  programming, statistics, hingga machine learning. Instructor Algoritma sendiri pun merasa tertantang untuk menjelaskan data science dalam 60 detik. Mereka sebisa mungkin berusaha menyederhanakan bahasa data science yang biasa mereka gunakan agar memudahkan orang awam untuk belajar data science.

Episode 1: Apa itu Data Science?

Data science merupakan disiplin dari 3 macam ilmu, yaitu statistics, computer science, dan business knowledge. Nah, untuk menguasai data science sendiri pertama-tama kita harus mengetahui domain problem yang ingin kita selesaikan. Setelah mengetahui masalah tersebut, kita dapat menyelesaikan masalahnya menggunakan machine learning. Untuk dapat menggunakan machine learning, kita diharuskan memiliki kemampuan statistik dan programming. Untuk itulah ketiga disiplin ilmu tersebut sangat penting untuk dikuasai seorang Data Scientist.

Episode 2: Statistik dalam Data Science

Sebelum membahas statistik di dalam data science, kita harus mengetahui workflow data science yang terdiri dari importing data – exploratory data analysis – modelling – interpretation. Statistik sendiri berperan saat melakukan exploratory data analysis dan modelling. Tanpa mengetahui ilmu statistik pasti kita akan kesulitan dalam melakukan kedua hal tersebut. Statistik juga terdiri dari dua macam, yaitu statistik deskriptif dan statistik inferensial. 

Episode 3: Programming dalam Data Science

Untuk menguasai data science, salah satu skill yang dibutuhkan adalah programming. Di dalam programming sendiri ada bahasa pemrograman yang paling sering digunakan, yaitu R dan Python. R digunakan saat kita melakukan exploratory data analysis, melakukan visualisasi data, serta membuat report. Sementara itu, Python digunakan ketika model kita sudah jadi dan kita ingin memasukan model machine learning tersebut ke dalam aplikasi atau ke dalam website.

Episode 4: Business Knowledge dalam Data Science

Salah satu hal terpenting berikutnya untuk menguasai data science adalah kemampuan business knowledge. Business Knowledge sendiri berperan ketika kita ingin menentukan apa masalah bisnis kita, membuat model, dan menginterpretasikan hasil yang kita dapatkan dari model tersebut.

Contohnya: perusahaan kita ingin merekomendasikan produk kepada customer, tentunya kita harus mengetahui customer mana saja yang paling tepat untuk mendapatkan rekomendasi tersebut. Untuk mengetahui hal tersebut, kita dapat membuat model yang dapat merekomendasikan customer mana saja yang memiliki probabilitas tinggi untuk melakukan repurchase (paling baik untuk kita rekomendasikan). 

Episode 5: Machine Learning dalam Data Science

Machine learning merupakan salah satu cabang dari Artificial Intelligence yang bertujuan untuk membuat suatu sistem yang dapat belajar sendiri menggunakan data-data yang sudah ada. Di machine learning sendiri kita akan menggunakan data historis kita dan kemudian kita olah menggunakan pendekatan statistik. Hal ini dilakukan untuk memahami data kita dan membuat model prediksi. Machine learning sendiri sudah banyak digunakan di berbagai industri.

Contohnya: pengunaan machine learning di bidang Human Resource. Umumnya suatu perusahaan ingin mengetahui apakah suatu karyawannya ingin resign atau tidak dari perusahaan mereka. HR sendiri dapat menggunakan data employee attrition yang berisi data-data karyawan selama bekerja di sebuah perusahaan. 

Episode 6: Supervised Learning dan Unsupervised Learning

Perbedaan mendasar dari supervised dan unsupervised learning berada di target variabelnya. Kita dapat menggunakan supervised learning ketika kita ingin memprediksi sesuatu yang memiliki target variabel, sementara unsupervised learning digunakan jika tidak memiliki variabel.

Contohnya: ketika kita ingin memprediksi nilai profit, kita dapat menggunakan supervised learning karena nilai profit merupakan prediksi. Sedangkan contoh dari unsupervised learning adalah customer segmentation

Episode 7: Regresi

Regresi merupakan salah satu metode yang ada di dalam supervised learning yang memiliki target numerik.

Contohnya adalah ketika memprediksi harga rumah. Misalnya kita ingin memprediksi harga rumah dengan menggunakan tiga variabel (luas tanah, jumlah kamar, dan lokasi). Dengan metode regresi kita dapat mengetahui variabel manakah yang paling mempengaruhi harga rumah tersebut. 

Episode 8: Klasifikasi

Metode berikutnya yang ada di supervised learning adalah klasifikasi. Klasifikasi sendiri digunakan untuk memprediksi data yang target variabelnya kategorik.

Contohnya kita ingin memprediksi apakah sebuah email termasuk email spam atau not spam. Kita dapat menggunakan data-data email sebelumnya yang mengandung kata-kata spam (free, voucher, giveaway, sale, dan lainnya). Nantinya mesin akan mempelajari kata-kata tersebut dan dapat mengklasifikasikan apakah email tersebut termasuk spam atau tidak. 

Episode 9: Clustering

Clustering merupakan metode yang ada di unsupervised learning dimana kita mengelompokan data-data berdasarkan kesamaan karakteristik datanya. Biasanya clustering sendiri digunakan untuk product recommendation.

Contohnya: ketika kita pergi ke coffee shop dan ingin membeli kopi jenis A. Jika kopi tersebut habis, barista dapat merekomendasikan jenis kopi lainnya yang memiliki tingkat kepahitan dan aroma yang mirip (satu cluster).

Episode 10: Neural Network

Neural network adalah sebuah algoritma yang memiliki cara kerja yang sama dengan neuron-neuron di otak manusia.

Contohnya adalah image classification seperti yang digunakan dalam google lens dimana kita dapat mengklasifikasi objek tersebut melalui gambar. Contoh lainnya adalah shazam, dimana aplikasi tersebut melakukan voice recognition untuk mengetahui lagu apakah yang sedang diputar tersebut. 

Nah, kalau temen-temen masih mau belajar data science lebih lanjut bisa banget ikutan Algoritma Academy. Kalian akan mempelajari Data Analytics, Machine Learning, dan Data Visualization. Gak perlu takut kalau bukan dari background programming/statistics karena nanti semua materinya akan kita ajarkan dari awal yaa 🙂