4 Pengetahuan Data Science dari K-Drama Start-Up
By Inayatus | November 29, 2020
Siapa yang gak kenal dengan drama Start-Up? Drama Korea yang sangat digandrungi oleh para milenial saat ini. K-Drama ini menceritakan sekelompok anak muda yang ingin mendirikan sebuah perusahaan start-up berbasis Artificial Intelligence. Akhirnya mereka memutuskan untuk mendaftarkan diri ke sebuah ajang Hackathon/Inkubasi start-up bernama ‘SandBox’ dimana selama 3 hari mereka berlomba untuk membuat sebuah program berbasis Artificial Intelligence. Dalam mencapai tujuan tersebut, perlu adanya suatu model yang dibentuk menggunakan Machine Learning. Yuk kita kulik lebih dalam mengenai Machine Learning dari Drama Korea Start-up!
Tarzan yang Dimaksud Nam-Do-san di Drama Start-Up Termasuk Dalam Kategori Reinforcement Learning
Dalam drama tersebut, machine learning dijelaskan menggunakan analogi Tarzan dan Jane. Do-San kala itu menjelaskan kepada Dal-Mi bahwa machine learning sebagai Tarzan yang tinggal di suatu pulau tak berpenghuni dan kemudian bertemu Jane. Tarzan yang sangat menyukai Jane akhirnya selalu memberikan hadiah kepadanya. Namun, ada beberapa benda yang Jane tidak sukai. Ketika Tarzan memberikan batu, Jane tidak suka. Ketika Tarzan memberikan bunga, Jane suka. Ketika Tarzan memberikan ular, Jane tidak suka. Akhirnya Tarzan pun mulai belajar dan mengetahui apa yang disukai dan tidak disukai oleh Jane.
Cukup mudah dipahami bukan? Namun sebenarnya, machine learning secara umum dibagi menjadi 3 jenis dimana masing-masing jenis tersebut memiliki cara learning yang berbeda-beda.
- Supervised learning: Berfokus untuk melakukan prediksi suatu target variabel. Jika dianalogikan menggunakan Tarzan dan Jane, Tarzan adalah sebuah komputer yang diberikan informasi mengenai hal-hal yang disukai dan tidak disukai oleh Jane. Ketika Jane hadir, Tarzan sudah tahu apa yang disukai oleh Jane dan tidak disukai oleh Jane. Oleh karena itu, Tarzan bisa memilih dengan tepat hadiah yang akan ia berikan untuk Jane (berdasarkan data yang sudah ada). Beberapa penerapan supervised learning adalah object detection, churn analisis, fraud detection, prediksi harga rumah, dan sebagainya.
- Unsupervised learning: Berfokus untuk mengetahui karakteristik suatu data. Jika dianalogikan, Tarzan hanya diberikan beberapa informasi yang berkaitan dengan Jane. Namun, dari informasi tersebut Tarzan belum bisa mengetahui apa yang disukai dan tidak disukai oleh Jane. Oleh karena itu, Tarzan akan mencoba menemukan karakteristik dari informasi terlebih dahulu yang berkaitan dengan kesukaan Jane. Salah satu penerapan unsupervised learning adalah product recommendation.
- Reinforcement learning: sedikit berbeda dengan dua jenis machine learning di atas. Dalam reinforcement learning, kamu akan dikenalkan dengan environment dan agen, dimana agen belajar berdasarkan pengalamannya sendiri. Agen akan diminta untuk melakukan sebuah aksi agar mendapat reward. Proses ini akan berulang terus menerus hingga agen mendapatkan reward terbesar. Jika dianalogikan, Tarzan adalah agen yang tinggal di pulau tak berpenghuni. Lalu ia bertemu dan jatuh cinta dengan Jane. Tarzan pun mulai memberikan berbagai macam hadiah untuk Jane. Dari hadiah-hadiah yang Tarzan berikan, Tarzan dapat mempelajari apa yang Jane suka dan tidak suka. Ini lah salah satu penerapan reinforcement learning. Salah satu penerapan reinforcement learning yang paling terkenal adalah AlphaGo.
Apa Itu Hyperparameter Tuning yang Disebut Oleh Nam Do-san di Drama Star-Up?
Ingat pemodelan yang dibuat Nam Do-san dan tim untuk mendeteksi tulisan palsu dan asli? Model yang mereka buat adalah model deep learning, oleh karena itu mereka mencoba melakukan tuning pada hidden layer serta activation function yang digunakan. Model pertama yang mereka buat masih sangat buruk performanya, sehingga mereka akhirnya melakukan hyperparameter tuning. Apakah itu?
Tak jarang dalam pembuatan model, hasil akhir model yang dibuat kurang memuaskan. Oleh karena itu, kamu perlu melakukan tuning parameter dalam model. Model yang sederhana mungkin hanya membutuhkan beberapa parameter untuk dilakukan tuning. Namun, ketika sedang membuat model machine learning yang kompleks, banyak sekali parameter yang harus dilakukan tuning, maka dari itu disebut hyperparameter tuning.
Dalam melakukan tuning model, perlu kamu ketahui beberapa parameter yang bisa dilakukan tuning karena setiap metode memiliki hyperparameter yang berbeda-beda. Kamu perlu mengenali metode yang kamu gunakan serta tuning parameter yang bisa di-improve agar model yang dihasilkan memiliki performa yang bagus. Itulah kenapa sebagai seorang Data Scientist kita tidak hanya dituntut untuk menguasai programming, tetapi juga harus memiliki jiwa seni dalam mengkreasikan kombinasi parameter pembentuk model hingga menghasilkan model yang akurat.
Tips Memilih Model yang Tepat Ala Samsan Tech
Banyak sekali metode yang ada dalam machine learning, mulai dari yang sederhana hingga kompleks. Ketika melakukan analisis data, kamu perlu memilih model yang tepat sehingga dapat diinterpretasikan sesuai dengan tujuan yang ingin dicapai. Ketika sudah mengetahui metodenya, jangan lupa pastikan metode yang kamu pilih merupakan metode yang interpretable atau robustness. Hal ini akan mempengaruhi performance model yang akan kamu buat nantinya.
Apakah kamu masih ingat saat sesi Hackathon, model yang dibuat Samsan Tech belum bisa menghasilkan performa yang baik dibandingkan dengan Injae Company? Keduanya sama-sama menggunakan dataset tulisan tangan dari Bank dengan tujuan mendeteksi fraud. Namun mengapa performa model Samsan Tech belum bisa sebaik model dari Injae Company? Hal ini dikarenakan arsitektur model yang digunakan tidak sesuai dengan dataset yang ingin diuji. Jika ingin menguji data gambar maka harus menggunakan arsitektur model pendeteksi gambar, bukan arsitektur model pendeteksi video. Dengan menggunakan arsitektur yang tepat, performa model yang dihasilkan pun dapat menjadi lebih tinggi. Oleh karena itu, sebagai seorang Data Scientist tidak hanya keahlian programming yang diperlukan, namun harus memiliki jika kritis dan selektif dalam menentukan model yang akan digunakan dalam memecahkan masalah.
Implementasi Model untuk Pembuatan Aplikasi NoonGil di Drama Start-Up
Setelah berhasil masuk ke SandBox, Samsan Tech memutuskan untuk membuat ide bisnis ‘NoonGil’. NoonGil adalah aplikasi yang dapat membantu tuna-netra, dengan menggabungkan image recognition & voice processing technology. Do-San dan tim ingin menciptakan aplikasi yang dapat menyerupai fungsi penglihatan dan suara bagi kaum tuna-netra. Setelah berhasil menjadi aplikasi, NoonGil inilah yang disebut sebagai AI.
Hal ini lah yang dapat kamu lakukan setelah membuat model machine learning. Step selanjutnya adalah melakukan implementasi model. Pengimplementasian model ini harus selaras dengan tujuan saat model dibuat. Hasil implementasi dari model ini yang nantinya disebut sebagai AI.
Implementasi model biasanya ada yang sederhana berupa dashboard hingga yang kompleks seperti aplikasi NoonGil atau bahkan robotik. Umumnya ketika ingin melakukan implementasi model menggunakan dashboard, kamu harus menyimpan informasi dari model tersebut untuk kamu masukkan ke dalam server dashboard.
Apabila implementasi model berupa aplikasi seperti NoonGil, kamu perlu mempersiapkan hal-hal yang berkaitan dengan pembuatan aplikasi, seperti design, interface aplikasi, pilihan multi-user dan multi-device, hingga kolom pemberian feedback untuk evaluasi. Model machine learning yang dibuat pun tidak disertakan dalam aplikasi, tetapi dihubungkan melalui API atau modelnya dipanggil dari server di internet sehingga aplikasi NoonGil tidak memakan banyak memori di handphone.