7 Tren Seputar Data dan Machine Learning di Tahun 2018

By Prahariezka Arfienda Satrianti | March 15, 2018

Data science maupun machine learning sepertinya belum menunjukkan tanda-tanda berhenti bertumbuh. Justru, tren data science dan machine learning terus meningkat dan semakin banyak industri yang merasakan manfaatnya.

Lalu, apa saja yang akan menjadi the next big thing di tahun 2018? Simak tujuh tren data science dan machine learning berikut ini.

Machine learning menjadi komoditas

Automated machine learning diprediksi akan menjadi komoditas tahun ini. Dengan begitu, artinya data science akan lebih mengarah ke manajemen data untuk memenuhi kebutuhan bisnis.

Jika machine learning menjadi sebuah komoditas, maka berbagai industri pun bisa merasakan manfaatnya. Di antaranya, perusahaan yang perlu mengintegrasikan machine learning dengan produk mereka bisa melakukannya dengan lebih terjangkau. Baik oleh tim engineer mereka sendiri, maupun melalui vendor dari pihak luar.

Selain itu, sistem algoritme yang sudah ada akan terbagi menjadi tiga lapisan:
open source
– kode yang berlisens di bawah raksasa teknologi seperti Microsoft, Google, Amazon, dan lainnya
– kode yang sangat mahal dan menjadi “senjata rahasia” dalam kompetisi perusahaan, dan sangat dirahasiakan

Generative Adversarial Network (GAN) mulai lebih mainstream

Generative adversarial networks (GAN) adalah sebuah arsitektur jaringan deep neural yang terdiri dari dua neural network; discriminative dan generative.

Model generative menghasilkan sampel data yang “asli”, sementara model discriminative bertugas untuk membedakan sampel data yang asli dan yang palsu. Setiap kali model generative berhasil “menipu” model discriminative, saat itulah GAN belajar.

GAN memiliki potensi yang sangat besar, karena bisa belajar meniru berbagai distribusi data. Sehingga, GAN bisa dilatih untuk menciptakan lingkungan yang sangat mirip dengan dunia nyata.

Biasanya, neural networks cukup sulit ditangani karena perlu data yang sangat banyak untuk dapat melatihnya dengan baik. Tapi, model ini bisa menjadikannya lebih efisien karena membutuhkan parameter yang lebih sedikit. Ini adalah salah satu alasan utama arsitektur ini akan menjadi salah satu tren di tahun 2018.

Kepunahan data lake?

Data lake dapat menyimpan data dalam jumlah yang sangat besar. Data lake dijanjikan dapat memutus silo dalam informasi dengan menyajikan satu repositori data yang bisa digunakan oleh seluruh bagian dalam perusahaan. Mulai dari analisis bisnis hingga data mining. Tapi, data yang tersimpan dalam data lake masih mentah dan belum terorganisir dengan baik.

Rupanya, mendapatkan insight yang berguna terbilang cukup sulit. Banyak perusahaan justru “tenggelam” dalam data lake karena tidak berhasil menganalisis data-data tersebut dengan baik.

Sejumlah ahli memaparkan, tahun 2018 penggunaan data lake untuk bisnis harus benar-benar optimal dan bisa memberikan value yang jelas bagi bisnis. Kalau tidak, data lake akan segera punah atau bertransformasi menjadi bentuk lain yang bisa membuat penyimpanan data lebih baik lagi.

Dicari! Data Curator

Data is the new oil. Maka, kebutuhan orang yang ahli dalam bidang data dan digital kini sangat diperlukan untuk membuat perusahaan bisa berkompetisi dalam era digital. Dan tentunya, mendapatkan value yang berarti dari data.

Dalam karier di ranah data, ada yang disebut dengan Data Consumer, termasuk di dalamnya Analis dan Data Scientist. Lalu, ada juga Data Engineer. Salah satu profesi berkaitan dengan data lainnya yang diperkirakan akan mulai dicari di tahun 2018 adalah Data Curator.

Data Curator ada di antara Data Consumer dan Data Engineer. Mereka harus dapat memahami data yang mereka miliki, dan juga memiliki pengetahuan tentang teknologi yang digunakan untuk mengolah data-data tersebut.

Data Curator bertanggung jawab untuk memahami tipe-tipe analisis yang perlu dilakukan, berdasarkan kebutuhan-kebutuhan yang berbeda dalam sebuah perusahaan. Data Curator juga harus bisa memilih dataset yang paling cocok, dan apa saja langkah yang diperlukan untuk memproses data yang masih mentah hingga menjadi suatu informasi yang berharga.

Sinergi Edge dan Cloud Computing

Edge computing adalah sebuah topologi komputasi. Edge computing memungkinkan data yang dihasilkan oleh perangkat IoT untuk diproses dekat dengan sumber datanya, jadi tidak dikirimkan ke data center atau jaringan cloud. Contohnya, ATM atau sensor yang bisa memberikan data secara real time.

Dengan metode tersebut, pengguna bisa lebih mudah menganalisis berbagai data penting secara real time. Ini tentunya sangat menguntungkan berbagai industri termasuk kesehatan, manufaktur, finance, telekomunikasi, dan lain sebagainya.

Di sisi lain, AI dan machine learning sangat bergantung pada jaringan cloud untuk aktivitas yang cukup berat. Biasanya, sebuah model machine learning dilatih dalam jaringan public cloud, lalu dideploy melalui edge untuk prediksi real-time. Di sini, edge berperan untuk mengurangi latency.

Karena machine learning dan AI akan semakin banyak digunakan, kombinasi edge dan cloud computing akan sangat membantu kamu dalam mengatur, menganalisis data, dan secara signifikan meningkatkan efisiensi serta nilai dari produk IoT kamu.

Platform conversational makin diminati

Tahun ini, conversational platforms seperti chatbot atau voice assistant akan semakin banyak diminati oleh konsumen. Tentunya, penting bagi bisnis untuk dapat memahami dan memenuhi kebutuhan konsumen terhadap conversational platform, jika ingin bersaing di era digiral.

Sebuah penelitian menyebutkan, 58 persen orang tidak keberatan, atau bahkan lebih memilih berinteraksi dengan bot dari pada staf layanan konsumen yang sama-sama manusia. Salah satu alasannya adalah kecepatan respon dan kemampuan bot untuk selalu aktif bahkan selama 24 jam.

Perusahaan-perusahaan kini perlu memikirkan ulang bagaimana caranya mereka dapat berinteraksi dengan konsumen. Dengan mengembangkan conversational platform yang cerdas, perusahaan tidak hanya membuka jalur interaksi yang lebih baik dengan konsumen. Tapi, mereka juga akan dapat mengumpulkan data-data pengguna yang diperlukan dengan cukup akurat.

Penggunaan digital twin dalam berbagai industri

Digital twin adalah visualisasi dari objek fisik seperti produk ata komponen infratsruktur. Biasanya, digital twin digunakan untuk menampilkan berbagai data maupun informasi tentang objek fisik yang dikumpulkan melalui sistem dan sensor.

Salah satu contohnya, visualisasi performa sebuah smartphone ketika berada dalam kondisi tertentu. Misalnya, bagaimana jadinya jika dibanting, dihancurkan, dan lain sebagainya. Kamu tidak perlu merusak smartphone tersebut, tapi bisa melihat seperti apa efeknya.

Teknologi digital twin membantu perusahaan untuk meningkatkan pengalaman pengguna, dengan memahami kebutuhan mereka lebih baik lagi. Teknologi ini juga meningkatkan kemampuan produk, operasi dan layanan yang sudah ada, bahkan mengahasilkan inovasi yang baru.

Sebuah penelitian dari IDC menyebutkan, perusahaan yang berinvestasi di teknologi digital twin akan mengalami peningkatan efisiensi proses sebesar 30 persen.

Mau tahu lebih banyak informasi tentang data science atau program-program menarik dari Algoritma? Masukkan email kamu untuk berlangganan newsletter dari Algoritma!