fbpx

5 Tips Membuat Visualisasi Data untuk Data Scientist Pemula

By Nor Iffadathul Faddilla   |   November 9, 2018

tips visualisasi data

Memahami informasi dari data tentunya akan lebih mudah apabila disajikan dalam grafik atau chart, dibandingkan harus melihat spreadsheet ataupun laporan berbentuk teks yang sangat panjang. Selain itu, mata manusia juga akan lebih mudah menangkap informasi dalam bentuk chart atau gambar.

Dalam ranah data science, ada istilah data visualization atau visualisasi data. Visualisasi data yang baik dapat membantu data scientist untuk menjelaskan temuan-temuan dalam data menjadi informasi yang mudah dipahami. Skill ini juga cukup sering muncul pada job-requirement untuk posisi seperti Data Analyst, Data Scientist ataupun Business Intelligence.

Beberapa waktu lalu, Team Algoritma sempat menulis artikel tentang pentingnya Data Visualization. Kali ini, kita akan membahas beberapa tips yang dapat kamu pertimbangkan saat akan melakukan data visualization.

1. Pertimbangkan Audience

Visualisasi data ini adalah salah satu skill komunikasi. Maka, penting bagi seorang data scientist untuk memperhatikan dengan siapa kita akan menyampaikan pesan. Kamu perlu menyesuaikan tampilan data yang akan kamu sajikan dengan audience yang akan membaca visualisasi data yang telah dibuat.

isualisasi data untuk data scientist pemula

Sumber gambar: Capstone Project Rakadipta (Algoritma Data Science Academy Alumni)

Contohnya, ketika kamu menyajikan visualisasi data terkait performa marketing hanya untuk tim marketing, mungkin ada beberapa jargon yang mereka dapat langsung pahami. Namun, saat kamu membuat visualisasi data performa marketing untuk cakupan yang lebih luas, orang-orang di bidang human resource mungkin akan bingung dengan istilah CPC dan CPM di bagan marketing.

Visualisasi data untuk audience yang akan melihatnya dalam bentuk digital tentu akan berbeda dengan visualisasi data dalam media cetak. Contoh lainnya, kamu bisa membuat visualisasi data yang lebih interaktif dan memanfaatkan animasi, tapi tidak bisa melakukannya dalam media cetak. Tampilan data untuk aktivitas yang lebih formal pun tampilannya perlu lebih profesional, tidak menggunakan warna yang terlalu mencolok, dan menggunakan teks yang tidak terlalu playful, lain halnya dengan kebutuhan visualisasi data untuk aktivitas yang lebih kasual.

2. Sertakan anotasi

Visualisasi data yang kita buat bisa bermacam-macam, baik berupa line-chart, bar-chart, scatter-chart, column-chart ataupun dot-chart. Penggunaannya dapat disesuaikan dengan data yang kita miliki.

Selain bentuk chart yang sesuai, hal lain yang tak kalah penting adalah memberikan anotasi atau keterangan untuk chart yang telah dibuat.
Anotasi tersebut akan membuat informasi dalam chart menjadi lebih jelas dan tidak ambigu, serta dapat membantu pembaca untuk memahami visualisasi data yang telah dibuat.

3. Pertimbangkan warna dan font

Dalam membuat visualisasi data, pemilihan warna dan font atau jenis huruf juga salah satu hal yang patut diperhatikan. Sebaiknya, hindari menggunakan font dan warna default dari tool data visualisasi yang kita gunakan.

tips visualisasi data untuk data scientist pemula

Sumber gambar: Capstone Project Algoritma Data Science Academy Alumni

Hal ini bisa membuat chart menjadi biasa saja bahkan cenderung membosankan. Selain itu, warna default mungkin kuragn sesuai dengan kebutuhan kamu yang ingin menunjukkan visualisasi dalam ruangan atau media yang memerlukan kecerahan warna tertentu. Jenis font yang terlalu kecil juga bisa menyulitkan audience yang memiliki masalah penglihatan. Tidak hanya itu, beberapa perusahaan terkadang perlu menampilkan warna-warna branding mereka dalam laporan tertentu. Jadi, akan lebih baik jika warna dan font dapat disesuaikan sesuai kebutuhan.

4. Label yang mudah dibaca

Selain memberikan anotasi, penambahan label pada chart juga merupakan salah satu aspek penting dalam visualisai data. Memberikan label pada chart akan akan membuat pembaca mudah memahami data visualisasi yang kita buat. Label dapat berupa keterangan dari masing-masing sumbu, bisa juga ditambahkan unit dari variabel yang ditampilkan.

5. Hindari Pie Chart!

Menurut Dokumentasi R, pie chart sebetulnya bukanlah cara yang ideal untuk menampilkan informasi. Karena, mata manusia baik dalam menilai linear measure namun buruk dalam menilai relatives area.

Apabila kamu perlu menampilkan banyak data dengan jumlah selisih persen, sebaiknya hindari pie chart. Hal ini untuk menghindari visualisasi yang membingungkan pembaca, karena pembagian area di lingkaran pie chart terkadang kurang jelas proporsinya, terutama dalam jumlah data yang banyak. Bar-chart dan dot-chart dapat menjadi alternatif lebih baik untuk menampilkan informasi.

“Data that can be shown by pie charts always can be shown by a dot chart. This means that judgements of position along a common scale can be made instead of the less accurate angle judgements.”

-Cleveland (1985), hal. 264

Diedit oleh Prahariezka Arfienda; Ilustrasi oleh Fajar Kuswandha

Nor Iffadathul Faddilla
Junior Data Science Instructor

Kalau tidak sedang mengajar, Iffa biasanya hobi ngoding pakai R dan bikin-bikin shinyapps. Bisa disapa di iffa@algorit.ma

Tertarik untuk mempelajari data science dan machine learning lebih mendalam?

Daftar Data Science Academy di Sini!

The last comment and 52 other comment(s) need to be approved.