fbpx

ggplot2

Menciptakan Visualisasi Data dengan ggplot2

31 Maret 2022

Untuk melakukan visualisasi data, sekarang ini sudah ada banyak sekali pilihannya. Artikel kali ini akan membahas tentang tahapan visualisasi data dengan memanfaatkan R package ggplot2. Berbeda dari graphic packages lainnya, ggplot2 memiliki grammar atau “tata bahasa” yang mendasarinya. Bagaimana cara kerja ggplot2? Simak penjelasannya berikut ini.

Apa itu ggplot2?

ggplot2 adalah sebuah R package bersifat fleksibel yang mampu menghasilkan statistik, data, atau grafik. Package ini ditemukan oleh Hadley Wickham dengan tujuan untuk menghasilkan grafik yang elegan. Menariknya, untuk menciptakan suatu visualisasi data, ggplot2 didasari oleh grammar atau tata bahasa khusus. Dengan grammar tersebut, Anda dapat membuat grafik dengan menggabungkan beberapa komponen kuat.

Faktor inilah yang kemudian membuat ggplot2 banyak digunakan. Alih-alih terbatas pada kumpulan data yang telah ditentukan sebelumnya, melalui ggplot2 Anda bisa membuat grafik baru yang disesuaikan dengan suatu kebutuhan spesifik.

ggplot2 bekerja secara iteratif atau berulang. Pada tahapan awal, Anda mulai dengan lapisan yang menampilkan data mentah. Selanjutnya, Anda bisa mulai menambahkan anotasi dan juga rangkaian statistik. Tahapan berlapis ini akan membantu Anda menghasilkan grafik menggunakan struktur berpikir yang sama saat merancang analisis data.

Apa fungsi ggplot2 dalam data science?

Secara garis besar, ggplot2 merupakan package yang dikhususkan untuk melakukan visualisasi data. Dengan package ini, Anda bisa merancang grafik yang menggambarkan data melalui simbol, warna, bentuk, dan sebagainya.

Menerapkan grammar of graphics, ggplot2 mampu menghasilkan plot data yang indah. Bukan hanya itu, package ini juga cukup simpel meski mampu menangani detail yang kompleks (misalnya saat harus menggambar legenda).

Pada ggplot2, Anda bisa menemukan sistem komprehensif yang akan memudahkan pemformatan dengan persyaratan khusus. Itu artinya, Anda dapat memastikan bahwa visualisasi data benar-benar mengungkapkan pesan yang sama dengan data asli.

Mengenal grammar of graphics dalam ggplot2

Dua huruf “g” pada ggplot2 berarti grammar of graphics. Apa itu grammar of graphics? Konsep tersebut lahir dari pemikiran Leland Wilkinson. Pada dasarnya, grammar of graphics lahir untuk menggambarkan fitur dasar yang dimiliki oleh seluruh grafik statistik. ggplot2 dibangun di atas landasan tersebut dan kemudian diadaptasi dalam ekosistem R.

Konsep grammar pada grafik ini dibuat untuk memberi tahu audiens bahwa visualisasi data yang sedang mereka lihat memetakan data dalam atribut estetika (baik berupa bentuk, warna, maupun ukuran) serta objek geometris (seperti titik, garis, dan batang).

Dari sini, kemudian bisa diketahui bahwa plot pada ggplot2 menunjukkan kombinasi data (yang ingin divisualisasikan), estetika, dan geometri. Plot di sini juga mencakup transformasi statistik data, lengkap dengan informasi mengenai sistem koordinat plot. Berikut adalah beberapa komponen utama pada pemetaan ggplot2:

1. Layer

Layer di sini menunjukkan kumpulan elemen geometris yang dipadukan dengan transformasi statistik. Elemen geometris atau geom mewakili apa yang sebenarnya Anda lihat dalam plot, seperti garis, titik, dan sebagainya. Sedangkan, transformasi statistik atau statistik berfungsi meringkas data. Contoh sederhana statistik di sini adalah menggabungkan dan menghitung pengamatan untuk membuat histogram.

2. Skala

Komponen skala berarti proses memetakan nilai dalam ruang data menjadi nilai dalam lingkup estetika. Ini termasuk penggunaan warna, bentuk, atau bisa terkadang ukuran. Skala juga berfungsi untuk menggambar legenda dan sumbu, yang memungkinkan audiens membaca nilai data asli dari plot (pemetaan terbalik).

3. Koordinat

Sistem koordinat atau kadang disebut coord menjelaskan bagaimana koordinat data dipetakan menjadi bidang grafik. Komponen ini juga menyediakan sumbu dan garis kisi untuk memudahkan audiens membaca grafik. Sistem koordinat yang paling banyak digunakan adalah sistem Cartesian. Meski begitu, ada banyak sistem koordinat lain yang tersedia seperti sistem koordinat kutub dan juga proyeksi peta.

4. Facet

Facet menentukan cara memecah dan menampilkan subset data dalam beberapa kelipatan kecil. Komponen ini juga dikenal sebagai conditioning atau latticing.

5. Tema

Tema mengontrol titik tampilan yang lebih halus, seperti ukuran font dan warna latar belakang.

Perlu diingat, ggplot2 tidak memberikan rekomendasi grafik mana yang sebaiknya digunakan. Selain itu, package ini hanya bisa menghasilkan grafik statis, bukan interaktif.

Kesimpulan

ggplot2 adalah graphic packages yang berjalan di R dan memiliki fungsi utama untuk mengerjakan visualisasi data. Berbeda dengan graphic packages lainnya, ggplot2 memanfaatkan gg atau grammar of graphics untuk menyusun grafik visualisasi data. Dengan begitu, visualisasi yang muncul benar-benar mengikuti rancangan analisis yang Anda terapkan pada data.

Berbicara soal visualisasi data tidak akan selesai dalam satu artikel saja. Jika Anda tertarik untuk mempelajari soal ggplot2 atau metode visualisasi data lainnya, Algoritma Data Science School menyediakan kelas dengan jadwal yang fleksibel. Di Algoritma Data Science School, Anda bisa menemukan pelatihan data science untuk individu maupun corporate. Untuk informasi selengkapnya, Anda bisa kontak kami di sini!

Referensi:

Yuk belajar data science di Algoritma Data Science Education Center! Kamu bisa ikut berbagai kelas data science untuk pemula, salah satunya di program Academy kami.

PELAJARI LEBIH LANJUT

Related Blog

Distributed Processing
Apa Itu Data Analysis Expressions?
jadi data scientist
Cara Menjadi Data Scientist Handal
Distributed Processing
Mengenal Apa Itu Distributed Processing

Untuk melakukan visualisasi data, sekarang ini sudah ada banyak sekali pilihannya. Artikel kali ini akan membahas tentang tahapan visualisasi data dengan memanfaatkan R package ggplot2. Berbeda dari graphic packages lainnya, ggplot2 memiliki grammar atau “tata bahasa” yang mendasarinya. Bagaimana cara kerja ggplot2? Simak penjelasannya berikut ini.

Apa itu ggplot2?

ggplot2 adalah sebuah R package bersifat fleksibel yang mampu menghasilkan statistik, data, atau grafik. Package ini ditemukan oleh Hadley Wickham dengan tujuan untuk menghasilkan grafik yang elegan. Menariknya, untuk menciptakan suatu visualisasi data, ggplot2 didasari oleh grammar atau tata bahasa khusus. Dengan grammar tersebut, Anda dapat membuat grafik dengan menggabungkan beberapa komponen kuat.

Faktor inilah yang kemudian membuat ggplot2 banyak digunakan. Alih-alih terbatas pada kumpulan data yang telah ditentukan sebelumnya, melalui ggplot2 Anda bisa membuat grafik baru yang disesuaikan dengan suatu kebutuhan spesifik.

ggplot2 bekerja secara iteratif atau berulang. Pada tahapan awal, Anda mulai dengan lapisan yang menampilkan data mentah. Selanjutnya, Anda bisa mulai menambahkan anotasi dan juga rangkaian statistik. Tahapan berlapis ini akan membantu Anda menghasilkan grafik menggunakan struktur berpikir yang sama saat merancang analisis data.

Apa fungsi ggplot2 dalam data science?

Secara garis besar, ggplot2 merupakan package yang dikhususkan untuk melakukan visualisasi data. Dengan package ini, Anda bisa merancang grafik yang menggambarkan data melalui simbol, warna, bentuk, dan sebagainya.

Menerapkan grammar of graphics, ggplot2 mampu menghasilkan plot data yang indah. Bukan hanya itu, package ini juga cukup simpel meski mampu menangani detail yang kompleks (misalnya saat harus menggambar legenda).

Pada ggplot2, Anda bisa menemukan sistem komprehensif yang akan memudahkan pemformatan dengan persyaratan khusus. Itu artinya, Anda dapat memastikan bahwa visualisasi data benar-benar mengungkapkan pesan yang sama dengan data asli.

Mengenal grammar of graphics dalam ggplot2

Dua huruf “g” pada ggplot2 berarti grammar of graphics. Apa itu grammar of graphics? Konsep tersebut lahir dari pemikiran Leland Wilkinson. Pada dasarnya, grammar of graphics lahir untuk menggambarkan fitur dasar yang dimiliki oleh seluruh grafik statistik. ggplot2 dibangun di atas landasan tersebut dan kemudian diadaptasi dalam ekosistem R.

Konsep grammar pada grafik ini dibuat untuk memberi tahu audiens bahwa visualisasi data yang sedang mereka lihat memetakan data dalam atribut estetika (baik berupa bentuk, warna, maupun ukuran) serta objek geometris (seperti titik, garis, dan batang).

Dari sini, kemudian bisa diketahui bahwa plot pada ggplot2 menunjukkan kombinasi data (yang ingin divisualisasikan), estetika, dan geometri. Plot di sini juga mencakup transformasi statistik data, lengkap dengan informasi mengenai sistem koordinat plot. Berikut adalah beberapa komponen utama pada pemetaan ggplot2:

1. Layer

Layer di sini menunjukkan kumpulan elemen geometris yang dipadukan dengan transformasi statistik. Elemen geometris atau geom mewakili apa yang sebenarnya Anda lihat dalam plot, seperti garis, titik, dan sebagainya. Sedangkan, transformasi statistik atau statistik berfungsi meringkas data. Contoh sederhana statistik di sini adalah menggabungkan dan menghitung pengamatan untuk membuat histogram.

2. Skala

Komponen skala berarti proses memetakan nilai dalam ruang data menjadi nilai dalam lingkup estetika. Ini termasuk penggunaan warna, bentuk, atau bisa terkadang ukuran. Skala juga berfungsi untuk menggambar legenda dan sumbu, yang memungkinkan audiens membaca nilai data asli dari plot (pemetaan terbalik).

3. Koordinat

Sistem koordinat atau kadang disebut coord menjelaskan bagaimana koordinat data dipetakan menjadi bidang grafik. Komponen ini juga menyediakan sumbu dan garis kisi untuk memudahkan audiens membaca grafik. Sistem koordinat yang paling banyak digunakan adalah sistem Cartesian. Meski begitu, ada banyak sistem koordinat lain yang tersedia seperti sistem koordinat kutub dan juga proyeksi peta.

4. Facet

Facet menentukan cara memecah dan menampilkan subset data dalam beberapa kelipatan kecil. Komponen ini juga dikenal sebagai conditioning atau latticing.

5. Tema

Tema mengontrol titik tampilan yang lebih halus, seperti ukuran font dan warna latar belakang.

Perlu diingat, ggplot2 tidak memberikan rekomendasi grafik mana yang sebaiknya digunakan. Selain itu, package ini hanya bisa menghasilkan grafik statis, bukan interaktif.

Kesimpulan

ggplot2 adalah graphic packages yang berjalan di R dan memiliki fungsi utama untuk mengerjakan visualisasi data. Berbeda dengan graphic packages lainnya, ggplot2 memanfaatkan gg atau grammar of graphics untuk menyusun grafik visualisasi data. Dengan begitu, visualisasi yang muncul benar-benar mengikuti rancangan analisis yang Anda terapkan pada data.

Berbicara soal visualisasi data tidak akan selesai dalam satu artikel saja. Jika Anda tertarik untuk mempelajari soal ggplot2 atau metode visualisasi data lainnya, Algoritma Data Science School menyediakan kelas dengan jadwal yang fleksibel. Di Algoritma Data Science School, Anda bisa menemukan pelatihan data science untuk individu maupun corporate. Untuk informasi selengkapnya, Anda bisa kontak kami di sini!

Referensi:

Yuk belajar data science di Algoritma Data Science Education Center! Kamu bisa ikut berbagai kelas data science untuk pemula, salah satunya di program Academy kami.

PELAJARI LEBIH LANJUT

Related Blog

Real Time Processing
Perbedaan Batch Processing dan Real Time Processing
Metode Pengolahan Data
Tipe, Langkah, dan Metode Pengolahan Data
Batch Processing
Mengenal Batch Processing dan Implementasinya