fbpx
Karakteristik Big Data

Apa saja karakteristik big data?

27 April 2022

Perkembangan teknologi dan informasi, khususnya di era digital, berjalan dengan sangat cepat. Berbicara mengenai data di era digital tak terlepas dari yang namanya big data. Sebagian dari Anda mungkin sudah akrab dengan istilah tersebut, tapi tak sedikit pula yang masih awam dan belum mengetahui jenis serta karakteristik big data. Agar lebih mudah memahaminya, pahami ulasan berikut ini!

Apa itu big data?

Sebelum beranjak ke jenis dan karakteristik big data, ada baiknya Anda mengetahui apa yang disebut sebagai big data. Secara sederhana, big data dapat diartikan sebagai kumpulan data dalam jumlah besar dan kompleks serta bertambah seiring waktu. Contoh big data adalah nomor telepon, alamat, dan lainnya.

Data saat ini juga beragam bentuk dan rupanya. Misalnya, postingan di media sosial juga bisa menjadi sebuah data. Selain itu, ada juga riwayat perbelanjaan di marketplace sampai dengan data-data yang ada di aplikasi smartphone. 

Jenis-jenis big data

Karakteristik big data tak bisa lepas dari jenis-jenis data yang digunakan dalam sebuah program. Jenis big data ini dibedakan menjadi tiga jenis utama, yakni structured data, semi-structured data, dan unstructured. berikut penjelasan mengenai ketiganya.

  • Structured data

Jenis data yang pertama yaitu structured data yang tersusun dengan baik dan terdefinisikan. Data ini memang mudah dipahami oleh komputer maupun manusia. Data ini juga dapat tersimpan, dianalisis, dan diproses menggunakan format yang  baik.

  • Semi structured data

Selanjutnya, ada semi structured data. Data ini sebenarnya adalah data  terstruktur, tapi tidak lengkap dan tidak memenuhi syarat sebagai data yang terstruktur seperti RDBMS. Contoh data ini adalah dokumen NoSQL yang memiliki kata kunci untuk pemrosesan dan CSV file.

  • Unstructured data

Jenis big data yang terakhir adalah unstructure data, yakni data yang tidak terstruktur maupun terdefinisikan dengan baik, sehingga lebih sulit untuk ditangani, dipahami, dan dianalisis. Contoh unstructured data adalah data komentar di media sosial, kicauan di Twitter, posting-an, dan like.

10 karakteristik big data

Dalam penerapannya, big data memiliki karakteristik tersendiri yang berbeda-beda. Secara umum, karakteristik big data ini terbagi ke dalam sepuluh faktor. Berikut penjelasannya.

1. Volume

Volume menjadi karakter utama dalam big data. Hal ini tentu bukan menjadi hal mengejutkan, sebab lebih dari 90% data hari ini dibuat berdasarkan salinan tahun-tahun sebelumnya. Data yang ada pada hari ini memang mengalami peningkatan cukup signifikan. Misalnya, dalam setiap menit, ada sekitar 300 jam video yang diunggah di YouTube.

2. Velocity

Velocity merupakan kecepatan data yang dibuat, diolah kembali, dan digeneralisasi. Kecepatan ini sangat berpengaruh pada lalu lintas big data. Di sini kita dapat contohkan Google yang mencatat sekitar 40 ribu pencarian setiap detiknya. Hal itu jika diakumulasikan akan lebih dari 3,5 miliar pencarian setiap hari.

3. Variety

Karakter data ini merupakan sekumpulan big data yang bervariasi di setiap platform. Ragam data dikelompokkan dalam structured data, semi-structured data, dan unstructured data. Contohnya ada pada media sosial yang menampilkan banyak macam data, mulai dari foto, video, formulir, hingga filter-filter unggulan. Dalam urusan bisnis, data ini juga beragam bentuknya, bisa berupa dokumen, tabel, dan sebagainya.

4. Veracity

Veracity merupakan keakuratan data dalam memproses sebuah program. Bayangkan saja jika banyak data tidak memiliki akurasi tinggi. Itu tentu akan menyebabkan error dan dampaknya sangat berarti, misalnya penerapan nama akun di Facebook, Instagram, dan sebagainya.

5. Value

Pada karakteristik ini, value bisa diartikan sebagai big data yang dibuat memiliki manfaat bagi pengguna atau orang. Sebagaimana dilansir dari Hootsuite, Instagram Stories telah dipakai 500 juta penggunanya per hari. Itu artinya, fitur tersebut cukup berpengaruh dan memiliki value tersendiri.

6. Visualization

Karakteristik big data yang satu ini sering menjadi tantangan, yaitu bagaimana memvisualisasikannya. Di sini, dapat dicontohkan data dalam sebuah peta terdapat bentang alam, koordinat, pepohonan, yang menjadi salah satu gambaran mengenai data yang dapat divisualisasikan.

7. Volatility

Volatility yakni data yang dikumpulkan per hari atau beberapa hari lalu mungkin berbeda dari data yang ada saat ini. Pada intinya, karakteristik ini berkaitan dengan perubahan data yang bisa berdampak pada homogenitas data.

8. Validity

Sekilas karakteristik ini memang hampir sama dengan veracity. Di sini, sebuah data yang terkumpul haruslah valid dan relevan sebelum bisa digunakan, khususnya untuk tujuan-tujuan tertentu agar bisa berjalan dengan baik.

9. Vulnerability

Karakteristik big data yang tak kalah penting ialah mengedepankan keamanan. Dalam hal ini, big data harus mampu terlindung dari hal-hal yang tak diinginkan. Misalnya, peretasan yang dilakukan oleh pihak-pihak tak bertanggung jawab.

10. Variability

Hal ini menyangkut perubahan data yang berbeda-beda. Data yang berbeda tersebut bisa berdampak pada karakteristik lainnya, misalnya saja pada proses dan kecepatan transfer data.

Kesimpulan

Berdasarkan ulasan di atas, memahami jenis dan karakteristik big data adalah hal yang paling penting, terutama jika Anda ingin membuat sebuah sistem operasi dan pemrograman tertentu. Pastikan karakteristik tersebut Anda perhatikan dengan baik untuk menunjang optimalisasi operasi program.

Selain itu, Anda juga bisa lebih mengetahui beragam hal penting lainnya seputar data dengan mengikuti kelas data science yang diselenggarakan oleh Algoritma Data Science School. Kemudian, pilihlah kelas dan kursus yang sesuai dengan kebutuhan Anda.

Referensi:

  • hootsuite – 35 Instagram Stats That Matter to Marketers in 2022
  • analytixlabs – Characteristics of Big Data
  • upgrad  – Characteristics of Big Data: Types & 5V’s
  • tdwi – The 10 Vs of Big Data

Yuk belajar data science di Algoritma Data Science Education Center! Kamu bisa ikut berbagai kelas data science untuk pemula, salah satunya di program Academy kami.

PELAJARI LEBIH LANJUT

Related Blog

Distributed Processing
Apa Itu Data Analysis Expressions?
jadi data scientist
Cara Menjadi Data Scientist Handal
Distributed Processing
Mengenal Apa Itu Distributed Processing

Perkembangan teknologi dan informasi, khususnya di era digital, berjalan dengan sangat cepat. Berbicara mengenai data di era digital tak terlepas dari yang namanya big data. Sebagian dari Anda mungkin sudah akrab dengan istilah tersebut, tapi tak sedikit pula yang masih awam dan belum mengetahui jenis serta karakteristik big data. Agar lebih mudah memahaminya, pahami ulasan berikut ini!

Apa itu big data?

Sebelum beranjak ke jenis dan karakteristik big data, ada baiknya Anda mengetahui apa yang disebut sebagai big data. Secara sederhana, big data dapat diartikan sebagai kumpulan data dalam jumlah besar dan kompleks serta bertambah seiring waktu. Contoh big data adalah nomor telepon, alamat, dan lainnya.

Data saat ini juga beragam bentuk dan rupanya. Misalnya, postingan di media sosial juga bisa menjadi sebuah data. Selain itu, ada juga riwayat perbelanjaan di marketplace sampai dengan data-data yang ada di aplikasi smartphone. 

Jenis-jenis big data

Karakteristik big data tak bisa lepas dari jenis-jenis data yang digunakan dalam sebuah program. Jenis big data ini dibedakan menjadi tiga jenis utama, yakni structured data, semi-structured data, dan unstructured. berikut penjelasan mengenai ketiganya.

  • Structured data

Jenis data yang pertama yaitu structured data yang tersusun dengan baik dan terdefinisikan. Data ini memang mudah dipahami oleh komputer maupun manusia. Data ini juga dapat tersimpan, dianalisis, dan diproses menggunakan format yang  baik.

  • Semi structured data

Selanjutnya, ada semi structured data. Data ini sebenarnya adalah data  terstruktur, tapi tidak lengkap dan tidak memenuhi syarat sebagai data yang terstruktur seperti RDBMS. Contoh data ini adalah dokumen NoSQL yang memiliki kata kunci untuk pemrosesan dan CSV file.

  • Unstructured data

Jenis big data yang terakhir adalah unstructure data, yakni data yang tidak terstruktur maupun terdefinisikan dengan baik, sehingga lebih sulit untuk ditangani, dipahami, dan dianalisis. Contoh unstructured data adalah data komentar di media sosial, kicauan di Twitter, posting-an, dan like.

10 karakteristik big data

Dalam penerapannya, big data memiliki karakteristik tersendiri yang berbeda-beda. Secara umum, karakteristik big data ini terbagi ke dalam sepuluh faktor. Berikut penjelasannya.

1. Volume

Volume menjadi karakter utama dalam big data. Hal ini tentu bukan menjadi hal mengejutkan, sebab lebih dari 90% data hari ini dibuat berdasarkan salinan tahun-tahun sebelumnya. Data yang ada pada hari ini memang mengalami peningkatan cukup signifikan. Misalnya, dalam setiap menit, ada sekitar 300 jam video yang diunggah di YouTube.

2. Velocity

Velocity merupakan kecepatan data yang dibuat, diolah kembali, dan digeneralisasi. Kecepatan ini sangat berpengaruh pada lalu lintas big data. Di sini kita dapat contohkan Google yang mencatat sekitar 40 ribu pencarian setiap detiknya. Hal itu jika diakumulasikan akan lebih dari 3,5 miliar pencarian setiap hari.

3. Variety

Karakter data ini merupakan sekumpulan big data yang bervariasi di setiap platform. Ragam data dikelompokkan dalam structured data, semi-structured data, dan unstructured data. Contohnya ada pada media sosial yang menampilkan banyak macam data, mulai dari foto, video, formulir, hingga filter-filter unggulan. Dalam urusan bisnis, data ini juga beragam bentuknya, bisa berupa dokumen, tabel, dan sebagainya.

4. Veracity

Veracity merupakan keakuratan data dalam memproses sebuah program. Bayangkan saja jika banyak data tidak memiliki akurasi tinggi. Itu tentu akan menyebabkan error dan dampaknya sangat berarti, misalnya penerapan nama akun di Facebook, Instagram, dan sebagainya.

5. Value

Pada karakteristik ini, value bisa diartikan sebagai big data yang dibuat memiliki manfaat bagi pengguna atau orang. Sebagaimana dilansir dari Hootsuite, Instagram Stories telah dipakai 500 juta penggunanya per hari. Itu artinya, fitur tersebut cukup berpengaruh dan memiliki value tersendiri.

6. Visualization

Karakteristik big data yang satu ini sering menjadi tantangan, yaitu bagaimana memvisualisasikannya. Di sini, dapat dicontohkan data dalam sebuah peta terdapat bentang alam, koordinat, pepohonan, yang menjadi salah satu gambaran mengenai data yang dapat divisualisasikan.

7. Volatility

Volatility yakni data yang dikumpulkan per hari atau beberapa hari lalu mungkin berbeda dari data yang ada saat ini. Pada intinya, karakteristik ini berkaitan dengan perubahan data yang bisa berdampak pada homogenitas data.

8. Validity

Sekilas karakteristik ini memang hampir sama dengan veracity. Di sini, sebuah data yang terkumpul haruslah valid dan relevan sebelum bisa digunakan, khususnya untuk tujuan-tujuan tertentu agar bisa berjalan dengan baik.

9. Vulnerability

Karakteristik big data yang tak kalah penting ialah mengedepankan keamanan. Dalam hal ini, big data harus mampu terlindung dari hal-hal yang tak diinginkan. Misalnya, peretasan yang dilakukan oleh pihak-pihak tak bertanggung jawab.

10. Variability

Hal ini menyangkut perubahan data yang berbeda-beda. Data yang berbeda tersebut bisa berdampak pada karakteristik lainnya, misalnya saja pada proses dan kecepatan transfer data.

Kesimpulan

Berdasarkan ulasan di atas, memahami jenis dan karakteristik big data adalah hal yang paling penting, terutama jika Anda ingin membuat sebuah sistem operasi dan pemrograman tertentu. Pastikan karakteristik tersebut Anda perhatikan dengan baik untuk menunjang optimalisasi operasi program.

Selain itu, Anda juga bisa lebih mengetahui beragam hal penting lainnya seputar data dengan mengikuti kelas data science yang diselenggarakan oleh Algoritma Data Science School. Kemudian, pilihlah kelas dan kursus yang sesuai dengan kebutuhan Anda.

Referensi:

  • hootsuite – 35 Instagram Stats That Matter to Marketers in 2022
  • analytixlabs – Characteristics of Big Data
  • upgrad  – Characteristics of Big Data: Types & 5V’s
  • tdwi – The 10 Vs of Big Data

Yuk belajar data science di Algoritma Data Science Education Center! Kamu bisa ikut berbagai kelas data science untuk pemula, salah satunya di program Academy kami.

PELAJARI LEBIH LANJUT

Related Blog

Real Time Processing
Perbedaan Batch Processing dan Real Time Processing
Metode Pengolahan Data
Tipe, Langkah, dan Metode Pengolahan Data
Batch Processing
Mengenal Batch Processing dan Implementasinya