fbpx
jenis-jenis data dalam data science

Jenis-jenis Data

03 Februari 2022

Sementara istilah ‘data’ dan ‘statistik’ sering dianggap sama, dalam penelitian ilmiah sebenarnya terdapat perbedaan penting di antara keduanya. Data merupakan bagian individu dari informasi faktual yang direkam dan digunakan untuk tujuan analisis, bisa juga mengacu pada informasi mentah untuk membuat statistik. Sementara itu, statistik adalah hasil analisis data, interpretasi, dan penyajiannya. 

Dengan kata lain, data perlu diolah terlebih dulu agar lebih mudah dipahami. Di sisi lain, statistik seringkali disajikan dalam bentuk tabel, bagan, atau grafik meskipun hal tersebut tidak diwajibkan. Baik statistik maupun data sering digunakan dalam penelitian ilmiah oleh data scientist. Untuk data scientist pemula, ada beberapa jenis data yang wajib dipahami agar dapat memperoleh pemahaman yang lebih baik tentang data yang diolah. Berikut informasinya!

Jenis-jenis Data

Dalam statistik, jenis-jenis data memainkan peran sangat penting yang perlu dipahami untuk menerapkan pengukuran statistik dengan benar, juga agar Anda dapat menyimpulkan asumsi tertentu tentang data dengan benar. Beberapa jenis data yang wajib dipahami oleh data scientist pemula adalah:

1. Data kuantitatif 

data kuantitatif

Data kuantitatif adalah data yang menyatakan besaran, jumlah, atau jangkauan tertentu. Biasanya, terdapat unit pengukuran yang terkait dengan data, misalnya meter dalam pengukuran tinggi badan seseorang. Contoh data kuantitatif adalah skor tes dan ujian, berat badan seseorang, atau suhu dalam sebuah ruangan. Jenis data ini dibagi lagi menjadi dua jenis, yakni:

Data diskrit

Sederhananya, data diskrit hanya dapat mengambil nilai-nilai tertentu dan variabel data tidak dapat dibagi menjadi bagian-bagian yang lebih kecil. Contoh data diskrit adalah banyaknya siswa dalam satu kelas, jumlah pekerja di suatu perusahaan, atau jumlah soal tes yang dijawab dengan benar.

Data kontinu

Jenis data ini mewakili informasi yang dapat dibagi ke dalam tingkat yang lebih halus atau dapat diukur berdasarkan skala. Hampir semua nilainya juga bersifat numerik. Misalnya, tinggi badan bisa diukur pada skala yang sangat tepat dalam satuan yang berbeda, seperti meter, centimeter, millimeter, dan lain sebagainya.

Perbedaan utamanya dengan data diskrit adalah data kontinu bisa direkam pada banyak pengukuran yang berbeda seperti lebar, suhu, dan waktu. Contoh data kontinu adalah jumlah waktu yang dibutuhkan untuk menyelesaikan suatu proyek, kecepatan mobil, dan lain-lain.

2. Data Kualitatif

data kualitatif

Data kualitatif didefinisikan sebagai data yang mendekati dan mencirikan, serta dapat diamati dan dicatat. Tipe data ini bersifat non-numerik dan dikumpulkan melalui metode observasi, wawancara, focus group, dan metode serupa. Jenis data ini penting dalam menentukan frekuensi sifat atau karakteristik tertentu yang memungkinkan ahli statistik membentuk parameter di mana kumpulan data yang lebih besar dapat diamati. 

Data kualitatif menyediakan sarana bagi pengamat untuk mengukur dunia di sekitar mereka. Contohnya, bagi seorang peneliti pasar, mengumpulkan data kualitatif membantu dalam menjawab beberapa pertanyaan, seperti siapa pelanggan mereka, masalah apa yang mereka hadapi, dan aspek apa yang perlu dijadikan pusat perhatian sehingga masalah tersebut dapat diselesaikan.

3. Data interval

data interval

Data interval (integer) didefinisikan sebagai tipe data yang diukur sepanjang skala, di mana setiap titiknya ditempatkan pada jarak yang sama satu sama lain. Data interval selalu muncul dalam bentuk angka atau nilai numerik dengan jarak antara dua titik distandarisasi dan sama. Berikut beberapa karakteristik utama data interval: 

Pengukuran 

Data interval diukur menggunakan skala interval yang tidak hanya menunjukkan urutan dan arah, tapi juga perbedaan nilai yang tepat. Misalnya, tanda-tanda pada termometer atau penggaris berjarak sama, sehingga mengukur jarak yang sama antara dua tanda.

Selisih Interval

Jarak antara setiap nilai pada data interval adalah sama. Misalnya, perbedaan antara 10 cm dan 20 cm sama dengan 20 cm dan 30 cm. 

Perhitungan

Dalam data interval, nilai dapat ditambah atau dikurangi, tapi tidak dapat dibagi atau dikalikan. Hampir semua analisis statistik dapat diterapkan saat menghitung data interval.

Titik Nol 

Titik nol mutlak bersifat arbitrer, yang berarti suatu variabel dapat diukur meskipun memiliki nilai negatif, seperti suhu yang dapat dihitung -10 di bawah nol.

4. Data Rasio

data rasio

Memainkan peran yang efektif dalam riset pasar, data rasio adalah jenis data numerik yang bersifat kuantitatif. Data rasio yang dikumpulkan pada skala rasio memiliki jarak yang sama antara nilai-nilai yang berdekatan. Karakteristik ini membuat data rasio mirip dengan data interval, tetapi berbeda karena faktor nol mutlak. 

Titik nol pada data rasio memiliki kehadiran yang berarti. Adanya nol berarti tidak boleh ada variabel negatif dalam data rasio. Ciri-ciri data rasio adalah data tersebut dapat diukur dan diurutkan. Selain itu, variabelnya juga berjarak sama dan dapat berupa data kontinu atau diskrit. Contoh data rasio adalah:

Skala Kelvin

Salah satu contoh data rasio yang paling terkenal adalah suhu pada skala Kelvin. Derajat O dalam skala Kelvin menunjukkan ketiadaan total energi panas. 

Tinggi

Tinggi atau panjang diukur dalam meter, inci, atau kaki. Tinggi tidak boleh memiliki nilai negatif. Nol adalah titik awal ketinggian dan jarak antara dua variabel yang berdekatan juga sama. Misalnya, pohon setinggi 10 kaki bisa disebut dua kali pohon setinggi 5 kaki. 

Kecepatan

Kecepatan juga bisa menjadi contoh skala rasio. Dua kecepatan pada satu skala akan memiliki rasio yang sama dengan dua kecepatan pada skala lain. Misalnya, rasio antara 72 km/jam hingga 36 km/jam adalah 2 dan rasio antara 44.738 mph hingga 22.369 mph juga adalah 2.

5. Data ordinal 

data ordinal jenis data

Data ordinal diklasifikasikan ke dalam variabel yang memiliki urutan peringkat alami, tetapi jarak antar kategori tidak diketahui. Misalnya, variabel “frekuensi latihan fisik” dapat dibagi dalam beberapa kategori, seperti tidak pernah, jarang, kadang-kadang, sering, dan selalu.

Sementara ada urutan yang jelas untuk kategori-kategori ini, tetapi tidak mungkin untuk mengatakan bahwa perbedaan antara “tidak pernah” dan “jarang” sama persis dengan perbedaan antara “kadang-kadang” dan “sering”. Oleh karena itu, skala ini disebut ordinal.

Dalam penelitian ilmiah sosial, variabel ordinal kerap kali menyertakan penilaian tentang persepsi, opini, atau faktor demografis yang dikategorikan ke dalam tingkatan atau tanda kurung (seperti status sosial atau pendapatan). Contoh skala ordinal adalah:

  • Kemampuan berbahasa yang dibagi menjadi pemula, intermediate, dan fasih.
  • Tingkat kesepakatan dengan kategori sangat tidak setuju, tidak setuju, netral, setuju, dan sangat setuju.
  • Tingkat pendapatan dengan pembagian pendapatan tingkat bawah, pendapatan tingkat menengah, dan pendapatan tingkat atas.

Kesimpulan

Dengan memahami jenis-jenis data yang digunakan dalam statistik dan penelitian ilmiah pada umumnya, data scientist pemula dapat mengolah data dengan benar dan mendapatkan hasil analisis yang paling sesuai. Data berdasarkan sifatnya dibagi menjadi dua jenis, yakni data kualitatif dan data kuantitatif. Beberapa jenis data lain, seperti data interval dan rasio, termasuk dalam bagian data kuantitatif, sedangkan data ordinal termasuk dalam bagian data kualitatif. 

Jika ingin memperdalam ilmu data untuk menjadi data scientist, Algoritma Data Science School menyediakan kurikulum terbaik untuk Anda. Tidak hanya membantu individu, pusat pendidikan ilmu data ini juga membantu perusahaan yang ingin memperdalam kemampuan mengolah data.

Referensi:

  • analyticsvidhya – Complete Guide to Data Types in Statistics for Data Science

Yuk belajar data science di Algoritma Data Science Education Center! Kamu bisa ikut berbagai kelas data science untuk pemula, salah satunya di program Academy kami.

PELAJARI LEBIH LANJUT

The last comment and 1 other comment(s) need to be approved.

Related Blog

Distributed Processing
Apa Itu Data Analysis Expressions?
jadi data scientist
Cara Menjadi Data Scientist Handal
Distributed Processing
Mengenal Apa Itu Distributed Processing

Sementara istilah ‘data’ dan ‘statistik’ sering dianggap sama, dalam penelitian ilmiah sebenarnya terdapat perbedaan penting di antara keduanya. Data merupakan bagian individu dari informasi faktual yang direkam dan digunakan untuk tujuan analisis, bisa juga mengacu pada informasi mentah untuk membuat statistik. Sementara itu, statistik adalah hasil analisis data, interpretasi, dan penyajiannya. 

Dengan kata lain, data perlu diolah terlebih dulu agar lebih mudah dipahami. Di sisi lain, statistik seringkali disajikan dalam bentuk tabel, bagan, atau grafik meskipun hal tersebut tidak diwajibkan. Baik statistik maupun data sering digunakan dalam penelitian ilmiah oleh data scientist. Untuk data scientist pemula, ada beberapa jenis data yang wajib dipahami agar dapat memperoleh pemahaman yang lebih baik tentang data yang diolah. Berikut informasinya!

Jenis-jenis Data

Dalam statistik, jenis-jenis data memainkan peran sangat penting yang perlu dipahami untuk menerapkan pengukuran statistik dengan benar, juga agar Anda dapat menyimpulkan asumsi tertentu tentang data dengan benar. Beberapa jenis data yang wajib dipahami oleh data scientist pemula adalah:

1. Data kuantitatif 

data kuantitatif

Data kuantitatif adalah data yang menyatakan besaran, jumlah, atau jangkauan tertentu. Biasanya, terdapat unit pengukuran yang terkait dengan data, misalnya meter dalam pengukuran tinggi badan seseorang. Contoh data kuantitatif adalah skor tes dan ujian, berat badan seseorang, atau suhu dalam sebuah ruangan. Jenis data ini dibagi lagi menjadi dua jenis, yakni:

Data Diskrit

Sederhananya, data diskrit hanya dapat mengambil nilai-nilai tertentu dan variabel data tidak dapat dibagi menjadi bagian-bagian yang lebih kecil. Contoh data diskrit adalah banyaknya siswa dalam satu kelas, jumlah pekerja di suatu perusahaan, atau jumlah soal tes yang dijawab dengan benar.

Data Kontinu

Jenis data ini mewakili informasi yang dapat dibagi ke dalam tingkat yang lebih halus atau dapat diukur berdasarkan skala. Hampir semua nilainya juga bersifat numerik. Misalnya, tinggi badan bisa diukur pada skala yang sangat tepat dalam satuan yang berbeda, seperti meter, centimeter, millimeter, dan lain sebagainya.

Perbedaan utamanya dengan data diskrit adalah data kontinu bisa direkam pada banyak pengukuran yang berbeda seperti lebar, suhu, dan waktu. Contoh data kontinu adalah jumlah waktu yang dibutuhkan untuk menyelesaikan suatu proyek, kecepatan mobil, dan lain-lain.

2. Data Kualitatif

data kualitatif

Data kualitatif didefinisikan sebagai data yang mendekati dan mencirikan, serta dapat diamati dan dicatat. Tipe data ini bersifat non-numerik dan dikumpulkan melalui metode observasi, wawancara, focus group, dan metode serupa. Jenis data ini penting dalam menentukan frekuensi sifat atau karakteristik tertentu yang memungkinkan ahli statistik membentuk parameter di mana kumpulan data yang lebih besar dapat diamati. 

Data kualitatif menyediakan sarana bagi pengamat untuk mengukur dunia di sekitar mereka. Contohnya, bagi seorang peneliti pasar, mengumpulkan data kualitatif membantu dalam menjawab beberapa pertanyaan, seperti siapa pelanggan mereka, masalah apa yang mereka hadapi, dan aspek apa yang perlu dijadikan pusat perhatian sehingga masalah tersebut dapat diselesaikan.

3. Data Interval

data interval

Data interval (integer) didefinisikan sebagai tipe data yang diukur sepanjang skala, di mana setiap titiknya ditempatkan pada jarak yang sama satu sama lain. Data interval selalu muncul dalam bentuk angka atau nilai numerik dengan jarak antara dua titik distandarisasi dan sama. Berikut beberapa karakteristik utama data interval: 

Pengukuran 

Data interval diukur menggunakan skala interval yang tidak hanya menunjukkan urutan dan arah, tapi juga perbedaan nilai yang tepat. Misalnya, tanda-tanda pada termometer atau penggaris berjarak sama, sehingga mengukur jarak yang sama antara dua tanda.

Selisih Interval

Jarak antara setiap nilai pada data interval adalah sama. Misalnya, perbedaan antara 10 cm dan 20 cm sama dengan 20 cm dan 30 cm. 

Perhitungan

Dalam data interval, nilai dapat ditambah atau dikurangi, tapi tidak dapat dibagi atau dikalikan. Hampir semua analisis statistik dapat diterapkan saat menghitung data interval.

Titik Nol 

Titik nol mutlak bersifat arbitrer, yang berarti suatu variabel dapat diukur meskipun memiliki nilai negatif, seperti suhu yang dapat dihitung -10 di bawah nol.

4. Data Rasio

data rasio

Memainkan peran yang efektif dalam riset pasar, data rasio adalah jenis data numerik yang bersifat kuantitatif. Data rasio yang dikumpulkan pada skala rasio memiliki jarak yang sama antara nilai-nilai yang berdekatan. Karakteristik ini membuat data rasio mirip dengan data interval, tetapi berbeda karena faktor nol mutlak. 

Titik nol pada data rasio memiliki kehadiran yang berarti. Adanya nol berarti tidak boleh ada variabel negatif dalam data rasio. Ciri-ciri data rasio adalah data tersebut dapat diukur dan diurutkan. Selain itu, variabelnya juga berjarak sama dan dapat berupa data kontinu atau diskrit. Contoh data rasio adalah:

Skala Kelvin

Salah satu contoh data rasio yang paling terkenal adalah suhu pada skala Kelvin. Derajat O dalam skala Kelvin menunjukkan ketiadaan total energi panas. 

Tinggi

Tinggi atau panjang diukur dalam meter, inci, atau kaki. Tinggi tidak boleh memiliki nilai negatif. Nol adalah titik awal ketinggian dan jarak antara dua variabel yang berdekatan juga sama. Misalnya, pohon setinggi 10 kaki bisa disebut dua kali pohon setinggi 5 kaki. 

Kecepatan

Kecepatan juga bisa menjadi contoh skala rasio. Dua kecepatan pada satu skala akan memiliki rasio yang sama dengan dua kecepatan pada skala lain. Misalnya, rasio antara 72 km/jam hingga 36 km/jam adalah 2 dan rasio antara 44.738 mph hingga 22.369 mph juga adalah 2.

5. Data Ordinal 

data ordinal jenis data

Data ordinal diklasifikasikan ke dalam variabel yang memiliki urutan peringkat alami, tetapi jarak antar kategori tidak diketahui. Misalnya, variabel “frekuensi latihan fisik” dapat dibagi dalam beberapa kategori, seperti tidak pernah, jarang, kadang-kadang, sering, dan selalu.

Sementara ada urutan yang jelas untuk kategori-kategori ini, tetapi tidak mungkin untuk mengatakan bahwa perbedaan antara “tidak pernah” dan “jarang” sama persis dengan perbedaan antara “kadang-kadang” dan “sering”. Oleh karena itu, skala ini disebut ordinal.

Dalam penelitian ilmiah sosial, variabel ordinal kerap kali menyertakan penilaian tentang persepsi, opini, atau faktor demografis yang dikategorikan ke dalam tingkatan atau tanda kurung (seperti status sosial atau pendapatan). Contoh skala ordinal adalah:

  • Kemampuan berbahasa yang dibagi menjadi pemula, intermediate, dan fasih.
  • Tingkat kesepakatan dengan kategori sangat tidak setuju, tidak setuju, netral, setuju, dan sangat setuju.
  • Tingkat pendapatan dengan pembagian pendapatan tingkat bawah, pendapatan tingkat menengah, dan pendapatan tingkat atas.

Kesimpulan

Dengan memahami jenis-jenis data yang digunakan dalam statistik dan penelitian ilmiah pada umumnya, data scientist pemula dapat mengolah data dengan benar dan mendapatkan hasil analisis yang paling sesuai. Data berdasarkan sifatnya dibagi menjadi dua jenis, yakni data kualitatif dan data kuantitatif. Beberapa jenis data lain, seperti data interval dan rasio, termasuk dalam bagian data kuantitatif, sedangkan data ordinal termasuk dalam bagian data kualitatif. 

Jika ingin memperdalam ilmu data untuk menjadi data scientist, Algoritma Data Science School menyediakan kurikulum terbaik untuk Anda. Tidak hanya membantu individu, pusat pendidikan ilmu data ini juga membantu perusahaan yang ingin memperdalam kemampuan mengolah data.

Yuk belajar data science di Algoritma Data Science Education Center! Kamu bisa ikut berbagai kelas data science untuk pemula, salah satunya di program Academy kami.

PELAJARI LEBIH LANJUT

Related Blog

Real Time Processing
Perbedaan Batch Processing dan Real Time Processing
Metode Pengolahan Data
Tipe, Langkah, dan Metode Pengolahan Data
Batch Processing
Mengenal Batch Processing dan Implementasinya
The last comment and 1 other comment(s) need to be approved.