Visualisasi data merupakan salah satu aspek paling penting dalam analisis statistik. Dengan grafik dan plot yang tepat, data kompleks dapat diubah menjadi informasi yang mudah dipahami dan diinterpretasikan. Artikel ini akan membahas secara komprehensif berbagai jenis grafik statistik mulai dari stem-and-leaf plot, dot plot, pie chart, pareto chart, scatter plot, hingga time series chart, serta ukuran tendensi sentral seperti mean, median, dan modus.
📑 Daftar Isi
1. Stem-and-Leaf Plot (Plot Batang-Daun)
Stem-and-leaf plot adalah metode visualisasi data yang mengelompokkan data dengan memisahkan setiap angka menjadi dua bagian: stem (batang) yang biasanya merupakan digit paling kiri, dan leaf (daun) yang merupakan digit paling kanan. Teknik ini termasuk dalam exploratory data analysis (analisis data eksploratif).
Data berikut merepresentasikan usia 30 mahasiswa dalam kelas statistik:
| Usia Mahasiswa | |||||
|---|---|---|---|---|---|
| 18 | 20 | 21 | 27 | 29 | 20 |
| 19 | 30 | 32 | 19 | 34 | 19 |
| 24 | 29 | 18 | 37 | 38 | 22 |
| 30 | 39 | 32 | 44 | 33 | 46 |
| 54 | 49 | 18 | 51 | 21 | 21 |
Stem-and-Leaf Plot Standar:
-----|---------------------
1 | 8 8 8 9 9 9
2 | 0 0 1 1 1 2 4 7 9 9
3 | 0 0 2 2 3 4 7 8 9
4 | 4 6 9
5 | 1 4
Key: 1|8 = 18
Stem-and-Leaf Plot dengan Dua Baris per Stem:
-----|---------------------
1 | 8 8 8 9 9 9
1 |
2 | 0 0 1 1 1 2 4
2 | 7 9 9
3 | 0 0 2 2 3 4
3 | 7 8 9
4 | 4
4 | 6 9
5 | 1 4
5 |
Key: 1|8 = 18
- Menampilkan bentuk distribusi data sekaligus nilai aktual
- Memudahkan identifikasi pola dan outlier
- Dari contoh di atas, dapat disimpulkan bahwa lebih dari 50% data berada di antara usia 20 dan 34 tahun
2. Dot Plot (Diagram Titik)
Dot plot adalah visualisasi data di mana setiap entri data diplot menggunakan titik di atas sumbu horizontal. Metode ini sangat efektif untuk dataset berukuran kecil hingga menengah.
Menggunakan data usia 30 mahasiswa yang sama, dalam dot plot setiap usia akan direpresentasikan dengan satu titik. Jika ada beberapa mahasiswa dengan usia yang sama, titik-titik akan ditumpuk secara vertikal.
• •
• • •
• • • • • • • • •
• • • • • • • • • • • • • • • • • • •
|---|---|---|---|---|---|---|---|---|
18 20 22 24 26 28 30 32 34 36 38 40 42 44 46 48 50 52 54
Dari dot plot di atas, kita dapat dengan mudah menyimpulkan bahwa sebagian besar nilai (data usia) terkonsentrasi di antara 18 dan 32 tahun. Metode ini sangat visual dan intuitif untuk memahami distribusi data.
3. Pie Chart (Diagram Lingkaran)
Pie chart adalah lingkaran yang dibagi menjadi beberapa sektor yang merepresentasikan kategori. Luas setiap sektor proporsional dengan frekuensi masing-masing kategori. Pie chart sangat efektif untuk menunjukkan proporsi bagian terhadap keseluruhan.
Langkah-Langkah Membuat Pie Chart
Langkah 1: Data Mentah
| Jenis Kecelakaan | Frekuensi |
|---|---|
| Kendaraan Bermotor | 43,500 |
| Jatuh (Falls) | 12,200 |
| Keracunan (Poison) | 6,400 |
| Tenggelam (Drowning) | 4,600 |
| Kebakaran (Fire) | 4,200 |
| Tertelan Makanan/Objek | 2,900 |
| Senjata Api (Firearms) | 1,400 |
| Total (n) | 75,200 |
Langkah 2: Hitung Frekuensi Relatif
| Jenis Kecelakaan | Frekuensi | Frekuensi Relatif |
|---|---|---|
| Kendaraan Bermotor | 43,500 | 0.578 (57.8%) |
| Jatuh | 12,200 | 0.162 (16.2%) |
| Keracunan | 6,400 | 0.085 (8.5%) |
| Tenggelam | 4,600 | 0.061 (6.1%) |
| Kebakaran | 4,200 | 0.056 (5.6%) |
| Tertelan Makanan/Objek | 2,900 | 0.039 (3.9%) |
| Senjata Api | 1,400 | 0.019 (1.9%) |
Langkah 3: Hitung Sudut Pusat (Central Angle)
| Jenis Kecelakaan | Frekuensi Relatif | Sudut |
|---|---|---|
| Kendaraan Bermotor | 0.578 | 208.2° |
| Jatuh | 0.162 | 58.4° |
| Keracunan | 0.085 | 30.6° |
| Tenggelam | 0.061 | 22.0° |
| Kebakaran | 0.056 | 20.1° |
| Tertelan Makanan/Objek | 0.039 | 13.9° |
| Senjata Api | 0.019 | 6.7° |
Dari pie chart yang dihasilkan, terlihat jelas bahwa kecelakaan kendaraan bermotor mendominasi dengan 57.8%, hampir enam kali lipat dari kategori kedua terbesar (Jatuh, 16.2%). Ini memberikan visual yang kuat untuk pengambilan keputusan terkait prioritas keselamatan.
4. Pareto Chart (Diagram Pareto)
Pareto chart adalah grafik batang vertikal di mana tinggi setiap batang merepresentasikan frekuensi. Batang-batang disusun berdasarkan urutan tinggi menurun, dengan batang tertinggi di sebelah kiri. Grafik ini sangat berguna untuk mengidentifikasi masalah atau kategori yang paling signifikan.
Menggunakan data yang sama dari contoh pie chart, kita dapat membuat pareto chart untuk melihat kategori mana yang paling berkontribusi terhadap total kematian:
| █
40,000 | █
| █
30,000 | █
| █
20,000 | █
| █ █
10,000 | █ █ █
| █ █ █ █ █ █ █
0 |_____|_____|_____|__|__|__|__|
Motor Falls Poison D F I FA
Vehicle r i n i
o r g r
w e e e
n s a
i t r
n i m
g o s
n
Pareto chart membantu mengidentifikasi prinsip 80/20, di mana sekitar 80% dari efek berasal dari 20% penyebab. Dalam contoh ini, kecelakaan kendaraan bermotor dan jatuh menyumbang lebih dari 74% total kematian, sehingga upaya pencegahan dapat difokuskan pada kedua kategori ini.
5. Scatter Plot (Diagram Pencar)
Scatter plot digunakan ketika setiap entri dalam satu set data berpasangan dengan entri di set data lainnya. Dataset seperti ini disebut paired data sets. Dalam scatter plot, pasangan data yang terurut digambarkan sebagai titik-titik dalam bidang koordinat untuk menunjukkan hubungan antara dua variabel kuantitatif.
Scatter plot berikut merepresentasikan hubungan antara jumlah ketidakhadiran dalam kelas selama satu semester dan nilai akhir mahasiswa:
| • •
90 | • • •
| • • •
80 | • • •
| • • •
70 |• • •
|• •
60 |•
|
50 |___________________________
0 2 4 6 8 10 12 14 16
Jumlah Ketidakhadiran
Interpretasi: Dari scatter plot, terlihat jelas bahwa ketika jumlah ketidakhadiran meningkat, nilai akhir cenderung menurun. Ini menunjukkan korelasi negatif antara kedua variabel.
- Korelasi Positif: Ketika satu variabel meningkat, variabel lainnya juga meningkat
- Korelasi Negatif: Ketika satu variabel meningkat, variabel lainnya menurun
- Tidak Ada Korelasi: Tidak ada pola atau hubungan yang jelas antara kedua variabel
6. Time Series Chart (Grafik Deret Waktu)
Dataset yang terdiri dari entri data kuantitatif yang diambil pada interval reguler selama periode waktu tertentu disebut time series. Time series chart digunakan untuk memvisualisasikan data time series dan sangat berguna untuk mengidentifikasi tren, pola musiman, dan anomali.
Tabel berikut menunjukkan jumlah menit yang digunakan Robert pada ponselnya selama enam bulan terakhir:
| Bulan | Menit |
|---|---|
| Januari | 236 |
| Februari | 242 |
| Maret | 188 |
| April | 175 |
| Mei | 199 |
| Juni | 135 |
Time Series Chart:
250 | •
| • •
200 | • •
| •
150 | •
|
100 |_________________________
Jan Feb Mar Apr Mei Jun
Dari time series chart di atas, kita dapat mengamati bahwa penggunaan telepon cenderung menurun dari Januari hingga Juni, dengan penurunan yang paling signifikan terjadi dari Mei ke Juni. Informasi ini dapat membantu dalam perencanaan paket telepon atau analisis pola komunikasi.
7. Ukuran Tendensi Sentral (Measures of Central Tendency)
Ukuran tendensi sentral adalah nilai yang merepresentasikan nilai tipikal atau pusat dari suatu dataset. Tiga ukuran yang paling umum digunakan adalah mean (rata-rata), median (nilai tengah), dan mode (modus).
7.1 Mean (Rata-Rata)
Mean adalah jumlah dari semua entri data dibagi dengan jumlah entri.
Mean Sampel (x̄) = Σx / n
Berikut adalah usia dari semua tujuh karyawan di sebuah perusahaan kecil:
Data: 53, 32, 61, 57, 39, 44, 57
μ = (53 + 32 + 61 + 57 + 39 + 44 + 57) / 7
μ = 343 / 7
μ = 49 tahun
Kesimpulan: Rata-rata usia karyawan adalah 49 tahun.
7.2 Median (Nilai Tengah)
Median adalah nilai yang terletak di tengah dataset ketika data diurutkan. Jika dataset memiliki jumlah entri ganjil, median adalah entri tengah. Jika jumlah entri genap, median adalah rata-rata dari dua entri tengah.
Data (belum terurut): 53, 32, 61, 57, 39, 44, 57
Data (terurut): 32, 39, 44, 53, 57, 57, 61
Median = 53 tahun
Kesimpulan: Median usia karyawan adalah 53 tahun.
7.3 Mode (Modus)
Mode adalah entri data yang muncul dengan frekuensi terbesar. Jika tidak ada entri yang berulang, dataset tidak memiliki mode. Jika dua entri muncul dengan frekuensi terbesar yang sama, dataset disebut bimodal.
Data: 53, 32, 61, 57, 39, 44, 57
32: 1 kali
39: 1 kali
44: 1 kali
53: 1 kali
57: 2 kali ← Paling sering muncul
61: 1 kali
Mode = 57 tahun
Kesimpulan: Modus usia karyawan adalah 57 tahun karena nilai ini muncul dua kali, lebih sering dari nilai lainnya.
7.4 Perbandingan Mean, Median, dan Mode
Sekarang, seorang karyawan baru berusia 29 tahun bergabung dengan perusahaan. Data baru: 53, 32, 61, 57, 39, 44, 57, 29
Data terurut: 29, 32, 39, 44, 53, 57, 57, 61
| Ukuran | Sebelum (7 karyawan) | Sesudah (8 karyawan) | Perubahan |
|---|---|---|---|
| Mean | 49 tahun | 46.5 tahun | Menurun ✓ |
| Median | 53 tahun | 48.5 tahun | Menurun ✓ |
| Mode | 57 tahun | 57 tahun | Tetap sama |
- Mean memperhitungkan setiap nilai dan sangat dipengaruhi oleh outlier
- Median dan Mode tidak dipengaruhi oleh nilai ekstrem
- Pilih ukuran tendensi sentral yang sesuai dengan karakteristik data Anda
7.5 Weighted Mean (Rata-Rata Tertimbang)
Weighted mean adalah rata-rata dari dataset yang entri-entrinya memiliki bobot berbeda-beda.
di mana w adalah bobot dari setiap entri x
Nilai dalam kelas statistik memiliki bobot sebagai berikut:
- Ujian (Tests): 50% dari nilai
- Tugas (Homework): 30% dari nilai
- Ujian Akhir (Final): 20% dari nilai
Seorang mahasiswa mendapatkan total 80 poin untuk ujian, 100 poin untuk tugas, dan 85 poin untuk ujian akhir. Berapa nilai akhirnya?
| Sumber | Skor (x) | Bobot (w) | x · w |
|---|---|---|---|
| Ujian | 80 | 0.50 | 40 |
| Tugas | 100 | 0.30 | 30 |
| Ujian Akhir | 85 | 0.20 | 17 |
| Total | 1.00 | 87 |
Nilai Akhir = (40 + 30 + 17) / 1.00
Nilai Akhir = 87 / 1.00
Nilai Akhir = 87%
Kesimpulan: Nilai akhir mahasiswa adalah 87%.
7.6 Mean dari Distribusi Frekuensi
Ketika data disajikan dalam bentuk distribusi frekuensi, mean dapat dihitung menggunakan titik tengah kelas (midpoint).
di mana x adalah titik tengah kelas dan f adalah frekuensi
| Kelas | Titik Tengah (x) | Frekuensi (f) | x · f |
|---|---|---|---|
| 18 – 25 | 21.5 | 13 | 279.5 |
| 26 – 33 | 29.5 | 8 | 236.0 |
| 34 – 41 | 37.5 | 4 | 150.0 |
| 42 – 49 | 45.5 | 3 | 136.5 |
| 50 – 57 | 53.5 | 2 | 107.0 |
| Total | n = 30 | Σ = 909.0 |
Mean = 909.0 / 30
Mean = 30.3 tahun
Kesimpulan: Rata-rata usia mahasiswa dalam distribusi frekuensi ini adalah 30.3 tahun.
8. Bentuk-Bentuk Distribusi Data
Memahami bentuk distribusi data sangat penting untuk memilih ukuran tendensi sentral yang tepat dan menginterpretasikan data dengan benar.
8.1 Distribusi Simetris (Symmetric Distribution)
Distribusi frekuensi adalah simetris ketika garis vertikal dapat ditarik melalui tengah grafik distribusi dan kedua bagian yang dihasilkan merupakan bayangan cermin yang hampir sempurna.
- Mean = Median = Mode
- Data terdistribusi merata di sekitar pusat
- Tidak ada skewness (kemiringan)
8.2 Distribusi Uniform (Uniform Distribution)
Distribusi uniform (atau rectangular) adalah ketika semua entri atau kelas dalam distribusi memiliki frekuensi yang sama. Distribusi uniform juga termasuk distribusi simetris.
8.3 Distribusi Skewed (Miring)
Distribusi frekuensi adalah skewed jika "ekor" grafik memanjang lebih ke satu sisi dibanding sisi lainnya.
Skewed Left (Negatively Skewed)
Ekor distribusi memanjang ke kiri
Hubungan:
Contoh: Data pendapatan 10 orang dengan outlier sangat rendah (penghasilan $0)
- Mean = $23,500
- Median = Mode = $25,000
Skewed Right (Positively Skewed)
Ekor distribusi memanjang ke kanan
Hubungan:
Contoh: Data pendapatan 10 orang dengan outlier sangat tinggi (penghasilan $1,000,000)
- Mean = $121,500
- Median = Mode = $25,000
Distribusi Simetris - 10 Pendapatan Tahunan:
$25,000, $26,000, $28,000, $30,000, $35,000
Mean = Median = Mode ≈ $25,000
Distribusi Skewed Left (ekor ke kiri):
$25,000, $26,000, $28,000, $30,000, $35,000
Mean = $23,500 (ditarik ke kiri oleh $0)
Median = Mode = $25,000
Mean < Median
Distribusi Skewed Right (ekor ke kanan):
$25,000, $26,000, $28,000, $30,000, $1,000,000
Mean = $121,500 (ditarik ke kanan oleh $1,000,000)
Median = Mode = $25,000
Mean > Median
- Distribusi Simetris: Gunakan mean karena merepresentasikan pusat data dengan baik
- Distribusi Skewed Left: Gunakan median karena tidak terpengaruh oleh outlier rendah
- Distribusi Skewed Right: Gunakan median karena tidak terpengaruh oleh outlier tinggi
- Data Kategorikal: Gunakan mode
🎯 Latihan dan Contoh Kasus
Data penjualan bulanan (dalam Rupiah) untuk Toko A dan Toko B selama 12 bulan:
| Bulan | Toko A (Rp) | Toko B (Rp) |
|---|---|---|
| Januari | 500,000 | 450,000 |
| Februari | 550,000 | 480,000 |
| Maret | 600,000 | 500,000 |
| April | 580,000 | 550,000 |
| Mei | 630,000 | 620,000 |
| Juni | 650,000 | 580,000 |
| Juli | 700,000 | 650,000 |
| Agustus | 750,000 | 680,000 |
| September | 800,000 | 700,000 |
| Oktober | 820,000 | 750,000 |
| November | 780,000 | 800,000 |
| Desember | 850,000 | 820,000 |
Tugas Analisis:
- Buatlah grafik (bar chart atau line chart) untuk membandingkan penjualan bulanan Toko A dan B
- Identifikasi bulan-bulan di mana Toko A mengungguli Toko B
- Identifikasi bulan-bulan di mana Toko B mengungguli Toko A
- Hitung mean, median, dan mode penjualan untuk kedua toko
- Analisis tren penjualan dan berikan rekomendasi
Analisis Hasil:
- Toko A mengungguli Toko B: Januari - Oktober (10 bulan)
- Toko B mengungguli Toko A: November (1 bulan)
- Kesimpulan: Toko A secara konsisten memiliki performa lebih baik sepanjang tahun, dengan tren pertumbuhan yang kuat terutama pada paruh kedua tahun (Juli-Desember)
📝 Kesimpulan
Visualisasi data dan ukuran tendensi sentral adalah alat fundamental dalam analisis statistik yang membantu kita:
- Memahami pola dan distribusi data dengan lebih baik
- Mengidentifikasi outlier dan anomali
- Membuat keputusan berdasarkan data yang solid
- Mengkomunikasikan temuan dengan cara yang jelas dan efektif
Ringkasan Grafik:
- Stem-and-Leaf Plot: Menampilkan distribusi sekaligus nilai aktual
- Dot Plot: Visualisasi sederhana untuk dataset kecil
- Pie Chart: Menunjukkan proporsi dari keseluruhan
- Pareto Chart: Mengidentifikasi faktor paling signifikan
- Scatter Plot: Menunjukkan hubungan antar variabel
- Time Series Chart: Menganalisis tren temporal
Ringkasan Ukuran Tendensi Sentral:
- Mean: Sensitif terhadap outlier, ideal untuk distribusi simetris
- Median: Robust terhadap outlier, ideal untuk data skewed
- Mode: Berguna untuk data kategorikal atau mengidentifikasi nilai paling umum

Komentar
Posting Komentar