Statistika Deskriptif Lengkap: Distribusi Frekuensi, Histogram, dan Implementasi PHP

🎯 Apa Itu Statistika Deskriptif?

Statistika deskriptif adalah cabang statistika yang berfokus pada pengumpulan, penyajian, dan analisis data untuk memberikan gambaran atau deskripsi tentang karakteristik data tersebut. Berbeda dengan statistika inferensial yang membuat kesimpulan tentang populasi, statistika deskriptif hanya menggambarkan data yang ada tanpa melakukan generalisasi.

💡 Mengapa Statistika Deskriptif Penting?

  • Memudahkan Pemahaman Data: Mengubah data mentah menjadi informasi yang mudah dipahami
  • Identifikasi Pola: Membantu menemukan pola dan tren dalam data
  • Dasar Pengambilan Keputusan: Memberikan informasi dasar untuk analisis lebih lanjut
  • Komunikasi Efektif: Menyajikan data dalam bentuk visual yang menarik

📋 Distribusi Frekuensi

Definisi Distribusi Frekuensi

Distribusi frekuensi adalah tabel yang menampilkan kelas atau interval data beserta jumlah data yang masuk ke dalam setiap kelas. Frekuensi (f) dari sebuah kelas adalah jumlah titik data yang ada dalam kelas tersebut.

📝 Contoh Distribusi Frekuensi Sederhana

Kelas Frekuensi (f)
1 – 4 4
5 – 8 5
9 – 12 3
13 – 16 4
17 – 20 2
Total 18

Istilah-Istilah Penting

1️⃣ Class Width (Lebar Kelas)

Lebar kelas adalah jarak antara batas bawah (atau batas atas) dari kelas-kelas yang berurutan. Dalam contoh di atas, lebar kelasnya adalah 4.

Lebar Kelas = Batas Atas - Batas Bawah + 1

2️⃣ Range (Rentang)

Range adalah selisih antara data maksimum dan data minimum dalam dataset.

Range = Data Maksimum - Data Minimum

🔧 Cara Membuat Distribusi Frekuensi

📌 Langkah-langkah Pembuatan Distribusi Frekuensi

  1. Tentukan jumlah kelas: Jumlah kelas harus antara 5 dan 20, untuk memudahkan deteksi pola
  2. Hitung lebar kelas: Tentukan range data, bagi dengan jumlah kelas, dan bulatkan ke atas
  3. Tentukan batas kelas: Gunakan nilai minimum sebagai batas bawah kelas pertama
  4. Buat tally marks: Tandai setiap data pada kelas yang sesuai
  5. Hitung frekuensi: Jumlahkan tally marks untuk mendapatkan frekuensi total

💼 Contoh Kasus: Umur Mahasiswa

Data berikut merepresentasikan umur 30 mahasiswa dalam kelas statistika. Buatlah distribusi frekuensi dengan 5 kelas!

Data Umur Mahasiswa (dalam tahun)
18 20 21 27 29 20
19 30 32 19 34 19
24 29 18 37 38 22
30 39 32 44 33 46
54 49 18 51 21 21

📊 Penyelesaian:

1Jumlah Kelas: Sudah ditentukan = 5 kelas

2Hitung Range dan Lebar Kelas:

  • Data Minimum = 18
  • Data Maksimum = 54
  • Range = 54 - 18 = 36
  • Lebar Kelas = 36 ÷ 5 = 7.2 ≈ 8 (dibulatkan ke atas)

3Tentukan Batas Kelas:

  • Kelas 1: 18 - 25
  • Kelas 2: 26 - 33
  • Kelas 3: 34 - 41
  • Kelas 4: 42 - 49
  • Kelas 5: 50 - 57

4Hasil Distribusi Frekuensi:

Kelas Umur (tahun) Frekuensi
1 18 - 25 13
2 26 - 33 8
3 34 - 41 4
4 42 - 49 3
5 50 - 57 2
Total 30

🧮 Komponen Penting dalam Distribusi Frekuensi

1. Midpoint (Titik Tengah Kelas)

Midpoint atau class mark adalah nilai tengah dari suatu kelas, yang dihitung dengan menjumlahkan batas bawah dan batas atas kelas, kemudian dibagi dua.

Midpoint = (Batas Bawah + Batas Atas) ÷ 2

Contoh Perhitungan Midpoint

Kelas Umur Perhitungan Midpoint
18 - 25 (18 + 25) ÷ 2 21.5
26 - 33 (26 + 33) ÷ 2 29.5
34 - 41 (34 + 41) ÷ 2 37.5
42 - 49 (42 + 49) ÷ 2 45.5
50 - 57 (50 + 57) ÷ 2 53.5

2. Relative Frequency (Frekuensi Relatif)

Frekuensi relatif adalah proporsi atau persentase data yang jatuh dalam suatu kelas. Untuk menghitung frekuensi relatif, bagi frekuensi kelas dengan total sampel (n).

Frekuensi Relatif = f ÷ n
f = frekuensi kelas, n = total data

Contoh Perhitungan Frekuensi Relatif

Kelas Umur Frekuensi (f) Perhitungan Frekuensi Relatif
18 - 25 13 13 ÷ 30 0.433 (43.3%)
26 - 33 8 8 ÷ 30 0.267 (26.7%)
34 - 41 4 4 ÷ 30 0.133 (13.3%)
42 - 49 3 3 ÷ 30 0.100 (10.0%)
50 - 57 2 2 ÷ 30 0.067 (6.7%)
Total 30 1.000 (100%)

3. Cumulative Frequency (Frekuensi Kumulatif)

Frekuensi kumulatif dari suatu kelas adalah jumlah frekuensi untuk kelas tersebut dan semua kelas sebelumnya. Ini berguna untuk mengetahui berapa banyak data yang berada di bawah nilai tertentu.

Contoh Perhitungan Frekuensi Kumulatif

Kelas Umur Frekuensi Frekuensi Kumulatif
18 - 25 13 13
26 - 33 8 13 + 8 = 21
34 - 41 4 21 + 4 = 25
42 - 49 3 25 + 3 = 28
50 - 57 2 28 + 2 = 30

4. Class Boundaries (Batas Kelas)

Batas kelas adalah angka yang memisahkan kelas tanpa membentuk celah di antara mereka. Batas kelas penting untuk pembuatan histogram yang akurat.

Cara Menghitung Class Boundaries:

  1. Hitung jarak antara batas atas kelas pertama dengan batas bawah kelas kedua
  2. Bagi jarak tersebut dengan 2
  3. Kurangi hasil tersebut dari batas bawah untuk mendapat batas bawah kelas
  4. Tambahkan hasil tersebut ke batas atas untuk mendapat batas atas kelas

Contoh Perhitungan Class Boundaries

Jarak dari 25 (batas atas kelas 1) ke 26 (batas bawah kelas 2) = 1

Setengah jarak = 1 ÷ 2 = 0.5

Kelas Umur Class Boundaries
18 - 25 17.5 - 25.5
26 - 33 25.5 - 33.5
34 - 41 33.5 - 41.5
42 - 49 41.5 - 49.5
50 - 57 49.5 - 57.5

📈 Jenis-jenis Grafik Statistik

1. Frequency Histogram (Histogram Frekuensi)

Histogram frekuensi adalah grafik batang yang merepresentasikan distribusi frekuensi dari dataset. Histogram memiliki karakteristik khusus yang membedakannya dari diagram batang biasa.

🎯 Karakteristik Histogram:

  • Skala Horizontal: Bersifat kuantitatif dan mengukur nilai data
  • Skala Vertikal: Mengukur frekuensi dari kelas
  • Batang Berdekatan: Batang-batang harus saling bersentuhan (tidak ada celah)
  • Lebar Batang: Mewakili lebar kelas atau interval

2. Frequency Polygon (Poligon Frekuensi)

Poligon frekuensi adalah grafik garis yang menekankan perubahan berkelanjutan dalam frekuensi. Grafik ini dibuat dengan menghubungkan titik-titik midpoint dari setiap kelas dengan garis.

3. Relative Frequency Histogram (Histogram Frekuensi Relatif)

Histogram frekuensi relatif memiliki bentuk dan skala horizontal yang sama dengan histogram frekuensi biasa, namun skala vertikalnya menunjukkan frekuensi relatif (dalam proporsi atau persentase) bukan frekuensi absolut.

4. Cumulative Frequency Graph / Ogive

Ogive adalah grafik garis yang menampilkan frekuensi kumulatif dari setiap kelas pada batas atas kelasnya. Grafik ini berguna untuk menentukan persentil dan kuartil data.

💡 Tips Memilih Jenis Grafik:

  • Histogram: Untuk melihat distribusi dan bentuk data secara keseluruhan
  • Poligon: Untuk membandingkan beberapa distribusi sekaligus
  • Histogram Relatif: Untuk membandingkan dataset dengan ukuran berbeda
  • Ogive: Untuk analisis persentil dan kuartil

💡 Contoh Soal dan Pembahasan Lengkap

Contoh 1: Data Berat Badan

35 orang mengikuti penelitian kesehatan dengan berat badan berikut (dalam kg):

Data Berat Badan (kg)
482150
324221
464756
275555
436025
465874
254643
414434
406351
586653
162839
3656

📊 Langkah Penyelesaian:

1Identifikasi Data:

  • Jumlah data (n) = 35
  • Data maksimum = 74 kg
  • Data minimum = 16 kg
  • Range = 74 - 16 = 58

2Hitung Jumlah Kelas:

Total Kelas = 1 + 3.3 log n
= 1 + 3.3 log 35
= 1 + 3.3 × 1.544
= 1 + 5.09
= 6.09 ≈ 6 kelas

3Hitung Lebar Kelas:

Lebar = Range ÷ Total Kelas
= 58 ÷ 6
= 9.67 ≈ 10

4Tabel Distribusi Frekuensi:

Kelas Berat Badan (kg) Class Boundary Frekuensi Midpoint
1 16 - 25 15.5 - 25.5 5 20.5
2 26 - 35 25.5 - 35.5 4 30.5
3 36 - 45 35.5 - 45.5 8 40.5
4 46 - 55 45.5 - 55.5 10 50.5
5 56 - 65 55.5 - 65.5 6 60.5
6 66 - 75 65.5 - 75.5 2 70.5
Total 35

Contoh 2: Menghitung Mean dari Distribusi Frekuensi

Hitunglah rata-rata (mean) dari distribusi frekuensi berikut:

Skor Frekuensi Midpoint f × Midpoint
31 - 40 3 35.5 106.5
41 - 50 5 45.5 227.5
51 - 60 10 55.5 555.0
61 - 70 11 65.5 720.5
71 - 80 8 75.5 604.0
81 - 90 3 85.5 256.5
Total 40 2,470
Mean = Σ(f × Midpoint) ÷ Σf
Mean = 2,470 ÷ 40 = 61.75

📝 Implementasi Perhitungan dengan PHP

Berikut adalah contoh kode PHP untuk menghitung distribusi frekuensi dan statistik deskriptif:

<?php

// ================================================
// STEP 1: Input Data
// ================================================

// Data berat badan dalam kg
$data = [
    48, 21, 50, 32, 42, 21, 46, 47, 56,
    27, 55, 55, 43, 60, 25, 46, 58, 74,
    25, 46, 43, 41, 44, 34, 40, 63, 51,
    58, 66, 53, 16, 28, 39, 36, 56
];


// ================================================
// STEP 2: Hitung Statistik Dasar
// ================================================

$n = count($data);
$max = max($data);
$min = min($data);
$range = $max - $min;


// ================================================
// STEP 3: Hitung Jumlah Kelas
// Menggunakan Sturges Formula: K = 1 + 3.3 log(n)
// ================================================

$numClasses = ceil(1 + 3.3 * log10($n));


// ================================================
// STEP 4: Hitung Lebar Kelas
// Rumus: Lebar = Range / Jumlah Kelas
// ================================================

$classWidth = ceil($range / $numClasses);


// ================================================
// STEP 5: Buat Kelas-kelas
// ================================================

$classes = [];
$lowerLimit = $min;

for ($i = 0; $i < $numClasses; $i++)
{
    $upperLimit = $lowerLimit + $classWidth - 1;
    
    $classes[$i] = [
        'lower'      => $lowerLimit,
        'upper'      => $upperLimit,
        'frequency'  => 0,
        'midpoint'   => ($lowerLimit + $upperLimit) / 2
    ];
    
    $lowerLimit += $classWidth;
}


// ================================================
// STEP 6: Hitung Frekuensi Setiap Kelas
// ================================================

foreach ($data as $value)
{
    foreach ($classes as &$class)
    {
        if ($value >= $class['lower'] && $value <= $class['upper'])
        {
            $class['frequency']++;
            break;
        }
    }
}


// ================================================
// STEP 7: Hitung Statistik Tambahan
// - Frekuensi Kumulatif
// - Frekuensi Relatif
// - Mean (Rata-rata)
// ================================================

$cumulativeFreq = 0;
$sumFxM = 0;

foreach ($classes as &$class)
{
    // Hitung Frekuensi Kumulatif
    $cumulativeFreq += $class['frequency'];
    $class['cumulative'] = $cumulativeFreq;
    
    // Hitung Frekuensi Relatif
    $class['relative'] = $class['frequency'] / $n;
    
    // Jumlah untuk perhitungan Mean
    $sumFxM += $class['frequency'] * $class['midpoint'];
}

// Hitung Mean (Rata-rata)
$mean = $sumFxM / $n;


// ================================================
// STEP 8: Tampilkan Hasil dalam HTML
// ================================================

echo "<h3>Distribusi Frekuensi</h3>";

echo "<table border='1' style='border-collapse: collapse;'>";

echo "<tr>";
echo "    <th>Kelas</th>";
echo "    <th>Frekuensi</th>";
echo "    <th>Midpoint</th>";
echo "    <th>Frek. Relatif</th>";
echo "    <th>Frek. Kumulatif</th>";
echo "</tr>";

foreach ($classes as $class)
{
    echo "<tr>";
    
    echo "    <td>" . $class['lower'] . " - " . $class['upper'] . "</td>";
    
    echo "    <td>" . $class['frequency'] . "</td>";
    
    echo "    <td>" . number_format($class['midpoint'], 2) . "</td>";
    
    echo "    <td>" . number_format($class['relative'], 3) . "</td>";
    
    echo "    <td>" . $class['cumulative'] . "</td>";
    
    echo "</tr>";
}

echo "</table>";

echo "<p><strong>Mean: </strong>" . number_format($mean, 2) . "</p>";

?>

✏️ Latihan Soal

Soal Latihan: Hasil Ujian Statistika

Nilai ujian statistika dari 30 mahasiswa di kelas ini disajikan sebagai berikut:

8592788895 9278908892
7585828895 7890889285
8288907892 8885958288

Tugas:

  1. Buatlah tabel distribusi frekuensi yang menampilkan nilai dan frekuensi yang sesuai
  2. Buatlah histogram untuk merepresentasikan distribusi frekuensi secara visual
  3. Hitunglah frekuensi kumulatif dan buatlah tabel distribusi frekuensi kumulatif
  4. Buatlah poligon frekuensi kumulatif berdasarkan distribusi frekuensi kumulatif
  5. Hitunglah mean, median, dan modus dari nilai ujian

💡 Tips Mengerjakan Latihan:

  • Mulai dengan mengurutkan data dari terkecil ke terbesar
  • Tentukan jumlah kelas menggunakan rumus Sturges
  • Hitung range dan lebar kelas dengan teliti
  • Buat tally marks untuk menghitung frekuensi
  • Verifikasi total frekuensi harus sama dengan jumlah data
  • Gunakan kalkulator atau spreadsheet untuk perhitungan yang akurat

🎓 Kesimpulan

Statistika deskriptif adalah alat fundamental dalam analisis data yang memungkinkan kita untuk memahami, merangkum, dan menyajikan data dengan cara yang bermakna. Distribusi frekuensi dan berbagai jenis grafiknya memberikan wawasan visual yang kuat tentang pola dan karakteristik data.

🎯 Poin-Poin Penting yang Harus Diingat:

  • Distribusi Frekuensi: Mengorganisir data mentah menjadi kelas-kelas yang bermakna
  • Jumlah Kelas: Harus antara 5-20 untuk hasil optimal
  • Lebar Kelas: Dihitung dari range dibagi jumlah kelas, dibulatkan ke atas
  • Midpoint: Nilai tengah kelas, penting untuk perhitungan mean
  • Frekuensi Relatif: Menunjukkan proporsi data dalam setiap kelas
  • Frekuensi Kumulatif: Berguna untuk analisis persentil
  • Histogram: Visualisasi terbaik untuk melihat distribusi data
  • Class Boundaries: Penting untuk membuat histogram yang akurat

Dengan memahami konsep-konsep ini dan berlatih membuat distribusi frekuensi serta grafiknya, Anda akan memiliki fondasi yang kuat dalam analisis data statistik. Kemampuan ini sangat penting dalam berbagai bidang seperti penelitian, bisnis, ekonomi, kesehatan, dan ilmu sosial.

Komentar