Mean deviation atau simpangan rata-rata adalah ukuran seberapa tersebar data dari rata-ratanya. Untuk menghitung mean deviation, Anda mengikuti langkah-langkah ini:
- Hitung rata-rata ((\bar{X})) dari kumpulan data Anda.
- Untuk setiap angka dalam kumpulan data, hitung selisih absolut (tanpa memandang tanda negatif atau positif) antara angka tersebut dan rata-rata.
- Jumlahkan semua selisih absolut tersebut.
- Bagi jumlah selisih absolut dengan jumlah data (n) untuk mendapatkan mean deviation.
Pada contoh yang Anda berikan, rata-rata ((\bar{X})) penjualan cappuccinos adalah 50. Kemudian, mereka telah menghitung selisih absolut antara setiap jumlah penjualan harian dan rata-rata tersebut.
Selisih absolut ini adalah:
- |20 - 50| = 30
- |40 - 50| = 10
- |50 - 50| = 0
- |60 - 50| = 10
- |80 - 50| = 30
Jumlah selisih absolut adalah (30 + 10 + 0 + 10 + 30 = 80).
Karena ada 5 data poin, mean deviation (MD) dihitung sebagai jumlah selisih absolut dibagi dengan jumlah data poin:
[ MD = \frac{\sum |X - \bar{X}|}{n} = \frac{80}{5} = 16 ]
Jadi, mean deviation untuk penjualan cappuccinos adalah 16. Ini berarti bahwa pada rata-rata, jumlah cappuccinos yang terjual setiap hari menyimpang dari rata-rata mingguan sebanyak 16 cappuccinos.
Apakah ada bagian lain dari konsep ini yang ingin Anda jelajahi lebih lanjut atau ada pertanyaan statistik lain yang bisa saya bantu?
Sample variance adalah ukuran yang digunakan untuk menggambarkan seberapa jauh nilai-nilai individual dalam sebuah sampel data tersebar dari rata-rata (mean) sampel tersebut. Varians memberikan gambaran mengenai variabilitas dalam sampel dan dihitung dengan mengkuadratkan simpangan standar (standard deviation).
Untuk menghitung sample variance (( s^2 )), Anda mengikuti langkah-langkah ini:
- Hitung rata-rata (mean) dari sampel tersebut (( \bar{x} )).
- Untuk setiap observasi dalam sampel (( x )), hitung selisih antara observasi itu dan rata-rata sampel.
- Kuadratkan selisih tersebut untuk menghilangkan nilai negatif sehingga simpangan yang besar ke atas dan ke bawah dari mean dihitung secara setara.
- Jumlahkan semua nilai kuadrat selisih ini.
- Bagi jumlah total dari kuadrat selisih ini dengan ( n - 1 ), di mana ( n ) adalah jumlah observasi dalam sampel. Pengurangan 1 dari ( n ) ini, seperti dijelaskan sebelumnya, adalah koreksi Bessel, yang membuat estimasi varians menjadi lebih akurat untuk sampel.
Secara matematis, rumus sample variance adalah:
Dimana:
- ( s^2 ) adalah sample variance.
- ( x ) adalah nilai setiap observasi dalam sampel.
- ( \bar{x} ) adalah mean dari sampel.
- ( n ) adalah jumlah observasi dalam sampel.
Dalam studi kasus yang Anda tunjukkan, kita diminta untuk menghitung sample variance dari gaji per jam lima karyawan paruh waktu di Home Depot.
Langkah-langkahnya adalah sebagai berikut:
-
Hitung rata-rata (mean): Telah diberikan bahwa rata-rata gaji per jam adalah $17.
-
Hitung selisih antara setiap observasi dan rata-rata (mean): Untuk setiap gaji, kurangi $17 dan catat hasilnya. Ini telah dilakukan pada kolom "x − x̄" dalam tabel.
-
Kuadratkan selisih-selisih tersebut: Ini menghilangkan nilai negatif dan memberikan bobot yang lebih pada nilai-nilai yang jauh dari rata-rata. Hasilnya tertera pada kolom "(x − x̄)²" dalam tabel.
-
Jumlahkan nilai-nilai kuadrat tersebut: Total dari nilai-nilai kuadrat selisih adalah 40.
-
Hitung varians sampel (s²): Bagi jumlah total dari nilai-nilai kuadrat selisih dengan ( n - 1 ), di mana ( n ) adalah jumlah observasi. Dalam kasus ini, ( n ) adalah 5 (karena ada 5 karyawan), jadi ( n - 1 ) adalah 4. Varians sampel adalah 40 dibagi dengan 4, yang menghasilkan 10.
Jadi, varians sampel dari gaji per jam lima karyawan tersebut adalah $10 (dolar kuadrat). Varians ini memberi tahu kita bahwa, rata-rata, nilai gaji karyawan bervariasi sekitar $10 (dolar kuadrat) dari rata-rata gaji yang $17. Namun, karena varians diukur dalam satuan kuadrat dari satuan data asli (dalam kasus ini, dolar kuadrat), untuk mendapatkan pemahaman yang lebih baik tentang variasi gaji, kita biasanya mengambil akar kuadrat dari varians ini untuk mendapatkan standar deviasi, yang dalam kasus ini akan kembali ke unit dolar asli.
Standard deviation adalah statistik yang digunakan untuk mengukur penyebaran atau dispersi dari kumpulan data relatif terhadap mean (rata-rata) mereka. Ini memberikan pemahaman tentang seberapa jauh data menyebar dari nilai rata-rata. Standard deviation yang rendah menandakan bahwa data cenderung dekat dengan mean mereka, sedangkan standard deviation yang tinggi menunjukkan bahwa data lebih tersebar luas.
Rumus yang diberikan dalam gambar adalah untuk menghitung sample standard deviation, yang diwakili oleh ( s ). Berikut adalah penjelasan langkah demi langkah untuk rumus tersebut:
-
( x ) adalah nilai dari setiap pengamatan dalam sampel.
-
( \bar{x} ) adalah mean atau rata-rata dari nilai-nilai pengamatan dalam sampel.
-
( n ) adalah jumlah pengamatan dalam sampel.
-
( \Sigma ) adalah simbol untuk sum atau jumlahan, yang berarti Anda menambahkan semua nilai yang muncul setelah simbol ini.
-
( (x - \bar{x})^2 ) adalah kuadrat dari selisih antara setiap nilai pengamatan dan mean. Ini menghasilkan "kuadrat deviasi", yang selalu positif. Langkah ini memastikan bahwa menyimpang ke bawah atau ke atas dari mean dihitung secara serupa.
-
( \Sigma(x - \bar{x})^2 ) adalah jumlah dari semua kuadrat deviasi.
-
( n - 1 ) adalah penyebut yang digunakan dalam perhitungan sample standard deviation dan menggambarkan 'derajat kebebasan' dalam data. Ini digunakan sebagai pembagi untuk mengkompensasi fakta bahwa mean sampel sering kali adalah estimasi terbaik dari mean populasi dan bukan nilai yang pasti.
-
( s = \sqrt{\frac{\Sigma (x - \bar{x})^2}{n - 1}} ): Setelah Anda menghitung jumlah dari kuadrat deviasi, Anda membaginya dengan ( n - 1 ) untuk mendapatkan "varians sampel". Kemudian, Anda mengambil akar kuadrat dari varians sampel ini untuk mendapatkan standard deviation sampel.
Standard deviation memberikan ukuran yang lebih intuitif dari penyebaran data karena memiliki unit yang sama dengan data asli. Misalnya, jika Anda mengukur tinggi dalam sentimeter, standard deviation juga akan dalam sentimeter.
Sekarang, berdasarkan informasi yang Anda berikan sebelumnya, kita bisa menghitung standard deviation dari contoh gaji per jam karyawan. Karena kita telah menghitung varians sampel sebagai $10 (dolar kuadrat), standard deviation akan menjadi akar kuadrat dari 10, yang kira-kira sama dengan $3.16 (dolar).
Mari kita jelaskan masing-masing jenis plot atau grafik yang Anda sebutkan, dengan menggunakan bahasa yang sederhana dan menghindari istilah teknis yang rumit:
-
Pie Plot (Diagram Lingkaran)
- Fungsi: Untuk menampilkan proporsi atau persentase dari keseluruhan data, yang biasanya meliputi kategori-kategori tertentu.
- Studi Kasus Penggunaan: Katakanlah Anda memiliki sebuah toko kue dan ingin menampilkan penjualan berbagai jenis kue dalam satu minggu. Pie plot akan membantu Anda melihat jenis kue mana yang paling banyak terjual dengan potongan-potongan diagram yang menunjukkan persentase penjualan masing-masing jenis kue.
-
Area Plot (Grafik Area)
- Fungsi: Grafik ini mirip dengan line chart (grafik garis), tetapi area di bawah garis diisi warna atau tekstur. Ini membantu menekankan besarnya perubahan seiring waktu.
- Studi Kasus Penggunaan: Jika Anda adalah seorang petani dan ingin melihat bagaimana curah hujan mempengaruhi hasil panen Anda selama setahun, area plot bisa menunjukkan data curah hujan dan hasil panen dalam bentuk area yang terisi, memberikan visualisasi yang mudah untuk melihat korelasi antara keduanya.
-
Bar Graph (Grafik Batang)
- Fungsi: Grafik batang digunakan untuk membandingkan jumlah atau volume antara kategori yang berbeda.
- Studi Kasus Penggunaan: Sebagai manajer penjualan, Anda ingin membandingkan penjualan bulanan dari berbagai cabang toko. Bar graph akan memudahkan Anda melihat cabang mana yang memiliki penjualan tertinggi dan terendah dengan batang-batang yang mewakili total penjualan masing-masing cabang.
-
Scatter Plot (Diagram Pencar)
- Fungsi: Digunakan untuk menunjukkan hubungan atau pola antara dua variabel atau lebih.
- Studi Kasus Penggunaan: Seorang dokter ingin meneliti apakah ada hubungan antara berat badan pasien dengan tingkat kolesterol mereka
. Scatter plot akan membantu dokter tersebut memvisualisasikan data pasien dengan titik-titik yang menunjukkan berat badan pada sumbu horizontal dan tingkat kolesterol pada sumbu vertikal, untuk melihat apakah ada pola atau tren.
-
Histogram
- Fungsi: Histogram digunakan untuk melihat distribusi frekuensi—yaitu, seberapa sering nilai-nilai tertentu muncul—dalam set data yang kontinu.
- Studi Kasus Penggunaan: Seorang guru ingin mengetahui distribusi nilai ujian kelasnya. Histogram akan menunjukkan jumlah siswa yang mendapatkan nilai dalam rentang tertentu, seperti 0-10, 11-20, dan seterusnya, sehingga guru tersebut dapat melihat seberapa banyak siswa yang lulus atau gagal dan seberapa merata distribusi nilainya.
Baik, mari kita jelaskan kedua konsep tersebut:
-
Line Chart (Grafik Garis)
- Fungsi: Line chart digunakan untuk menampilkan informasi sebagai serangkaian titik data yang disebut 'mark point' yang dihubungkan oleh segmen garis lurus. Sangat efektif untuk menunjukkan tren atau perubahan data seiring waktu.
- Studi Kasus Penggunaan: Bayangkan Anda menjalankan sebuah café dan ingin melihat tren penjualan kopi setiap bulan sepanjang tahun. Line chart akan menampilkan penjualan setiap bulan sebagai titik yang dihubungkan, sehingga Anda dapat melihat peningkatan atau penurunan penjualan secara visual, misalnya untuk mengidentifikasi bulan-bulan puncak atau kapan penjualan menurun.
- Dot Plot (Grafik Titik)
- Fungsi: Dot plot adalah jenis plot yang digunakan untuk menampilkan frekuensi pengamatan dalam sebuah dataset. Setiap data point diwakili sebagai sebuah titik. Ini bisa dianggap sebagai versi sederhana dari histogram atau bar chart tanpa penggunaan batang atau garis.
- Studi Kasus Penggunaan: Anda adalah seorang guru dan ingin menunjukkan seberapa sering nilai tertentu muncul di kelas Anda. Dot plot akan menampilkan titik untuk setiap nilai ujian yang diperoleh oleh siswa, sehingga Anda dapat dengan cepat mengamati berapa banyak siswa yang mendapatkan nilai yang sama dan dengan mudah mengidentifikasi nilai yang paling umum serta variasi nilai di kelas Anda.
Kedua grafik tersebut memiliki peranan mereka dalam visualisasi data. Line chart sering digunakan untuk data yang berhubungan dengan waktu dan menekankan pada kelanjutan atau tren dari waktu ke waktu, sedangkan dot plot lebih menekankan pada frekuensi dari nilai-nilai individual dalam dataset.