Skip to content

Instantly share code, notes, and snippets.

@alizaenazet
Last active March 18, 2024 14:13
Show Gist options
  • Save alizaenazet/76a27ea482acad2b4083689b52ee3d1c to your computer and use it in GitHub Desktop.
Save alizaenazet/76a27ea482acad2b4083689b52ee3d1c to your computer and use it in GitHub Desktop.

![[Week 4 - Probability 2023.2.pdf#page=8&rect=267,82,694,312&color=yellow|Week 4 - Probability 2023.2, p.8]]

  • Objektif berdasarkan angka terdiri dari (classical dan empirical)
  • Subjektif: berdasarkan informasi yang tersedia

Classical

[!PDF|yellow] [[Week 4 - Probability 2023.2.pdf#page=5&selection=4,0,5,11&color=yellow|Week 4 - Probability 2023.2, p.5]]

Classical Probability

Probabilitas yang bersifat pasti, seperti dadu

[!PDF|yellow] [[Week 4 - Probability 2023.2.pdf#page=5&selection=7,0,10,57&color=yellow|Week 4 - Probability 2023.2, p.5]]

MUTUALLY EXCLUSIVE The occurrence of one event means that none of the other events can occur at the same time.

kejadian yang tidak mungkin dalam satu waktu menghasilkan lebih dari 1 nilai, seperti probabilitas jumlah presiden tidak mungkin terdiri 1 orang

[!PDF|yellow] [[Week 4 - Probability 2023.2.pdf#page=5&selection=12,0,15,38&color=yellow|Week 4 - Probability 2023.2, p.5]]

COLLECTIVELY EXHAUSTIVE At least one of the events must occur when an experiment is conducted.

pastinya suatu hasil nilai dari beberapa yang akan muncul, spt: dadu

Empirical Probability

[!PDF|yellow] [[Week 4 - Probability 2023.2.pdf#page=6&selection=18,0,20,25&color=yellow|Week 4 - Probability 2023.2, p.6]]

The empirical definition occurs when the number of times an event happens is divided by the number of outcomes

sebuah probabilitas yang dapat selalu berubah berkelanjutan sesuai data yang terus masuk/diperbarui, seperti jumlah kemungkinan goal saat penalti seorang pemain bola sepanjang karirnya. ![[Week 4 - Probability 2023.2.pdf#page=9&rect=255,7,704,398&color=yellow|Week 4 - Probability 2023.2, p.9]]

Subjective Probability

probabilitas yang bersifat abu-abu/tidak pasti, sprti nilai sebuah Saham dimana kita hanya dapat memprediksi saja.

[!PDF|yellow] [[Week 4 - Probability 2023.2.pdf#page=24&selection=4,0,4,10&color=yellow|Week 4 - Probability 2023.2, p.24]]

Exercise 1

![[Survey of Probability Concepts 2024-03-12 08.42.10.excalidraw]]

Decide and understand the classification of a probability

To decide and understand the classification of a probability case and how to solve the task, you can follow a systematic approach. Here’s a simple step-by-step guide that may help:

  1. Identify the Type of Event:

    • Is the event something that can be observed and measured objectively, or is it based on personal judgment or speculation?
  2. Objective vs. Subjective:

    • If it’s an event with outcomes that can be observed and measured, it falls under objective probability.
    • If the probability is based on personal belief or information without empirical evidence, it’s a case of subjective probability.
  3. Objective Probability Branches:

    • Classical Probability: Used when you can list all possible equally likely outcomes of an event. For example, the probability of rolling a die and getting a 4.
    • Empirical Probability: Used when calculating the probability based on the frequency of past events. For example, if historical data shows that a baseball player hits a home run 30% of the time they bat, that’s an empirical probability.
  4. Understanding the Available Information:

    • Analyze the information you have. Do you have historical data or past frequencies of the events? If so, you’re likely dealing with empirical probability.
    • If you're dealing with theoretical scenarios with known possible outcomes, classical probability might be more suitable.
  5. Decision Making for Solving the Task:

    • Empirical data available: Use empirical probability.
    • Theoretical model or equally likely outcomes: Use classical probability.
    • Lack of objective data, relying on intuition or expert opinion: Consider subjective probability.
  6. Solving the Task:

    • For Empirical Probability: Collect historical data, calculate the frequency of the event (number of times the event occurred divided by the total number of trials).
    • For Classical Probability: Identify all possible outcomes, determine the number of favorable outcomes, and use the ratio of favorable outcomes to total outcomes to calculate probability.
    • For Subjective Probability: This is more intuitive and less formulaic; you might rely on expert opinions or your own judgment after considering all available information.

Remember, the key to deciding on a method is to look at what information you have and what you're trying to predict or understand. If it's something that can be counted or has happened before, empirical methods are useful. If it's a theoretical scenario, classical probability may be appropriate.

Mean deviation atau simpangan rata-rata adalah ukuran seberapa tersebar data dari rata-ratanya. Untuk menghitung mean deviation, Anda mengikuti langkah-langkah ini:

  1. Hitung rata-rata ((\bar{X})) dari kumpulan data Anda.
  2. Untuk setiap angka dalam kumpulan data, hitung selisih absolut (tanpa memandang tanda negatif atau positif) antara angka tersebut dan rata-rata.
  3. Jumlahkan semua selisih absolut tersebut.
  4. Bagi jumlah selisih absolut dengan jumlah data (n) untuk mendapatkan mean deviation.

Pada contoh yang Anda berikan, rata-rata ((\bar{X})) penjualan cappuccinos adalah 50. Kemudian, mereka telah menghitung selisih absolut antara setiap jumlah penjualan harian dan rata-rata tersebut.

Selisih absolut ini adalah:

  • |20 - 50| = 30
  • |40 - 50| = 10
  • |50 - 50| = 0
  • |60 - 50| = 10
  • |80 - 50| = 30

Jumlah selisih absolut adalah (30 + 10 + 0 + 10 + 30 = 80).

Karena ada 5 data poin, mean deviation (MD) dihitung sebagai jumlah selisih absolut dibagi dengan jumlah data poin:

[ MD = \frac{\sum |X - \bar{X}|}{n} = \frac{80}{5} = 16 ]

Jadi, mean deviation untuk penjualan cappuccinos adalah 16. Ini berarti bahwa pada rata-rata, jumlah cappuccinos yang terjual setiap hari menyimpang dari rata-rata mingguan sebanyak 16 cappuccinos.

Apakah ada bagian lain dari konsep ini yang ingin Anda jelajahi lebih lanjut atau ada pertanyaan statistik lain yang bisa saya bantu?

SampleVariance

Sample variance adalah ukuran yang digunakan untuk menggambarkan seberapa jauh nilai-nilai individual dalam sebuah sampel data tersebar dari rata-rata (mean) sampel tersebut. Varians memberikan gambaran mengenai variabilitas dalam sampel dan dihitung dengan mengkuadratkan simpangan standar (standard deviation).

Untuk menghitung sample variance (( s^2 )), Anda mengikuti langkah-langkah ini:

  1. Hitung rata-rata (mean) dari sampel tersebut (( \bar{x} )).
  2. Untuk setiap observasi dalam sampel (( x )), hitung selisih antara observasi itu dan rata-rata sampel.
  3. Kuadratkan selisih tersebut untuk menghilangkan nilai negatif sehingga simpangan yang besar ke atas dan ke bawah dari mean dihitung secara setara.
  4. Jumlahkan semua nilai kuadrat selisih ini.
  5. Bagi jumlah total dari kuadrat selisih ini dengan ( n - 1 ), di mana ( n ) adalah jumlah observasi dalam sampel. Pengurangan 1 dari ( n ) ini, seperti dijelaskan sebelumnya, adalah koreksi Bessel, yang membuat estimasi varians menjadi lebih akurat untuk sampel.

Secara matematis, rumus sample variance adalah:

Screenshot 2024-03-18 at 20 48 04

Dimana:

  • ( s^2 ) adalah sample variance.
  • ( x ) adalah nilai setiap observasi dalam sampel.
  • ( \bar{x} ) adalah mean dari sampel.
  • ( n ) adalah jumlah observasi dalam sampel.

Dalam studi kasus yang Anda tunjukkan, kita diminta untuk menghitung sample variance dari gaji per jam lima karyawan paruh waktu di Home Depot.

Langkah-langkahnya adalah sebagai berikut:

  1. Hitung rata-rata (mean): Telah diberikan bahwa rata-rata gaji per jam adalah $17.

  2. Hitung selisih antara setiap observasi dan rata-rata (mean): Untuk setiap gaji, kurangi $17 dan catat hasilnya. Ini telah dilakukan pada kolom "x − x̄" dalam tabel.

  3. Kuadratkan selisih-selisih tersebut: Ini menghilangkan nilai negatif dan memberikan bobot yang lebih pada nilai-nilai yang jauh dari rata-rata. Hasilnya tertera pada kolom "(x − x̄)²" dalam tabel.

  4. Jumlahkan nilai-nilai kuadrat tersebut: Total dari nilai-nilai kuadrat selisih adalah 40.

  5. Hitung varians sampel (s²): Bagi jumlah total dari nilai-nilai kuadrat selisih dengan ( n - 1 ), di mana ( n ) adalah jumlah observasi. Dalam kasus ini, ( n ) adalah 5 (karena ada 5 karyawan), jadi ( n - 1 ) adalah 4. Varians sampel adalah 40 dibagi dengan 4, yang menghasilkan 10.

Jadi, varians sampel dari gaji per jam lima karyawan tersebut adalah $10 (dolar kuadrat). Varians ini memberi tahu kita bahwa, rata-rata, nilai gaji karyawan bervariasi sekitar $10 (dolar kuadrat) dari rata-rata gaji yang $17. Namun, karena varians diukur dalam satuan kuadrat dari satuan data asli (dalam kasus ini, dolar kuadrat), untuk mendapatkan pemahaman yang lebih baik tentang variasi gaji, kita biasanya mengambil akar kuadrat dari varians ini untuk mendapatkan standar deviasi, yang dalam kasus ini akan kembali ke unit dolar asli.

Standart Deviation

Standard deviation adalah statistik yang digunakan untuk mengukur penyebaran atau dispersi dari kumpulan data relatif terhadap mean (rata-rata) mereka. Ini memberikan pemahaman tentang seberapa jauh data menyebar dari nilai rata-rata. Standard deviation yang rendah menandakan bahwa data cenderung dekat dengan mean mereka, sedangkan standard deviation yang tinggi menunjukkan bahwa data lebih tersebar luas.

Rumus yang diberikan dalam gambar adalah untuk menghitung sample standard deviation, yang diwakili oleh ( s ). Berikut adalah penjelasan langkah demi langkah untuk rumus tersebut:

  1. ( x ) adalah nilai dari setiap pengamatan dalam sampel.

  2. ( \bar{x} ) adalah mean atau rata-rata dari nilai-nilai pengamatan dalam sampel.

  3. ( n ) adalah jumlah pengamatan dalam sampel.

  4. ( \Sigma ) adalah simbol untuk sum atau jumlahan, yang berarti Anda menambahkan semua nilai yang muncul setelah simbol ini.

  5. ( (x - \bar{x})^2 ) adalah kuadrat dari selisih antara setiap nilai pengamatan dan mean. Ini menghasilkan "kuadrat deviasi", yang selalu positif. Langkah ini memastikan bahwa menyimpang ke bawah atau ke atas dari mean dihitung secara serupa.

  6. ( \Sigma(x - \bar{x})^2 ) adalah jumlah dari semua kuadrat deviasi.

  7. ( n - 1 ) adalah penyebut yang digunakan dalam perhitungan sample standard deviation dan menggambarkan 'derajat kebebasan' dalam data. Ini digunakan sebagai pembagi untuk mengkompensasi fakta bahwa mean sampel sering kali adalah estimasi terbaik dari mean populasi dan bukan nilai yang pasti.

  8. ( s = \sqrt{\frac{\Sigma (x - \bar{x})^2}{n - 1}} ): Setelah Anda menghitung jumlah dari kuadrat deviasi, Anda membaginya dengan ( n - 1 ) untuk mendapatkan "varians sampel". Kemudian, Anda mengambil akar kuadrat dari varians sampel ini untuk mendapatkan standard deviation sampel.

Standard deviation memberikan ukuran yang lebih intuitif dari penyebaran data karena memiliki unit yang sama dengan data asli. Misalnya, jika Anda mengukur tinggi dalam sentimeter, standard deviation juga akan dalam sentimeter.

Sekarang, berdasarkan informasi yang Anda berikan sebelumnya, kita bisa menghitung standard deviation dari contoh gaji per jam karyawan. Karena kita telah menghitung varians sampel sebagai $10 (dolar kuadrat), standard deviation akan menjadi akar kuadrat dari 10, yang kira-kira sama dengan $3.16 (dolar).

Week3

Mari kita jelaskan masing-masing jenis plot atau grafik yang Anda sebutkan, dengan menggunakan bahasa yang sederhana dan menghindari istilah teknis yang rumit:

  1. Pie Plot (Diagram Lingkaran)

    • Fungsi: Untuk menampilkan proporsi atau persentase dari keseluruhan data, yang biasanya meliputi kategori-kategori tertentu.
    • Studi Kasus Penggunaan: Katakanlah Anda memiliki sebuah toko kue dan ingin menampilkan penjualan berbagai jenis kue dalam satu minggu. Pie plot akan membantu Anda melihat jenis kue mana yang paling banyak terjual dengan potongan-potongan diagram yang menunjukkan persentase penjualan masing-masing jenis kue.
  2. Area Plot (Grafik Area)

    • Fungsi: Grafik ini mirip dengan line chart (grafik garis), tetapi area di bawah garis diisi warna atau tekstur. Ini membantu menekankan besarnya perubahan seiring waktu.
    • Studi Kasus Penggunaan: Jika Anda adalah seorang petani dan ingin melihat bagaimana curah hujan mempengaruhi hasil panen Anda selama setahun, area plot bisa menunjukkan data curah hujan dan hasil panen dalam bentuk area yang terisi, memberikan visualisasi yang mudah untuk melihat korelasi antara keduanya.
  3. Bar Graph (Grafik Batang)

    • Fungsi: Grafik batang digunakan untuk membandingkan jumlah atau volume antara kategori yang berbeda.
    • Studi Kasus Penggunaan: Sebagai manajer penjualan, Anda ingin membandingkan penjualan bulanan dari berbagai cabang toko. Bar graph akan memudahkan Anda melihat cabang mana yang memiliki penjualan tertinggi dan terendah dengan batang-batang yang mewakili total penjualan masing-masing cabang.
  4. Scatter Plot (Diagram Pencar)

    • Fungsi: Digunakan untuk menunjukkan hubungan atau pola antara dua variabel atau lebih.
    • Studi Kasus Penggunaan: Seorang dokter ingin meneliti apakah ada hubungan antara berat badan pasien dengan tingkat kolesterol mereka

. Scatter plot akan membantu dokter tersebut memvisualisasikan data pasien dengan titik-titik yang menunjukkan berat badan pada sumbu horizontal dan tingkat kolesterol pada sumbu vertikal, untuk melihat apakah ada pola atau tren.

  1. Histogram

    • Fungsi: Histogram digunakan untuk melihat distribusi frekuensi—yaitu, seberapa sering nilai-nilai tertentu muncul—dalam set data yang kontinu.
    • Studi Kasus Penggunaan: Seorang guru ingin mengetahui distribusi nilai ujian kelasnya. Histogram akan menunjukkan jumlah siswa yang mendapatkan nilai dalam rentang tertentu, seperti 0-10, 11-20, dan seterusnya, sehingga guru tersebut dapat melihat seberapa banyak siswa yang lulus atau gagal dan seberapa merata distribusi nilainya. Baik, mari kita jelaskan kedua konsep tersebut:
  2. Line Chart (Grafik Garis)

  • Fungsi: Line chart digunakan untuk menampilkan informasi sebagai serangkaian titik data yang disebut 'mark point' yang dihubungkan oleh segmen garis lurus. Sangat efektif untuk menunjukkan tren atau perubahan data seiring waktu.
  • Studi Kasus Penggunaan: Bayangkan Anda menjalankan sebuah café dan ingin melihat tren penjualan kopi setiap bulan sepanjang tahun. Line chart akan menampilkan penjualan setiap bulan sebagai titik yang dihubungkan, sehingga Anda dapat melihat peningkatan atau penurunan penjualan secara visual, misalnya untuk mengidentifikasi bulan-bulan puncak atau kapan penjualan menurun.
  1. Dot Plot (Grafik Titik)
  • Fungsi: Dot plot adalah jenis plot yang digunakan untuk menampilkan frekuensi pengamatan dalam sebuah dataset. Setiap data point diwakili sebagai sebuah titik. Ini bisa dianggap sebagai versi sederhana dari histogram atau bar chart tanpa penggunaan batang atau garis.
  • Studi Kasus Penggunaan: Anda adalah seorang guru dan ingin menunjukkan seberapa sering nilai tertentu muncul di kelas Anda. Dot plot akan menampilkan titik untuk setiap nilai ujian yang diperoleh oleh siswa, sehingga Anda dapat dengan cepat mengamati berapa banyak siswa yang mendapatkan nilai yang sama dan dengan mudah mengidentifikasi nilai yang paling umum serta variasi nilai di kelas Anda.

Kedua grafik tersebut memiliki peranan mereka dalam visualisasi data. Line chart sering digunakan untuk data yang berhubungan dengan waktu dan menekankan pada kelanjutan atau tren dari waktu ke waktu, sedangkan dot plot lebih menekankan pada frekuensi dari nilai-nilai individual dalam dataset.

Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment