Skip to content

Instantly share code, notes, and snippets.

@Khazbs
Last active December 14, 2020 19:15
Show Gist options
  • Save Khazbs/288451a9deb1c69de93f27723d2c4ae5 to your computer and use it in GitHub Desktop.
Save Khazbs/288451a9deb1c69de93f27723d2c4ae5 to your computer and use it in GitHub Desktop.
Моделирование Статических Зависимостей

Моделирование Статистических Зависимостей

Лекция 1

Этапы работы над статистической моделью

  1. Формализация
  2. Квантификация данных
    • Шкалы:
      1. Номинальная
      2. Порядковая
      3. Интервальная
      4. Относительная
  3. Спецификация
    • y = β₀ + β₁x + ε
  4. Идентификация
    • ŷ = 3.84 + 0.12x (0.003)
    • R² = 0.35
  5. Верификация

Side notes

  • ANOVAAnalysis Of Variance
  • Is reality fundamentally qualitative?

Особенности моделей зависимостей

  • В отличие от корреляцинной модели, изучается не просто взаимосвязь, а зависимость
  • y = ƒ(x) + ε (регрессионная модель)
    • yзависимая, объясняемая переменная, регрессант
    • xнезависимая, объясняющая переменная, предиктор, регрессор
  • Гамильтон изучал зависимость роста детей от роста родителей
j 1 1 ... m m
i 1 n₁ ... 1 nₘ
y y₁₁ yₙ₁ ... y₁ₘ yₙₘ

j — "уровень"

Дискретные уровни:

Дискретные уровни

  • yᵢⱼ = μ + μᵢ + εᵢⱼ
  • E(εᵢⱼ) = 0
  • E(εᵢⱼ εᵢ′ⱼ′) = 0, i ≠ i′, j ≠ j′
  • H₀: μⱼ = 0, j = 1 ... m
  • H₁: o/w (otherwise)

Лекция 2

  • Q-общее = Q-модельное + Q-остаточное
  • Q-общ. = Σ[j=1...m] Σ[i=1...n] (yᵢⱼ - y**)² = Total Sum of Squares
  • Q-мод. = Σ[j=1...m] Σ[i=1...n] (y*ⱼ - y**)² = Estimated/Regression Sum of Squares
  • Q-ост. = Σ[j=1...m] Σ[i=1...n] (yᵢⱼ - y*ⱼ)² = Residual/Error Sum of Squares

* — среднее значение y по соотв. группе (i или j)

Непрерывные уровни:

Непрерывные уровни

Классическая линейная модель регрессии

  • y = β₀ + β₁xᵢ + εᵢ
  • E(εᵢ) = 0
  • E(εᵢ εⱼ) = 0
  • Var(εᵢ) = σ² — homoscedasticity — "равноразбросанность"

Природа x:

  1. x — не случайная
  2. x — случайная
    • E(xᵢ εᵢ) = 0
    • ε ~ N(0, σ²)
  • ε — остатки регрессионной модели

  • Нужно найти оценки β^₀ = b₀, β^₁ = b₁

    • Метод наименьших квадратов
    • Метод максимального правдоподопия
    • Метод моментов
  • Модельные точки: (xᵢ, ŷᵢ)

  • Отклонение: εᵢ = yᵢ - ŷᵢ

  • Минимизируем отклонения: {εᵢ} → min

    • Σ[i=1...n] εᵢ² → min — effective (эффективный критерий)
    • Σ[i=1...n] |εᵢ| → min — robust (устойчивый критерий)
  • Q-ост. = Σ[i=1...n] (yᵢ - b₀ - b₁xᵢ) → min

  • ∂Q-ост. / ∂b₁ = 0

  • { 2Σ[i=1...n] (yᵢ - b₀ - b₁xᵢ) xᵢ = 0; 2Σ[i=1...n] (yᵢ - b₀ - b₁xᵢ) = 0 }

Умер

Side notes

  • Нормальность условна, доказать практически невозможно
Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment