Skip to content

Instantly share code, notes, and snippets.

@demidovakatya
Last active January 23, 2022 20:29
Show Gist options
  • Star 1 You must be signed in to star a gist
  • Fork 1 You must be signed in to fork a gist
  • Save demidovakatya/cfdf48316497c03e1893 to your computer and use it in GitHub Desktop.
Save demidovakatya/cfdf48316497c03e1893 to your computer and use it in GitHub Desktop.

Assignment: Центральная предельная теорема своими руками

В этом задании вам предстоит проверить работу центральной предельной теоремы, а также поработать с генерацией случайных чисел и построением графиков в Питоне.

  1. Выберите ваше любимое непрерывное распределение (чем меньше оно будет похоже на нормальное, тем интереснее; попробуйте выбрать какое-нибудь распределение из тех, что мы не обсуждали в курсе).
  • Прочитать, что такое непрерывное распределение, выбрать то, которое нравится больше всех.
  • Кратко описать его в своём ноутбуке (определение + формулы + график + почему нравится).
  1. Сгенерируйте из него выборку объёма 1000, постройте гистограмму выборки и нарисуйте поверх неё теоретическую плотность распределения вашей случайной величины.
  • Сгенерировать выборку, пользуясь документацией (1, 2), указанными в википедии (и доках!) параметрами распределения и числом 1000. 😄
  • Нарисовать гистограмму (нормализованную, с оптимальным числом bins, приятного глазу цвета).
  • Нарисовать теоретическую плотность распределения (называется pdf — считаем по формуле из википедии или методами sklearn).
  1. Для нескольких значений n (например, 5, 10, 50) сгенерируйте 1000 выборок объёма n и постройте гистограммы распределений их выборочных средних.
  • Для каждого из n нужно сгенерировать 1000 выборок,
    • Для каждой из этих выборок нужно посчитать среднее,
    • Таким образом, как и в 1 части задания, для каждого из n будет по выборке объёма 1000,
    • Вот для них и нужно строить гистограммы.
  • Иными словами, до этого мы познакомились с одной случайной величиной, распределённой по заданному закону. Теперь же нас интересует поведение средних по этим случайным величинам.
  1. Используя информацию о среднем и дисперсии исходного распределения (её можно без труда найти в википедии), посчитайте значения параметров нормальных распределений, которыми, согласно центральной предельной теореме, приближается распределение выборочных средних. Обратите внимание: для подсчёта значений этих параметров нужно использовать именно теоретические среднее и дисперсию вашей случайной величины, а не их выборочные оценки.
  • Посчитать среднее и дисперсию заданного распределения (т.е. того, которое было выбрано в самом начале).
  • Дисперсия ≠ ср. кв. отклонение.
  • Если «Обратите внимание» не привносит ясность в ситуацию: статья.
  1. Поверх каждой гистограммы нарисуйте плотность соответствующего нормального распределения.
  • «Соответствующее» нормальное распределение — с параметрами, как у нашего распределения (а их мы уже посчитали).
  • Нарисовать нормальное распределение.
  1. Опишите разницу между полученными распределениями при различных значениях n. Как меняется точность аппроксимации распределения выборочных средних нормальным с ростом n?
  • Ц
  • П
  • Т

Решение должно представлять собой IPython-ноутбук, содержащий:

  • код, генерирующий выборки и графики;
  • краткие описания каждого блока кода, объясняющие, что он делает;
  • необходимые графики (убедитесь, что на них подписаны оси);
  • выкладки с вычислениями параметров нормальных распределений, аппроксимирующих выборочные средние при различных n;
  • выводы по результатам выполнения задания.
@mangeke
Copy link

mangeke commented Apr 2, 2016

Добрый день. На данный момент проходжу этот курс и имею проблемы с исполнением этого задания. Если Вам удалось, не могли бы Вы найти для меня нескольно минут и объяснить алгоритм действий?! Заранее спасибо.

Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment