Skip to content

Instantly share code, notes, and snippets.

Embed
What would you like to do?

Assignment: Центральная предельная теорема своими руками

В этом задании вам предстоит проверить работу центральной предельной теоремы, а также поработать с генерацией случайных чисел и построением графиков в Питоне.

  1. Выберите ваше любимое непрерывное распределение (чем меньше оно будет похоже на нормальное, тем интереснее; попробуйте выбрать какое-нибудь распределение из тех, что мы не обсуждали в курсе).
  • Прочитать, что такое непрерывное распределение, выбрать то, которое нравится больше всех.
  • Кратко описать его в своём ноутбуке (определение + формулы + график + почему нравится).
  1. Сгенерируйте из него выборку объёма 1000, постройте гистограмму выборки и нарисуйте поверх неё теоретическую плотность распределения вашей случайной величины.
  • Сгенерировать выборку, пользуясь документацией (1, 2), указанными в википедии (и доках!) параметрами распределения и числом 1000. 😄
  • Нарисовать гистограмму (нормализованную, с оптимальным числом bins, приятного глазу цвета).
  • Нарисовать теоретическую плотность распределения (называется pdf — считаем по формуле из википедии или методами sklearn).
  1. Для нескольких значений n (например, 5, 10, 50) сгенерируйте 1000 выборок объёма n и постройте гистограммы распределений их выборочных средних.
  • Для каждого из n нужно сгенерировать 1000 выборок,
    • Для каждой из этих выборок нужно посчитать среднее,
    • Таким образом, как и в 1 части задания, для каждого из n будет по выборке объёма 1000,
    • Вот для них и нужно строить гистограммы.
  • Иными словами, до этого мы познакомились с одной случайной величиной, распределённой по заданному закону. Теперь же нас интересует поведение средних по этим случайным величинам.
  1. Используя информацию о среднем и дисперсии исходного распределения (её можно без труда найти в википедии), посчитайте значения параметров нормальных распределений, которыми, согласно центральной предельной теореме, приближается распределение выборочных средних. Обратите внимание: для подсчёта значений этих параметров нужно использовать именно теоретические среднее и дисперсию вашей случайной величины, а не их выборочные оценки.
  • Посчитать среднее и дисперсию заданного распределения (т.е. того, которое было выбрано в самом начале).
  • Дисперсия ≠ ср. кв. отклонение.
  • Если «Обратите внимание» не привносит ясность в ситуацию: статья.
  1. Поверх каждой гистограммы нарисуйте плотность соответствующего нормального распределения.
  • «Соответствующее» нормальное распределение — с параметрами, как у нашего распределения (а их мы уже посчитали).
  • Нарисовать нормальное распределение.
  1. Опишите разницу между полученными распределениями при различных значениях n. Как меняется точность аппроксимации распределения выборочных средних нормальным с ростом n?
  • Ц
  • П
  • Т

Решение должно представлять собой IPython-ноутбук, содержащий:

  • код, генерирующий выборки и графики;
  • краткие описания каждого блока кода, объясняющие, что он делает;
  • необходимые графики (убедитесь, что на них подписаны оси);
  • выкладки с вычислениями параметров нормальных распределений, аппроксимирующих выборочные средние при различных n;
  • выводы по результатам выполнения задания.
@mangeke

This comment has been minimized.

Copy link

mangeke commented Apr 2, 2016

Добрый день. На данный момент проходжу этот курс и имею проблемы с исполнением этого задания. Если Вам удалось, не могли бы Вы найти для меня нескольно минут и объяснить алгоритм действий?! Заранее спасибо.

Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment
You can’t perform that action at this time.