В этом задании вам предстоит проверить работу центральной предельной теоремы, а также поработать с генерацией случайных чисел и построением графиков в Питоне.
- Выберите ваше любимое непрерывное распределение (чем меньше оно будет похоже на нормальное, тем интереснее; попробуйте выбрать какое-нибудь распределение из тех, что мы не обсуждали в курсе).
- Прочитать, что такое непрерывное распределение, выбрать то, которое нравится больше всех.
- Кратко описать его в своём ноутбуке (определение + формулы + график + почему нравится).
- Сгенерируйте из него выборку объёма 1000, постройте гистограмму выборки и нарисуйте поверх неё теоретическую плотность распределения вашей случайной величины.
- Сгенерировать выборку, пользуясь документацией (1, 2), указанными в википедии (и доках!) параметрами распределения и числом 1000. 😄
- Нарисовать гистограмму (нормализованную, с оптимальным числом
bins
, приятного глазу цвета). - Нарисовать теоретическую плотность распределения (называется
pdf
— считаем по формуле из википедии или методамиsklearn
).
- Для нескольких значений n (например, 5, 10, 50) сгенерируйте 1000 выборок объёма n и постройте гистограммы распределений их выборочных средних.
- Для каждого из n нужно сгенерировать 1000 выборок,
- Для каждой из этих выборок нужно посчитать среднее,
- Таким образом, как и в 1 части задания, для каждого из n будет по выборке объёма 1000,
- Вот для них и нужно строить гистограммы.
- Иными словами, до этого мы познакомились с одной случайной величиной, распределённой по заданному закону. Теперь же нас интересует поведение средних по этим случайным величинам.
- Используя информацию о среднем и дисперсии исходного распределения (её можно без труда найти в википедии), посчитайте значения параметров нормальных распределений, которыми, согласно центральной предельной теореме, приближается распределение выборочных средних. Обратите внимание: для подсчёта значений этих параметров нужно использовать именно теоретические среднее и дисперсию вашей случайной величины, а не их выборочные оценки.
- Посчитать среднее и дисперсию заданного распределения (т.е. того, которое было выбрано в самом начале).
- Дисперсия ≠ ср. кв. отклонение.
- Если «Обратите внимание» не привносит ясность в ситуацию: статья.
- Поверх каждой гистограммы нарисуйте плотность соответствующего нормального распределения.
- «Соответствующее» нормальное распределение — с параметрами, как у нашего распределения (а их мы уже посчитали).
- Нарисовать нормальное распределение.
- Опишите разницу между полученными распределениями при различных значениях n. Как меняется точность аппроксимации распределения выборочных средних нормальным с ростом n?
- Ц
- П
- Т
Решение должно представлять собой IPython-ноутбук, содержащий:
- код, генерирующий выборки и графики;
- краткие описания каждого блока кода, объясняющие, что он делает;
- необходимые графики (убедитесь, что на них подписаны оси);
- выкладки с вычислениями параметров нормальных распределений, аппроксимирующих выборочные средние при различных n;
- выводы по результатам выполнения задания.
Добрый день. На данный момент проходжу этот курс и имею проблемы с исполнением этого задания. Если Вам удалось, не могли бы Вы найти для меня нескольно минут и объяснить алгоритм действий?! Заранее спасибо.