Skip to content

Instantly share code, notes, and snippets.

Created September 15, 2017 17:36
Show Gist options
  • Save anonymous/d6411745d1b36091e5646ff04f967009 to your computer and use it in GitHub Desktop.
Save anonymous/d6411745d1b36091e5646ff04f967009 to your computer and use it in GitHub Desktop.
Найти вероятность выборки

Найти вероятность выборки - Как решать задачи по теории вероятностей



Розенталь Марксистский диалектический метод — М.: Пусть имеется выборка из n значений X 1 , X 2 , …, X n некоторого измеренного гидробиологического показателя. Эта задача внешне кажется вспомогательной в ряду предлагаемых задач, поскольку само по себе оценивание закона распределения не имеет большого практического смысла. Однако этот подготовительный этап носит обязательный и важный характер для последующего корректного применения большинства методов математической статистики. Прохоров, а,б, ; Прохоров с соавт. Одним из центральных понятий теории вероятностей является случайная величина — любая количественная характеристика, которая в результате случайного эксперимента может принять одно из некоторого множества значений. Каждая случайная величина x полностью определяется своей функцией распределения:. Функция распределения является "паспортом" случайной величины: Если функция распределения F x x непрерывна, то случайная величина x называется непрерывной случайной величиной. Если функция распределения непрерывной случайной величины дифференцируема, то более наглядное представление о случайной величине дает плотность вероятности случайной величины p x x , которая связана с функцией распределения F x x формулами и. Отсюда, в частности, следует, что для любой случайной величины: Решения такого уравнения то есть соответствующие значения x в теории вероятностей называются квантилями. Это означает, что для соответствующей случайной величины некоторые квантили определены неоднозначно, а некоторые квантили не существуют. Квантили, наиболее часто встречающиеся в практических задачах, имеют свои названия: Наиболее часто применяемыми числовыми характеристиками случайной величины x являются начальные и центральные моменты различного порядка. Для непрерывной случайной величины моменты порядка k определяются следующими формулами:. Чаще всего используется первый начальный момент , называемый математическим ожиданием случайной величины или центром распределения, и второй центральный момент , называемый дисперсией, которая характеризует разброс случайной величины относительно центра распределения. Часто вместо дисперсии используют среднее квадратичное отклонение. Перечислим наиболее распространенные распределения непрерывных случайных величин. Непрерывная случайная величина x , принимающая значения на отрезке [ a , b ], распределена равномерно, если ее плотность распределения p x x , функция распределения F x x и моменты M x и D x имеют соответственно вид: Нормальное распределение играет исключительно важную роль в теории вероятностей и математической статистике. Функция плотности вероятностей p x x , функция распределения F x x и моменты M x , D x логнормального распределения имеют соответственно вид: В ряде областей науки и техники нашли широкое применение такие одномерные распределения непрерывной случайной величины как экспоненциальное распределение, гамма-распределение, распределение Вейбулла и многие другие. Основным предметом математической статистики является вычисление статистик да простит нас читатель за тавтологию , являющихся критериями для оценки достоверности априорных предположений, гипотез или выводов по существу эмпирических данных. Выборочные среднее и дисперсия, отношение дисперсий двух выборок или любые другие функции от выборки могут рассматриваться как статистики. Вычисление "статистик" - классический пример представления "одним числом" сложного стохастического процесса. Статистики также являются случайными переменными. Распределения статистик тест-распределения лежат в основе критериев, которые построены на этой статистике. Распределение Стьюдента по форме при некоторых условиях приближается к нормальному. Другими двумя важными распределениями выборочных статистик является c 2 -распределение и F -распределение , широко используемые в последующих разделах для проверки статистических гипотез. Дадим определения и опишем основные свойства наиболее известных вероятностных распределений для дискретной случайной величины. Схема Бернулли и биномиальное распределение. Бернуллиевская модель по имени Якоба Бернулли — — выдающегося швейцарского математика , является подходящей математической моделью для любого эксперимента с двумя исходами "успех" - "неуспех" , то есть простейшего статистического эксперимента. В терминах плотности f x это можно записать в следующем виде:. Термин "биномиальное распределение" связан с тем, что вероятности P являются членами известного "бинома Ньютона": Таким образом, биномиальная модель Bi n , p описывает распределение числа "успехов" в n испытаниях Бернулли с неизменной вероятностью "успеха" p. Это есть распределение числа "успехов" 1 , предшествующих r -му "неуспеху" 0 , и оно задается вероятностями. Заметим, что выражение f x r , p совпадает с х -м членом разложения функции q r 1 — p -r в ряд по степеням р ; то есть отрицательного бинома отсюда происходит и название распределения. Если случайная величина имеет распределение Bi r , p , то первые два центральных момента равны и. Это одно из важнейших дискретных вероятностных распределений впервые было исследовано в г. Пуассоном французский математик, механик и физик, — гг. Распределение Пуассона обычно описывает схему редких событий, происшедших за фиксированный промежуток времени или в фиксированной области пространства, и дает хорошую аппроксимацию биномиального распределения для больших значений n и малых значений р. Характер основных вероятностных распределений непрерывной и дискретной случайной величины представлен на рис. Обычно закон распределения случайной величины x неизвестен и его приближенно определяют оценивают опытным путем. С этой целью над величиной x проводят ряд независимых испытаний. Вся мыслимая то есть бесконечная совокупность этих измерений называется генеральной совокупностью. А каждый конкретный ряд измерений называют простой случайной выборкой. Если простую выборку упорядочить по возрастанию, то ее называют вариационным рядом. Если для каждого неповторяющегося элемента вариационного ряда x i указать относительную частоту его появления , то такой вариационный ряд называют статистическим рядом распределения случайной величины x. F n x представляет собой ступенчатую неубывающую функцию, заданную на всей числовой оси, со скачками в точках x i , причем величина скачка равна частоте. Заметим, что поскольку сумма абсолютных частот , то сумма относительных частот. Отсюда ясно, что эмпирическую функцию распределения можно использовать как оценку теоретической функции распределения F x. Совокупность разрядов и соответствующих частот статистического ряда геометрически изображают в виде гистограммы. Таким образом, площадь каждого прямоугольника гистограммы равна его частоте, а общая площадь равна единице. Большинство статистических вычислений сопровождается проверкой некоторых предположений или гипотез об источнике этих данных. Основное проверяемое предположение называется нулевой гипотезой и часто формулируется как отсутствие различий, незначительность влияния фактора, равенство нулю значений выборочных характеристик и т. Другое проверяемое предположение не всегда строго противоположенное или обратное первому называется конкурирующей или альтернативной гипотезой. Причина такого выделения нулевой гипотезы заключается в том, что она обычно рассматривается как утверждение, несостоятельность которого более бесспорно, чем истинность. Это основано на общем принципе, гласящем, что теория должна быть отвергнута, если есть противоречащий пример, но не обязательно должна быть принята, если такого примера не удалось найти. Для проверки нулевой гипотезы задается статистический критерий от греч. Нулевая гипотеза H 0 не отклоняется, если вычисленное значение статистики критерия К рас не превышает порогового К пор первый случай , или если вычисленное значение a превышает критический уровень значимости a кр второй случай. В противном случае нулевая гипотеза отвергается и принимается альтернативная гипотеза H 1. При подборе распределений возникает вопрос: Выражаясь более точно, не противоречит ли гипотеза о законе распределения F x результатам эксперимента? Чтобы ответить на этот вопрос, пользуются критериями согласия. Под критерием согласия понимают некоторую величину D F n , F , которая отражает количественную меру расхождения гипотетического F x и эмпирического F n x распределений. Величину разности между двумя распределениями можно выбрать многими способами и на ее основе имеются различные статистики для проверки интересующей нас гипотезы, например:. Схема применения критерия согласия следующая. Возьмем a кр из a: По данной выборке вычислим значение критерия согласия. Следовательно, эксперимент опровергает нашу гипотезу, и она отбрасывается. При этом вероятность того, что мы ошибочно отбросили верную гипотезу, не превышает принятый уровень значимости a кр критерия и равна a. Колмогоров в г. Функцию K x стали называть критерием согласия Колмогорова. Смирнов исследовал супремум sup и инфимум inf этого эмпирического процесса, поэтому нередко встречается название "критерий Колмогорова-Смирнова". Чтобы воспользоваться критерием Колмогорова, нужно построить графики гипотетической и выборочной функций распределения, по графикам найти статистику и вычислить величину. Найти вероятность события можно по формуле. Если эта вероятность меньше a , то гипотеза отвергается, если больше, то признается не противоречащей эксперименту. Предположим теперь, что из некоторых соображений мы можем высказать гипотезу только о виде закона распределения, а параметры, входящие в него, нам неизвестны. В таких случаях часто используют критерий согласия Пирсона. Всю числовую ось разобьем на r непересекающихся разрядов точками. Примем гипотезу о функции распределения, а неизвестные параметры, входящие в нее, заменим их оценками. Таким образом, гипотетическая функция распределения F x будет полностью известна и можно будет найти вероятности попадания случайной величины в i -й разряд. За меру расхождения между гипотетической F x и эмпирической функциями распределения примем статистику , определенную формулой 5. Схема применения критерия Пирсона следующая. По приведенным выше формулам вычисляют значение статистики и вероятность. Если эта вероятность меньше уровня значимости a , то гипотезу следует отбросить. Специально для проверки нормальности распределения малых выборок, численностью от 3 до 50 вариант, разработан W критерий Шапиро и Уилка Shapiro—Wilk , основанный на распределении порядковых статистик [Хан, Шапиро, ]. Этот критерий при наличии ограниченного объема данных является более мощным для проверки гипотезы нормальности, чем применяемые обычно критерии согласия [Лисенков, ]. P -значение вычисляется по формуле где Ф. Применение критериев согласия связано с определенными теоретическими и вычислительными сложностями. Поэтому для решения вопроса о возможности применения тех или иных параметрических тестов и методов дисперсионного анализа иногда считается удобным использовать группу критериев, которые позволяют оценить отклонение некоторых широко известных характеристик эмпирического ряда от нормального закона распределения. Например, в литературе [Айвазян с соавт. Распределение численности и биомассы организмов в пробах характеризуется определенными статистическими законами, обусловленными как совокупностью абиотических факторов, так и влиянием внутрипопуляционых, межпопуляционных и межвидовых отношений. Оценку законов распределения гидробиологических показателей осуществим на основе данных из базы по малым рекам Самарской области см. Отдельно рассчитаем суммарные численности N s и биомассы B s по каждой взятой пробе, а также индекс Шеннона H. Из полученных выборок сформируем дополнительные выборки на основе некоторого подмножества функциональных преобразований логарифмирование, возведение в различную степень и т. Основные описательные статистики по полученным выборкам представлены в табл. Гистограммы распределения некоторых показателей приведены на рис. Выборки Минимум Максимум Медиана Среднее Стандартное отклонение Асимметрия Эксцесс Численность по видам зообентоса N — измерений N 1 Гистограммы распределения выборок из некоторых гидробиологических показателей и их функциональных преобразований. Выполним проверку простой статистической гипотезы о нормальном законе распределения представленных выборок с использованием критериев согласия Колмогорова и c 2 Пирсона, а также критерия эксцесса Гири d. Но, как видно из табл. Для прочих рядов, не приведенных в табл. Можно с большой уверенностью сказать, что эти ряды подчиняются логнормальному распределению: По литературным данным [Баканов, а] для большинства видов бентосных организмов наиболее характерны отрицательное биномиальное или логнормальное распределения численности и биомассы, а при низком обилии — распределение Пуассона. Выполненные нами расчеты показали, что распределение численности и биомассы большинства видов с высоким уровнем значимости подчиняются логнормальному закону распределения см. Проверка нулевой гипотезы при подборе остальных теоретических функций распределения дала однозначно отрицательные результаты. В частности, для численности Dicrotendipes nervosus оказалась неудачной попытка аппроксимации геометрическим распределением см. В некоторых работах [Gray, ; Мокеева, Межов, ] делаются выводы, о том что, параметры статистических распределений меняются при изменении условий обитания животных. Например, вследствие загрязнения или ином ухудшении условий, асимметрия увеличивается, а кривая распределения имеет несколько пиков, в то время как при улучшении условий обитания кривая имеет более ровный характер, а полимодальность отсутствует. Нам не удалось ни подтвердить, ни опровергнуть эти суждения, поскольку осталось непонятным, относительно какого закона распределения следует оценивать коэффициент асимметрии, а надежных критериев оценки полимодальности найти не удалось. Действительно, визуально можно обнаружить на гистограммах рис. В то же время, с характером распределения можно, при желании, связать ряд выводов об экологии вида, глубине "экологической ниши" и проч. Например, сравнивая закономерности распределения численностей на рис. Аналогично, из гистограммы распределения биомассы личинок хирономид можно заметить различия, связанные с особенностями питания хищных Cryptochironomus gr. Впрочем, кое-кому может показаться, что подобные упражнения сильно напоминают "гадания на кофейной гуще". Численность по видам зообентоса N — измерений. Биомасса по видам зообентоса В — измерений. Суммарная численность N s и биомасса B s в пробе — измерений. Информационный индекс Шеннона H - измерений.


Дк гибрид 3.3 5
Сделать большую коробкуиз картонасвоими руками
Выборка
Схема городского транспорта филадельфии
Пигментные пятна у детей причины и лечение
Электроплиты индезит инструкция
Сколько стоит обложить столбы кирпичом
9 значное число это сколько
Овуляция на какой день после месячных калькулятор
Как правильно сделать фундамент для печи
Приказ 27.03 2006 69
Физиологические методы исследования психических функций
Основы теории вероятностей и математической статистики
Чертежи тренажера для жима лежа
Настоящий детектив 2 сезон описание
Как пользоваться инверторной сваркой
Инструкцияк сплит системе антарктик пульт управления
Чемпионат украины вторая лига турнирная таблица
Применение комбинаторики к подсчету вероятности
Регламент рабочего времени по контракту
Приказ 77 14
Пенсия по старости инвалидам 2 группы
Связать снуд из мохера
Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment