Skip to content

Instantly share code, notes, and snippets.

Show Gist options
  • Save anonymous/fe21cdf7a7e9a9b71e595d9636538204 to your computer and use it in GitHub Desktop.
Save anonymous/fe21cdf7a7e9a9b71e595d9636538204 to your computer and use it in GitHub Desktop.
Основные задачи прикладной статистики

Основные задачи прикладной статистики - Методологические вопросы прикладной статистики


Основные задачи прикладной статистики



Прикладная статистика
Методы прикладной статистики
Орлов А.И. Вероятность и статистика - основные факты - файл n1.rtf
Основы вероятностно-статистических методов описания неопределенностей
5. Основные проблемы прикладной статистики –
Методологические вопросы прикладной статистики













Основы вероятностно-статистических методов описания неопределенностей в прикладной статистике. Основные проблемы прикладной статистики - описание данных, оценивание и проверка гипотез. Выделяют три основные области статистических методов обработки результатов наблюдений — описание данных, оценивание характеристик и параметров распределений, регрессионных зависимостей и др. Рассмотрим основные понятия, применяемые в этих областях. Основные понятия, используемые при описании данных. Описание данных — предварительный этап статистической обработки. Используемые при описании данных величины применяются при дальнейших этапах статистического анализа — оценивании и проверке гипотез, а также при решении иных задач, возникающих при применении вероятностно-статистических методов принятия решений, например, при статистическом контроле качества продукции и статистическом регулировании технологических процессов. Статистические данные — это результаты наблюдений измерений, испытаний, опытов, анализов. Для математиков надо добавить, что речь идет об измеримых функциях. Если в вероятностной модели результаты наблюдений рассматриваются как случайные величины или случайные элементы , то статистики, как функции случайных величин элементов , сами являются случайными величинами элементами. Статистики, являющиеся выборочными аналогами характеристик случайных величин математического ожидания, медианы, дисперсии, моментов и др. Основополагающее понятие в вероятностно-статистических методах принятия решений — выборка. Как уже говорилось, выборка — это 1 набор наблюдаемых значений или 2 множество объектов, отобранные из изучаемой совокупности. Например, единицы продукции, отобранные из контролируемой партии или потока продукции для контроля и принятия решений. Наблюдаемые значения обозначим x 1 , x 2 ,…, x n , где n — объем выборки, то есть число наблюдаемых значений, составляющих выборку. О втором виде выборок уже шла речь при рассмотрении гипергеометрического распределения, когда под выборкой понимался набор единиц продукции, отобранных из партии. Там же обсуждалась вероятностная модель случайной выборки. В вероятностной модели выборки первого вида наблюдаемые значения обычно рассматривают как реализацию независимых одинаково распределенных случайных величин. При этом считают, что полученные при наблюдениях конкретные значения x 1 , x 2 ,…, x n соответствуют определенному элементарному событию , то есть. При повторных наблюдениях будут получены иные наблюдаемые значения, соответствующие другому элементарному событию. Цель обработки статистических данных состоит в том, чтобы по результатам наблюдений, соответствующим элементарному событию , сделать выводы о вероятностной мере Р и результатах наблюдений при различных возможных. Применяют и другие, более сложные вероятностные модели выборок. Например, цензурированные выборки соответствуют испытаниям, проводящимся в течение определенного промежутка времени. При этом для части изделий удается замерить время наработки на отказ, а для остальных лишь констатируется, что наработки на отказ для них больше времени испытания. Для выборок второго вида отбор объектов может проводиться в несколько этапов. Например, для входного контроля сигарет могут сначала отбираться коробки, в отобранных коробках — блоки, в выбранных блоках — пачки, а в пачках — сигареты. Ясно, что выборка будет обладать иными свойствами, чем простая случайная выборка из совокупности сигарет. Из приведенного выше определения математической статистики следует, что описание статистических данных дается с помощью частот. В старой терминологии можно сказать, что относительная частота — это отношение частоты к общему числу наблюдений. Отметим, что обсуждаемое определение приспособлено к нуждам одномерной статистики. Не считая нужным давать такие определения, отметим, что в подавляющем большинстве практических постановок исходные статистические данные — это выборка или несколько выборок. А выборка — это конечная совокупность соответствующих математических объектов чисел, векторов, функций, объектов нечисловой природы. Число Х имеет биномиальное распределение, задаваемое вероятностью р того, что случайная величина, с помощью которой моделируются результаты наблюдений, принимает заданное значение или лежит в заданном интервале, и общим числом наблюдений n. Из закона больших чисел теорема Бернулли следует, что. Теорема Муавра-Лапласа позволяет уточнить скорость сходимости в этом предельном соотношении. Чтобы от отдельных событий перейти к одновременному рассмотрению многих событий, используют накопленную частоту. Так называется отношение числа единиц, для которых результаты наблюдения меньше заданного значения, к общему числу наблюдений. Это понятие используется, если результаты наблюдения — действительные числа, а не вектора, функции или объекты нечисловой природы. Функция, которая выражает зависимость между значениями количественного признака и накопленной частотой, называется эмпирической функцией распределения. Итак, эмпирической функцией распределения F n x называется доля элементов выборки, меньших x. Эмпирическая функция распределения содержит всю информацию о результатах наблюдений. Чтобы записать выражение для эмпирической функции распределения в виде формулы, введем функцию с х, у двух переменных:. Случайные величины, моделирующие результаты наблюдений, обозначим. Тогда эмпирическая функция распределения F n x имеет вид. Гливенко доказал в г. Если функция g x достигает максимума в точке х 0 , то. В таком случае вместо sup пишут max. Хорошо известно, что не все функции достигают максимума. В том же г. Колмогоров усилил результат В. Гливенко для непрерывных функций распределения F x. Колмогорова породила одно из основных направлений математической статистики — т. И в настоящее время непараметрические критерии согласия Колмогорова, Смирнова, омега-квадрат широко используются. Они были разработаны для проверки согласия с полностью известным теоретическим распределением, то есть предназначены для проверки гипотезы. Основная идея критериев Колмогорова, омега-квадрат и аналогичных им состоит в измерении расстояния между функцией эмпирического распределения и функцией теоретического распределения. Различаются эти критерии видом расстояний в пространстве функций распределения. Аналитические выражения для предельных распределений статистик, расчетные формулы, таблицы распределений и критических значений широко распространены [8], поэтому не будем их приводить. Кроме эмпирической функции распределения, для описания данных используют и другие статистические характеристики. В качестве выборочных средних величин постоянно используют выборочное среднее арифметическое, то есть сумму значений рассматриваемой величины, полученных по результатам испытания выборки, деленную на ее объем:. Другой вид выборочного среднего — выборочная медиана. Она определяется через порядковые статистики. Порядковые статистики — это члены вариационного ряда, который получается, если элементы выборки x 1 , x 2 ,…, x n расположить в порядке неубывания:. В вариационном ряду элемент x k называется k -той порядковой статистикой. Порядковые статистики и функции от них широко используются в вероятностно-статистических методах принятия решений, в эконометрике и в других прикладных областях [2]. В качестве выборочных показателей рассеивания результатов наблюдений чаще всего используют выборочную дисперсию, выборочное среднее квадратическое отклонение и размах выборки. Согласно [8] выборочная дисперсия s 2 — это сумма квадратов отклонений выборочных результатов наблюдений от их среднего арифметического, деленная на объем выборки:. Выборочное среднее квадратическое отклонение s — неотрицательный квадратный корень из дисперсии, то есть. В некоторых литературных источниках выборочной дисперсией называют другую величину:. Различие в определениях приводит к различию в алгоритмах расчетов, правилах принятия решений и соответствующих таблицах. Поэтому при использовании тех или иных нормативно-технических и инструктивно-методических материалов, программных продуктов, таблиц необходимо обращать внимание на способ определения выборочных характеристик. Выбор , а не s 2 , объясняется тем, что. В то же время статистика s 2 не является несмещенной оценкой дисперсии результатов наблюдений, поскольку. Однако у s 2 есть другое свойство, оправдывающее использование этой статистики в качестве выборочного показателя рассеивания. Для известных результатов наблюдений x 1 , x 2 ,…, x n рассмотрим случайную величину У с распределением вероятностей. Это распределение вероятностей называется эмпирическим. Тогда функция распределения У — это эмпирическая функция распределения, построенная по результатам наблюдений x 1 , x 2 ,…, x n. Вычислим математическое ожидание и дисперсию случайной величины У:. Второе из этих равенств и является основанием для использования s 2 в качестве выборочного показателя рассеивания. Кроме перечисленных выше статистических характеристик, в качестве выборочного показателя рассеивания используют размах R — разность между n -й и первой порядковыми статистиками в выборке объема n , то есть разность между наибольшим и наименьшим значениями в выборке: В ряде вероятностно-статистических методов принятия решений применяют и иные показатели рассеивания. В частности, в методах статистического регулирования процессов используют средний размах — среднее арифметическое размахов, полученных в определенном количестве выборок одинакового объема. Популярно и межквартильное расстояние, то есть расстояние между выборочными квартилями x [0,75 n ] и x [0,25 n ] порядка 0,75 и 0,25 соответственно, где [0,75 n ] — целая часть числа 0,75 n , а [0,25 n ] —целая часть числа 0,25 n. Основные понятия, используемые при оценивании. Оценивание — это определение приближенного значения неизвестной характеристики или параметра распределения генеральной совокупности , иной оцениваемой составляющей математической модели реального экономического, технического и др. Иногда формулируют более коротко: При этом параметром генеральной совокупности может быть либо число, либо набор чисел вектор , либо функция, либо множество или иной объект нечисловой природы. Например, по результатам наблюдений, распределенных согласно биномиальному закону, оценивают число — параметр р вероятность успеха. По результатам наблюдений, имеющих гамма-распределение, оценивают набор из трех чисел — параметры формы а , масштаба b и сдвига с. Способ оценивания функции распределения дается теоремами В. Оценивают также плотности вероятности, функции, выражающие зависимости между переменными, включенными в вероятностные модели экономических, управленческих или технологических процессов, и т. Целью оценивания может быть нахождение упорядочения инвестиционных проектов по экономической эффективности или технических изделий объектов по качеству, формулировка правил технической или медицинской диагностики и т. Упорядочения в математической статистике называют также ранжировками. Это — один из видов объектов нечисловой природы. Оценивание проводят с помощью оценок — статистик, являющихся основой для оценивания неизвестного параметра распределения. Употреблять одно и то же слово для обозначения двух разных понятий нецелесообразно: Оценивание бывает двух видов — точечное оценивание и оценивание с помощью доверительной области. Точечное оценивание - способ оценивания, заключающийся в том, что значение оценки принимается как неизвестное значение параметра распределения. Для оценивания математического ожидания m могут использоваться и другие статистики, например, выборочная медиана , полусумма минимального и максимального членов вариационного ряда. Эти коэффициенты подобраны так, чтобы для выборок из нормального распределения. Наличие нескольких методов оценивания одних и тех же параметров приводит к необходимости выбора между этими методами. Как сравнивать методы оценивания между собой? Сравнение проводят на основе таких показателей качества методов оценивания, как состоятельность, несмещенность, эффективность и др. Выразим сказанное более подробно. Хинчин [6], достаточно выполнения более слабого условия — существования математического ожидания М Х. Все указанные выше оценки параметров нормального распределения являются состоятельными. Вообще, все за редчайшими исключениями оценки параметров, используемые в вероятностно-статистических методах принятия решений, являются состоятельными. Так, согласно теореме В. Гливенко, эмпирическая функция распределения F n x является состоятельной оценкой функции распределения результатов наблюдений F x. При разработке новых методов оценивания следует в первую очередь проверять состоятельность предлагаемых методов. Второе важное свойство оценок — несмещенность. Для оценки s 2 , как следует из сказанного выше, смещение равно. Оценка, для которой смещение стремится к 0, когда объем выборки стремится к бесконечности, называется асимптотически несмещенной. В примере 7 показано, что оценка s 2 является асимптотически несмещенной. Практически все оценки параметров, используемые в вероятностно-статистических методах принятия решений, являются либо несмещенными, либо асимптотически несмещенными. Для несмещенных оценок показателем точности оценки служит дисперсия — чем дисперсия меньше, тем оценка лучше. Как следует из основных свойств математического ожидания и дисперсии,. Для таких оценок при больших n второе слагаемое в правой части 3 пренебрежимо мало по сравнению с первым, и для них справедливо приближенное равенство. С дисперсией оценки связано третье важное свойство метода оценивания — эффективность. Эффективная оценка — это несмещенная оценка, имеющая наименьшую дисперсию из всех возможных несмещенных оценок данного параметра. Именно из-за сравнительно низкой эффективности выборочной медианы в качестве оценки математического ожидания нормального распределения обычно используют выборочное среднее арифметическое. Более интересный пример рассмотрен американским математиком Дж. Ясно, что T n — состоятельная, асимптотически несмещенная оценка математического ожидания m , при этом, как нетрудно вычислить,. Ряд видов оценок — так называемые одношаговые оценки и оценки максимального правдоподобия — являются НАН-оценками, именно они обычно используются в вероятностно-статистических методах принятия решений. Какова точность оценки параметра? В каких границах он может лежать? В нормативно-технической и инструктивно-методической документации, в таблицах и программных продуктах наряду с алгоритмами расчетов точечных оценок даются правила нахождения доверительных границ. Они и указывают точность точечной оценки. При этом используются такие термины, как доверительная вероятность, доверительный интервал. Если речь идет об оценивании нескольких числовых параметров, или же функции, упорядочения и т. Доверительная область — это область в пространстве параметров, в которую с заданной вероятностью входит неизвестное значение оцениваемого параметра распределения. Напомним, что множество — один из видов объектов нечисловой природы, случайные множества изучают в теории вероятностей и статистике объектов нечисловой природы. В ряде литературных источников, к настоящему времени во многом устаревших, под случайными величинами понимают только те из них, которые в качестве значений принимают действительные числа. Согласно справочнику академика РАН Ю. Розанова [12] случайные величины могут принимать значения из любого множества. Так, случайные вектора, случайные функции, случайные множества, случайные ранжировки упорядочения — это отдельные виды случайных величин. Используется и иная терминология: Ясно, что этому условию удовлетворяет, как правило, не одна, а много доверительных областей. При оценке одного числового параметра в качестве доверительных областей обычно применяют доверительные интервалы в том числе лучи , а не иные типа подмножеств прямой. Более того, для многих двухпараметрических и трехпараметрических распределений нормальных, логарифмически нормальных, Вейбулла-Гнеденко, гамма-распределений и др. Это делают для удобства пользования результатами расчетов: Как следует из сказанного выше, доверительный интервал — это интервал, который с заданной вероятностью накроет неизвестное значение оцениваемого параметра распределения. Границы доверительного интервала называют доверительными границами. Оцениванием с помощью доверительного интервала называют способ оценки, при котором с заданной доверительной вероятностью устанавливают границы доверительного интервала. Вероятности, связанные с доверительными границами, можно записать в виде частных случаев формулы Укажем доверительные границы для m. Для таких оценок при всех х. Зато часто удается доказать, что дисперсия оценки имеет вид. Для построения двусторонних доверительных границ поступают аналогично правилу, указанному выше в примере 10 для интервального оценивания параметра m нормального распределения. Для дискретных распределений, таких, как биномиальное, гипергеометрическое или распределение Пуассона а также распределения статистики Колмогорова. Так, рассмотрим биномиальное распределение. Для него нельзя указать статистику K Y , n такую, что. Сказанная означает, что верхней доверительной границы в случае биномиального распределения не существует. Для дискретных распределений приходится изменить определения доверительных границ. Покажем изменения на примере биномиального распределения. Аналогичным образом поступают для других доверительных границ и других распределений. Основные понятия, используемые при проверке гипотез. Статистическая гипотеза — любое предположение, касающееся неизвестного распределения случайных величин элементов. Приведем формулировки нескольких статистических гипотез:. Результаты наблюдений имеют нормальное распределение с нулевым математическим ожиданием. Результаты наблюдений в двух независимых выборках имеют одно и то же нормальное распределение. Различают нулевую и альтернативную гипотезы. Нулевая гипотеза — гипотеза, подлежащая проверке. Альтернативная гипотеза — каждая допустимая гипотеза, отличная от нулевой. Выбор тех или иных нулевых или альтернативных гипотез определяется стоящими перед менеджером, экономистом, инженером, исследователем прикладными задачами. Пусть нулевая гипотеза — гипотеза 2 из приведенного выше списка, а альтернативная — гипотеза 1. В рамках этой модели нулевую гипотезу записывают так:. Пусть нулевая гипотеза — по-прежнему гипотеза 2 из приведенного выше списка, а альтернативная — гипотеза 3 из того же списка. Пусть Н 0 — гипотеза 1 из приведенного выше списка, а Н 1 — гипотеза 3 из того же списка. Тогда вероятностная модель — та же, что в примере 12,. Пусть Н 0 — гипотеза 2 из приведенного выше списка, а согласно Н 1 результаты наблюдений имеют функцию распределения F x , не совпадающую с функцией стандартного нормального распределения Ф х. Пусть Н 0 — гипотеза 3 из приведенного выше списка, а согласно Н 1 результаты наблюдений имеют функцию распределения F x , не являющуюся нормальной. Пусть Н 0 — гипотеза 5 из приведенного выше списка, согласно вероятностной модели две выборки извлечены из совокупностей с функциями распределения F x и G x соответственно, а Н 1 — отрицание Н 0. F x и G x - произвольные функции распределения, причем. Пусть в условиях примера 14 дополнительно известно, что согласно вероятностной модели ситуации F x - функция нормального распределения с единичной дисперсией, то есть имеет вид N m , 1. При статистическом регулировании технологических, экономических, управленческих или иных процессов [2] рассматривают выборку, извлеченную из совокупности с нормальным распределением и известной дисперсией, и гипотезы. Используемые в нормативно-технической и коммерческой документации стандартах, договорах на поставку и др. Требуется проверить нулевую гипотезу. Пусть вероятностная модель двух выборок — та же, что в примере 18, математические ожидания результатов наблюдений в первой и второй выборках обозначим М Х и М У соответственно. В ряде ситуаций проверяют нулевую гипотезу. Выше отмечалось большое значение в математической статистике функций распределения, симметричных относительно 0, При проверке симметричности. В вероятностно-статистических методах принятия решений используются и многие другие постановки задач проверки статистических гипотез. Некоторые из них рассматриваются ниже. Конкретная задача проверки статистической гипотезы полностью описана, если заданы нулевая и альтернативная гипотезы. Выбор метода проверки статистической гипотезы, свойства и характеристики методов определяются как нулевой, так и альтернативной гипотезами. Для проверки одной и той же нулевой гипотезы при различных альтернативных гипотезах следует использовать, вообще говоря, различные методы. Так, в примерах 14 и 20 нулевая гипотеза одна и та же, а альтернативные — различны. Поэтому в условиях примера 14 следует применять методы, основанные на критериях согласия с параметрическим семейством типа Колмогорова или типа омега-квадрат , а в условиях примера 20 — методы на основе критерия Стьюдента или критерия Крамера-Уэлча [2,11]. Если в условиях примера 14 использовать критерий Стьюдента, то он не будет решать поставленных задач. Если в условиях примера 20 использовать критерий согласия типа Колмогорова, то он, напротив, будет решать поставленные задачи, хотя, возможно, и хуже, чем специально приспособленный для этого случая критерий Стьюдента. При обработке реальных данных большое значение имеет правильный выбор гипотез Н 0 и Н 1. Принимаемые предположения, например, нормальность распределения, должны быть тщательно обоснованы, в частности, статистическими методами. Отметим, что в подавляющем большинстве конкретных прикладных постановок распределение результатов наблюдений отлично от нормального [2]. Часто возникает ситуация, когда вид нулевой гипотезы вытекает из постановки прикладной задачи, а вид альтернативной гипотезы не ясен. В таких случаях следует рассматривать альтернативную гипотезу наиболее общего вида и использовать методы, решающие поставленную задачу при всех возможных Н 1. В частности при проверке гипотезы 2 из приведенного выше списка как нулевой следует в качестве альтернативной гипотезы использовать Н 1 из примера 14, а не из примера 20, если нет специальных обоснований нормальности распределения результатов наблюдений при альтернативной гипотезе. Статистические гипотезы бывают параметрические и непараметрические. Предположение, которое касается неизвестного значения параметра распределения, входящего в некоторое параметрическое семейство распределений, называется параметрической гипотезой напомним, что параметр может быть и многомерным. Предположение, при котором вид распределения неизвестен то есть не предполагается, что оно входит в некоторое параметрическое семейство распределений , называется непараметрической гипотезой. Если и Н 0 и Н 1 — параметрические гипотезы, то задача проверки статистической гипотезы — параметрическая. Если хотя бы одна из гипотез Н 0 и Н 1 — непараметрическая, то задача проверки статистической гипотезы — непараметрическая. Другими словами, если вероятностная модель ситуации — параметрическая, то есть полностью описывается в терминах того или иного параметрического семейства распределений вероятностей, то и задача проверки статистической гипотезы — параметрическая. Если же вероятностная модель ситуации — непараметрическая, то есть ее нельзя полностью описать в терминах какого-либо параметрического семейства распределений вероятностей, то и задача проверки статистической гипотезы — непараметрическая. В примерах , 16, 17, даны постановки параметрических задач проверки гипотез, а в примерах 14, 15, 18, 19, — непараметрических. Непараметрические задачи делятся на два класса: Статистическая гипотеза называется простой, если она однозначно задает распределение результатов наблюдений, вошедших в выборку. В противном случае статистическая гипотеза называется сложной. Гипотеза 2 из приведенного выше списка, нулевые гипотезы в примерах 11, 12, 14, 20, нулевая и альтернативная гипотезы в примере 21 — простые, все остальные упомянутые выше гипотезы — сложные. Однозначно определенный способ проверки статистических гипотез называется статистическим критерием. Статистический критерий строится с помощью статистики U x 1 , x 2 , …, x n — функции от результатов наблюдений x 1 , x 2 , …, x n. Статистику U , используемую при построении определенного статистического критерия, называют статистикой этого критерия. Например, в задаче проверки статистической гипотезы, приведенной в примере 14, применяют критерий Колмогорова, основанный на статистике. Если x i — числа, то U 0 — набор n чисел, то есть точка n —мерного пространства. В вероятностно-статистических методах принятия решений, статистические критерии, как правило, основаны на статистиках U , принимающих числовые значения, и критические области имеют вид. Статистические критерии делятся на параметрические и непараметрические. Параметрические критерии используются в параметрических задачах проверки статистических гипотез, а непараметрические — в непараметрических задачах. При проверке статистической гипотезы возможны ошибки. Есть два рода ошибок. Ошибка первого рода заключается в том, что отвергают нулевую гипотезу, в то время как в действительности эта гипотеза верна. Ошибка второго рода состоит в том, что принимают нулевую гипотезу, в то время как в действительности эта гипотеза неверна. Уровень значимости однозначно определен, если Н 0 — простая гипотеза. Если же Н 0 — сложная гипотеза, то уровень значимости, вообще говоря, зависит от функции распределения результатов наблюдений, удовлетворяющей Н 0. Для статистик критерия U общего вида под уровнем значимости понимают максимально возможную ошибку первого рода. Эта величина носит название мощности критерия. Итак, мощность критерия — это вероятность того, что нулевая гипотеза будет отвергнута, когда альтернативная гипотеза верна. Понятия уровня значимости и мощности критерия объединяются в понятии функции мощности критерия — функции, определяющей вероятность того, что нулевая гипотеза будет отвергнута. Основной характеристикой статистического критерия является функция мощности. Для многих задач проверки статистических гипотез разработан не один статистический критерий, а целый ряд. Чтобы выбрать из них определенный критерий для использования в конкретной практической ситуации, проводят сравнение критериев по различным показателям качества [2, приложение 3], прежде всего с помощью их функций мощности. В качестве примера рассмотрим лишь два показателя качества критерия проверки статистической гипотезы — состоятельность и несмещенность. Критерий называется состоятельным, если. При наличии нескольких статистических критериев в одной и той же задаче проверки статистических гипотез следует использовать состоятельные и несмещенные критерии. Ru Библиотека Исследования Форумы. Фундамент прикладной статистики 1. Основы вероятностно-статистических методов описания неопределенностей в прикладной статистике 1. Чтобы записать выражение для эмпирической функции распределения в виде формулы, введем функцию с х, у двух переменных: Рассмотрим случайную величину и ее функцию распределения По теореме А. Колмогорова при каждом х , где К х — т. В качестве выборочных средних величин постоянно используют выборочное среднее арифметическое, то есть сумму значений рассматриваемой величины, полученных по результатам испытания выборки, деленную на ее объем: Порядковые статистики — это члены вариационного ряда, который получается, если элементы выборки x 1 , x 2 ,…, x n расположить в порядке неубывания: Согласно [8] выборочная дисперсия s 2 — это сумма квадратов отклонений выборочных результатов наблюдений от их среднего арифметического, деленная на объем выборки: Она отличается от s 2 постоянным множителем: Выбор , а не s 2 , объясняется тем, что где Х — случайная величина, имеющая такое же распределение, как и результаты наблюдений. В то же время статистика s 2 не является несмещенной оценкой дисперсии результатов наблюдений, поскольку Однако у s 2 есть другое свойство, оправдывающее использование этой статистики в качестве выборочного показателя рассеивания. Вычислим математическое ожидание и дисперсию случайной величины У: Вероятности, связанные с доверительными границами, можно записать в виде частных случаев формулы 5: Для таких оценок при всех х , где Ф х — функция нормального распределения N 0;1. Следовательно, в качестве приближенной нижней доверительной границы следует взять , а в качестве приближенной верхней доверительной границы -. Для дискретных распределений, таких, как биномиальное, гипергеометрическое или распределение Пуассона а также распределения статистики Колмогорова и других непараметрических статистик , функции распределения имеют скачки. Приведем формулировки нескольких статистических гипотез: Результаты наблюдений имеют функцию распределения N 0,1. Результаты наблюдений имеют нормальное распределение. Результаты наблюдений в двух независимых выборках имеют одно и то же распределение. В рамках этой модели нулевую гипотезу записывают так: Тогда вероятностная модель — та же, что в примере 12, Н 0: При статистическом регулировании технологических, экономических, управленческих или иных процессов [2] рассматривают выборку, извлеченную из совокупности с нормальным распределением и известной дисперсией, и гипотезы Н 0: Требуется проверить нулевую гипотезу Н 0: В ряде ситуаций проверяют нулевую гипотезу Н 0: При этом D n называют статистикой критерия Колмогорова. Критерий называется состоятельным, если то есть вероятность отвергнуть нулевую гипотезу стремится к 1, если верна альтернативная гипотеза.


Какой телефон выбрать meizu или xiaomi
Зайти в контакты через гугл
Этническая структура русских
Правила ношения кортика
Выделения после лактации
Как установить симс 4 на компьютер
Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment