Статистическая гипотеза и критерий согласия

В экономике, технике, естествознании, медицине, демографии и т.д. часто для выяснения того или иного случайного явления прибегают к высказыванию гипотез (предположений), которые можно проверить статистически, т.е. опираясь на результаты наблюдений в случайной выборке.
Статистической гипотезой называют любое предположение о виде неизвестного закона распределения случайной величины или значении его параметров. Проверить статистическую гипотезу – это значит проверить, согласуются ли данные, или конкурирующая гипотеза, которая обозначается H1.
Таким образом, задача заключается в проверке гипотезы H0 относительно конкурирующей гипотезы H1 на основании выборки, состоящей из n независимых наблюдений X1, X2, ... , Xn над случайной величиной X. В результате такой проверки может быть принято правильнее или неправильное решение. Поэтому различают ошибки двух родов. Ошибка первого рода (альфа-риск α) состоит в том, что будет отвергнута правильная гипотеза. Ошибка второго рода (бета-риск β) состоит в том, что будет принята неправильная гипотеза. Например, основная гипотеза состоит в том, что изменение технологии производства дает предприятию прибыль. Если это правильная второго рода. Для проверки гипотезы сначала по данным выборки вычисляют значение критерия согласия, которое называют наблюдаемым значением КВ. Область возможных значений критерия разбивают на две области: в одной находятся те значения, при которых гипотеза принимается, а в другой – те при которых она отвергается (обозначим их через Q и W). Область W называют критической областью, а область Q - областью допустимых значений. Критическими точками называются точки, разделяющие эти области. Основные правила проверки гипотезы состоят в том, что если наблюдаемое значение критерия случае. В зависимости от содержания конкурирующей гипотезы H1 выбирают правостороннюю, левостороннюю или двустороннюю критические области.
Пусть случайная величина K – статистический критерий проверки некоторой гипотезы H0. Определим критическое значение критерия Kкр как решение одного из трех уравнений, в зависимости от вида нулевой и конкурирующей гипотез:
P(K> Kкр) =  (1)
P(K< Kкр) =  (2)
P((K< Kкр1)(K> Kкр, это означает, что выборочные данные не дают основания для принятия нулевой гипотезы H0 ( например, если =0,01 , то можно сказать, что произошло событие, которое при справедливости гипотезы H0 встречается в среднем не чаще, чем в одной из ста выборок). В этом случае говорят, что гипотеза H0 не согласуется с выборочными данными и должна быть отвергнута. Если Kв не превосходит Kкр, то говорят, что выборочные данные не противоречат гипотезе H0, и нет оснований отвергать эту гипотезу.
Если значение Kв попадает в критическую область, то гипотеза H0 отвергается.
Если значение Kв попадает в область принятия гипотезы, то гипотеза H0 принимается.


Критическая область, полученная для уравнения (1) и приведенная на рисунке 1., называется правосторонней.
Уравнение (2) определяет левостороннюю критическую область. Ее изображение приводится на рисунке 2.

Отметим, что каждая из заштрихованных фигур на рисунках 1. и 2. имеет площадь, равную .
Уравнение (3) определяет двустороннюю критическую область. Такая область изображена на рисунке 3. Здесь критическая область состоит из двух частей проверяемую гипотезу H0, когда она верна, то есть совершить ошибку первого рода. Но с уменьшением α расширяется область принятия гипотезы H0 и увеличивается вероятность принятия проверяемой гипотезы, когда она неверна, то есть когда предпочтение должно быть отдано конкурирующей гипотезе.
Пусть при справедливости гипотезы H0 статистический критерий K имеет плотность распределения p0(x), а при справедливости конкурирующей гипотезы H1 – плотность распределения p1(x). Графики этих функций приведены на рисунке 4. При некотором α находится критическое значение Kкр и правосторонняя критическая область. Если значение Kв, определенное по выборочным данным, оказывается меньше, чем Kкр, то гипотеза H0 принимается. Предположим, что справедлива на самом деле конкурирующая гипотеза H1. Тогда вероятность попадания критерия в область принятия гипотезы H0 есть некоторое число , равное площади фигуры, образованной графиком функции p1(x) и полубесконечной частью горизонтальной координатной оси, лежащей слева от точки Kкр. Очевидно, что  – это вероятность того, что будет принята неверная гипотеза H0.

На рисунке 4 мощность критерия равна площади фигуры, образованной графиком функции p1(x).и полубесконечной частью горизонтальной координатной оси, лежащей справа от точки Kкр.
Выбор статистического критерия и вида критической области осуществляется таким образом, чтобы мощность критерия была максимальной.

Powered by Drupal - Design by artinet