Раздел 3. Статистические гипотезы. Гипотеза о законе распределения генеральной совокупности

 

Лекция 9. Гипотеза о законе распределения генеральной совокупности. Критерий согласия Пирсона

 

План лекции

 

1. Гипотеза о генеральной средней нормального распределения

2. Критерий согласия Пирсона

 

1. Гипотеза о генеральной средней нормального распределения

 

Постановка задачи: предполагается, что генеральная средняя a нормального распределения равна некоторому значению a0. Это нулевая гипотеза: H0: a=a0.

Для проверки гипотезы на уровне значимости α проводится выборка объема n и рассчитывается выборочная средняя . Исходя из полученного значения и специфики той или иной задачи, можно сформулировать следующие конкурирующие гипотезы:

1) H1: a<a0,

2) H1: a>a0,

3) H1: aa0,

4) H1: a=a1, где a1 – конкретное альтернативное значение генеральной средней.

При этом возможны две принципиально разные ситуации:

а) если генеральная дисперсия σ2 известна

Тогда в качестве статистического критерия K рассматривают случайную величину , где  – случайное значение выборочной средней. Почему случайное? Потому что в разных выборках мы будем получать разные значения , и заранее предугадать это значение невозможно.

Далее находим критическую область. Для конкурирующих гипотез H1: a<a0 и H1: a=a1 (случай a1<a0) строится левосторонняя область, для гипотез H1: a>a0 и H1: a=a1 (случай a1>a0) – правосторонняя, и для гипотезы H1: aa0двусторонняя – т. к. конкурирующее значение генеральной средней может оказаться как больше, так и меньше a0 -го.

Чтобы найти критическую область нужно отыскать критическое значение uкр. Оно определяется из соотношения – для односторонней области (лево- или право-) и  – для двусторонней области, где α – выбранный уровень значимости, а  – функция Лапласа.

Теперь на основании выборочных данных рассчитываем наблюдаемое значение критерия:  это можно было сделать и раньше, но такой порядок более последователен и логичен.

 

Результаты:

1) Для левосторонней критической области. Если , то гипотеза H0 на уровне значимости α принимается. Если , то отвергается.

http://www.mathprofi.ru/v/statisticheskie_gipotezy_clip_image085.jpg

2) Правосторонняя критическая область. Если , то гипотеза H0 принимается, в случае – отвергается:

http://www.mathprofi.ru/v/statisticheskie_gipotezy_clip_image090.jpg

3) Двусторонняя критическая область. Если , то гипотеза H0 принимается, в противном случае – отвергается:

http://www.mathprofi.ru/v/statisticheskie_gipotezy_clip_image093.jpg

условие принятия гипотезы часто записывают компактно – с помощью модуля:

 

Теперь вторая ситуация.

Та же самая Постановка задачи: предполагается, что генеральная средняя a нормального распределения равна некоторому значению a0. Это нулевая гипотеза: H0: a=a0.

Для проверки гипотезы на уровне значимости α проводится выборка объема n и рассчитывается выборочная средняя , но:

б) генеральная дисперсия σ2 неизвестна.

В этом случае остаётся ориентироваться на исправленную выборочную дисперсию s2 и критерий , где  – случайное значение выборочной средней и S – соответствующее исправленное стандартное отклонение. Данная случайная величина имеет распределение Стьюдента с k=n-1степенями свободы.

 

Подведем итоги по изученному материалу

 

Статистические гипотезы формулируются на основе исследования выборки и предназначены для статистической проверки предполагаемого закона генеральной совокупности либо параметров распределений, законы которых известны.

Сначала выдвигается нулевая (обычно наиболее правдоподобная) гипотеза и альтернативная к ней (конкурирующая) гипотеза.

Нулевая гипотеза подлежит статистической проверке. Проверка осуществляется с помощью различных статистических критериев (специальных случайных величин) которые зависят от условия той или иной задачи.

В результате проверки нулевая гипотеза может быть принята либо отвергнута, но это не означает её истинность или ложность! Ибо всегда есть риск допустить ошибку:

 – Ошибка 1-го рода состоит в том, что гипотеза будет отвергнута, но на самом деле она правильная (соответствует действительности). Вероятность совершить ошибку 1-го рода обозначают через a и называют уровнем значимости; его задают заранее.

Ошибка 2-го рода состоит в том, что гипотеза будет принята, но на самом деле она неверная. Вероятность совершить ошибку 2-го рода обозначают буквой b. Вероятность отвержения неверной гипотезы 1-b   называют мощностью критерия.

Уменьшая a, мы увеличиваем b (и наоборот), поэтому перед исследованием нужно подобрать оптимальное соотношение этих вероятностей – оно обычно зависит от тяжести последствий, которые влекут ошибки 1-го и 2-го рода. Чтобы одновременно уменьшить эти вероятности, нужно увеличить объёма выборки.