Раздел 3. Статистические гипотезы. Гипотеза о законе распределения генеральной совокупности
Лекция 9. Гипотеза о законе распределения генеральной совокупности. Критерий согласия Пирсона
План лекции
1. Гипотеза о генеральной средней нормального распределения
2. Критерий согласия Пирсона
1. Гипотеза о генеральной средней нормального распределения
Постановка задачи: предполагается, что генеральная средняя a нормального распределения равна некоторому значению a0. Это нулевая гипотеза: H0: a=a0.
Для проверки гипотезы на уровне значимости α проводится выборка объема n и рассчитывается выборочная средняя . Исходя из полученного значения и специфики той или иной задачи, можно сформулировать следующие конкурирующие гипотезы:
1) H1: a<a0,
2) H1: a>a0,
3) H1: a≠a0,
4) H1: a=a1, где a1 – конкретное альтернативное значение генеральной средней.
При этом возможны две принципиально разные ситуации:
а) если генеральная дисперсия σ2 известна
Тогда в качестве статистического критерия K рассматривают случайную величину , где – случайное значение выборочной средней. Почему случайное? Потому что в разных выборках мы будем получать разные значения , и заранее предугадать это значение невозможно.
Далее находим критическую область. Для конкурирующих гипотез H1: a<a0 и H1: a=a1 (случай a1<a0) строится левосторонняя область, для гипотез H1: a>a0 и H1: a=a1 (случай a1>a0) – правосторонняя, и для гипотезы H1: a≠a0 – двусторонняя – т. к. конкурирующее значение генеральной средней может оказаться как больше, так и меньше a0 -го.
Чтобы найти критическую область нужно отыскать критическое значение uкр. Оно определяется из соотношения – для односторонней области (лево- или право-) и – для двусторонней области, где α – выбранный уровень значимости, а – функция Лапласа.
Теперь на основании выборочных данных рассчитываем наблюдаемое значение критерия: это можно было сделать и раньше, но такой порядок более последователен и логичен.
Результаты:
1) Для левосторонней критической области. Если , то гипотеза H0 на уровне значимости α принимается. Если , то отвергается.
2) Правосторонняя критическая область. Если , то гипотеза H0 принимается, в случае – отвергается:
3) Двусторонняя критическая область. Если , то гипотеза H0 принимается, в противном случае – отвергается:
условие принятия гипотезы часто записывают компактно – с помощью модуля:
Теперь вторая ситуация.
Та же самая Постановка задачи: предполагается, что генеральная средняя a нормального распределения равна некоторому значению a0. Это нулевая гипотеза: H0: a=a0.
Для проверки гипотезы на уровне значимости α проводится выборка объема n и рассчитывается выборочная средняя , но:
б) генеральная дисперсия σ2 неизвестна.
В этом случае остаётся ориентироваться на исправленную выборочную дисперсию s2 и критерий , где – случайное значение выборочной средней и S – соответствующее исправленное стандартное отклонение. Данная случайная величина имеет распределение Стьюдента с k=n-1степенями свободы.
Подведем итоги по изученному материалу
Статистические гипотезы формулируются на основе исследования выборки и предназначены для статистической проверки предполагаемого закона генеральной совокупности либо параметров распределений, законы которых известны.
Сначала выдвигается нулевая (обычно наиболее правдоподобная) гипотеза и альтернативная к ней (конкурирующая) гипотеза.
Нулевая гипотеза подлежит статистической проверке. Проверка осуществляется с помощью различных статистических критериев (специальных случайных величин) которые зависят от условия той или иной задачи.
В результате проверки нулевая гипотеза может быть принята либо отвергнута, но это не означает её истинность или ложность! Ибо всегда есть риск допустить ошибку:
– Ошибка 1-го рода состоит в том, что гипотеза будет отвергнута, но на самом деле она правильная (соответствует действительности). Вероятность совершить ошибку 1-го рода обозначают через a и называют уровнем значимости; его задают заранее.
– Ошибка 2-го рода состоит в том, что гипотеза будет принята, но на самом деле она неверная. Вероятность совершить ошибку 2-го рода обозначают буквой b. Вероятность отвержения неверной гипотезы 1-b называют мощностью критерия.
Уменьшая a, мы увеличиваем b (и наоборот), поэтому перед исследованием нужно подобрать оптимальное соотношение этих вероятностей – оно обычно зависит от тяжести последствий, которые влекут ошибки 1-го и 2-го рода. Чтобы одновременно уменьшить эти вероятности, нужно увеличить объёма выборки.