Практическое занятие 8.2.

Гипотеза о генеральной средней нормального распределения

Как проводится исследование? Обычно так: из генеральной совокупности извлекается репрезентативная выборка, и на основании изучения этой выборки делается вывод обо всей совокупности. Напоминаю, что это основной метод математической статистики и называется он выборочным методом. В зависимости от исследования, могут проводиться неоднократные выборки, выборки из нескольких генеральных совокупностей, да и вообще анализироваться произвольные статистические данные.

И в результате анализа этих данных появляются мысли, которые оформляются в статистические гипотезы.

Задача 1.

По результатам n=5 измерений температуры в печи найдено  Предполагается, что ошибка измерения есть нормальная случайная величина с σ=6o C. Проверить на уровне значимости  α=0,05 гипотезу H0: a=250o C против конкурирующей гипотезы H1: a>250o C.

Сначала разберём, в чём смысл этой ситуации. Есть печка. Для нормального технологического процесса нужна температура 250 градусов. Для проверки этой нормы 5 раз измерили температуру, получили 256 градусов. Из многократных предыдущих опытов известно, что среднеквадратическая погрешность измерений составляет 6 градусов (она обусловлена погрешностью самого термометра, случайными обстоятельствами проверки и т.д.)

И здесь не понятно, почему выборочный результат (256 градусов) получился больше нормы – то ли температура действительно выше и печь нуждается в регулировке, то ли это просто погрешность измерений, которую можно не принимать во внимание.

Решение: по условию, известно генеральное среднее квадратическое отклонение σ=6, поэтому для проверки гипотезы H0: a0=250 используем случайную величину .

 

Найдём критическую область.

Так как в конкурирующей гипотезе H1: a>250 речь идёт о больших значениях температуры, то эта область будет правосторонней.

Критическое значение определим из соотношения .

Для уровня значимости α=0,05: 

 

По таблице значений функции Лапласа определяем, что . Таким образом, при  (критическая область) нулевая гипотеза отвергается, а при  – принимается:

http://www.mathprofi.ru/v/statisticheskie_gipotezy_clip_image090.jpg

Вычислим наблюдаемое значение критерия:

 

Получили , поэтому на уровне значимости α=0,05 нулевую гипотезу   H0: a= 250 отвергаем.

 

Как бы сказали статистики, выборочный результат  статистически значимо отличается от нормативного значения 250оС, и печь нуждается в регулировке (для уменьшения температуры).

Ответ: на уровне значимости α=0,05 гипотезу H0: a= 250 отвергаем.

Ещё раз осмыслим – что означает «на уровне значимости 0,05»? Это означает, что с вероятностью 5% мы отвергли правильную гипотезу (совершили ошибку 1-го рода). И тут остаётся взвесить риск – насколько критично чуть-чуть уменьшить температуру (если мы всё-таки ошиблись и температура на самом деле в норме). Если даже небольшое уменьшение температуры недопустимо, то имеет смысл провести повторное, более качественное исследование: увеличить количество замеров n, использовать более совершенный термометр, улучшить условия эксперимента и т.д.

Задача 2.

Средний вес таблетки сильнодействующего лекарства (номинал) должен быть равен 0,5 мг. Выборочная проверка n=100 выпущенных таблеток показала, что средний вес таблетки равен  мг. Многократными предварительными опытами по взвешиванию таблеток, изготавливаемых фармацевтическим заводом, установлено, что вес таблеток распределен нормально со средним квадратическим отклонением σ=0,11 мг. Требуется на уровне значимости α=0,1 проверить гипотезу о том, что средний вес таблеток действительно равен H0: a= 0,5.

Решение.

Рассмотрим гипотеза H1: a>0,5, так и гипотезу  H1: a≠0,5. Так как альтернативные значения генеральной средней больше чем 0,5, то находим правостороннюю критическую область.

Критическое значение определим из соотношения:  .

 

Для уровня значимости α=0,1 получим

 

 

При  гипотеза принимается, при  (критическая область) – отвергается.

Вычислим наблюдаемое значение критерия:

 

 

 Так как   на уровне значимости 0,1 гипотезу H0: a= 0,5 принимаем.

Полученное значение  является случайным и в другой выборке оно может запросто оказаться и меньше чем 0,5.

Кстати, это тот самый пример, где ошибка 2-го рода (ошибочное принятие неверной нулевой гипотезы), может повлечь гораздо более тяжелые последствия (опасную передозировку). Поэтому в такой ситуации лучше увеличить уровень значимости до α=0,1 – при этом мы будем чаще отвергать правильную нулевую гипотезу (совершать ошибку 1-го рода), но зато перестрахуемся и проведём более тщательное исследование.

Можно ли одновременно уменьшить вероятности ошибок 1-го и 2-го рода (α и β)? Да можно. Если увеличить объём выборки. Что вполне логично.

Теперь вторая ситуация. Та же самая задача, почти всё то же самое, но:

б) генеральная дисперсия σ2  неизвестна.

В этом случае остаётся ориентироваться на исправленную выборочную дисперсию s2 и критерий , где  – случайное значение выборочной средней и S – соответствующее исправленное стандартное отклонение. Данная случайная величина имеет распределение Стьюдента с k=n-1 степенями свободы.

Задача 3.

На основании n=7 измерений найдено, что средняя высота сальниковой камеры равна мм и s=1,2мм. В предположении о нормальном распределении проверить на уровне значимости α=0,05 гипотезу H0: a=50мм против конкурирующей гипотезы H1: a≠ 50мм.

И начнём мы опять со смысла задачи, что здесь произошло? Здесь 7 раз измерили высоту этой камеры, получили среднее значение 51мм и за неимением генеральной дисперсии вычислили исправленную выборочную дисперсию. Но, согласно норме, высота должна равняться 50 мм – эту гипотезу и проверяем.

Решение: так как генеральная дисперсия не известна, то для проверки гипотезы H0: a=a0=50 используем случайную величину .

 

Конкурирующая гипотеза имеет вид H1: aa0, а значит, речь идёт о двусторонней критической области. Критическое значение можно найти. Для уровня значимости α=0,05 и количества степеней свободы k=n-1=7-1=6:

 

tкр.=tдвуст.кр.(α;k)=tдвуст.кр.(0,05;6)≈2,45.

 

Таким образом, при -tкр<t<tкр нулевая гипотеза принимается, и вне этого интервала (в критической области при ) – отвергается:

 

http://www.mathprofi.ru/v/statisticheskie_gipotezy_clip_image225.jpg

 

Вычислим наблюдаемое значение критерия:

 

 

– полученное  значение  попало  в  область  принятия  гипотезы

 

(-2,45<t<2,45),

 

поэтому на уровне значимости 0,05 нулевую гипотезу принимаем.

Ответ: на уровне значимости 0,05 гипотезу H0: a= 50 мм принимаем.

То есть, с точки зрения статистики, выборочный результат мм, скорее всего (но это не точно), обусловлен погрешностью выборки, и на самом деле высота сальниковой камеры соответствует норме (50 мм).

Задача 4.

Нормативный расход автомобильного двигателя составляет 10 л на 100 км. После конструктивных изменений, направленных на уменьшение этого показателя, были получены следующие результаты 10 тестовых заездов:

 

Расход топлива

л/100 км

9,64

10,12

9,7

9,45

10,33

9,93

9,34

10,03

9,63

9,33

 

На уровне значимости 0,05 выяснить, действительно ли расход топлива стал меньше.

Да, это не редкость – когда в предложенной задаче нужно не только проверить гипотезу, но и предварительно рассчитать выборочные значения. В данной задаче критическая область левосторонняя.

Решение.

Вычислим сумму вариант: ,

найдем выборочную дисперсию: ,

квадраты отклонений   и их сумму удобно находить с помощью таблицы.

 

Выборочная дисперсия: .

 

Исправленная выборочная дисперсия:.

 

Исправленное стандартное отклонение: .

 

На уровне значимости 0,05 проверим нулевую гипотезу H0: a=10  против конкурирующей гипотезы H1: a<10. Для проверки используем случайную величину .

 

Найдём критическую область. Поскольку в конкурирующей гипотезе речь идёт о меньших значениях, то она будет левосторонней. Для уровня значимости α=0,05 и количества степеней свободы k=n-1=10-1=9 по таблице критических точек распределения Стьюдента, найдём критическое значение для односторонней области:

 

tкр.=tодн.кр.(α;k)=tодн.кр.(0,05;9)≈1,835.

 

Таким образом, при  t<-tкр. нулевая гипотеза отвергается, а при t>-tкр.   принимается:

 

http://www.mathprofi.ru/v/statisticheskie_gipotezy_clip_image284.jpg

 

Вычислим наблюдаемое значение критерия:

 

.

 

 tнабл.<-tкр., поэтому на уровне значимости 0,05 нулевую гипотезу H0: a=10 отвергаем, иными словами, выборочное значение  статистически значимо отличается от 10.

Ответ: на уровне значимости 0,05 можно утверждать, что расход топлива стал ниже.

 

Контрольные вопросы

1.  Понятие статистической гипотезы

2. Нулевая и альтернативная гипотезы

3. Процесс проверки статистических гипотез

4. Гипотеза о законе распределения генеральной совокупности

          5. Критерий согласия Пирсона