Практическое занятие 8.2.
Гипотеза о генеральной средней нормального распределения
Как проводится исследование? Обычно так: из генеральной совокупности извлекается репрезентативная выборка, и на основании изучения этой выборки делается вывод обо всей совокупности. Напоминаю, что это основной метод математической статистики и называется он выборочным методом. В зависимости от исследования, могут проводиться неоднократные выборки, выборки из нескольких генеральных совокупностей, да и вообще анализироваться произвольные статистические данные.
И в результате анализа этих данных появляются мысли, которые оформляются в статистические гипотезы.
Задача 1.
По результатам n=5 измерений температуры в печи найдено Предполагается, что ошибка измерения есть нормальная случайная величина с σ=6o C. Проверить на уровне значимости α=0,05 гипотезу H0: a=250o C против конкурирующей гипотезы H1: a>250o C.
Сначала разберём, в чём смысл этой ситуации. Есть печка. Для нормального технологического процесса нужна температура 250 градусов. Для проверки этой нормы 5 раз измерили температуру, получили 256 градусов. Из многократных предыдущих опытов известно, что среднеквадратическая погрешность измерений составляет 6 градусов (она обусловлена погрешностью самого термометра, случайными обстоятельствами проверки и т.д.)
И здесь не понятно, почему выборочный результат (256 градусов) получился больше нормы – то ли температура действительно выше и печь нуждается в регулировке, то ли это просто погрешность измерений, которую можно не принимать во внимание.
Решение: по условию, известно генеральное среднее квадратическое отклонение σ=6, поэтому для проверки гипотезы H0: a=а0=250 используем случайную величину .
Найдём критическую область.
Так как в конкурирующей гипотезе H1: a>250 речь идёт о больших значениях температуры, то эта область будет правосторонней.
Критическое значение определим из соотношения .
Для уровня значимости α=0,05:
По таблице значений функции Лапласа определяем, что . Таким образом, при (критическая область) нулевая гипотеза отвергается, а при – принимается:
Вычислим наблюдаемое значение критерия:
Получили , поэтому на уровне значимости α=0,05 нулевую гипотезу H0: a= 250 отвергаем.
Как бы сказали статистики, выборочный результат статистически значимо отличается от нормативного значения 250оС, и печь нуждается в регулировке (для уменьшения температуры).
Ответ: на уровне значимости α=0,05 гипотезу H0: a= 250 отвергаем.
Ещё раз осмыслим – что означает «на уровне значимости 0,05»? Это означает, что с вероятностью 5% мы отвергли правильную гипотезу (совершили ошибку 1-го рода). И тут остаётся взвесить риск – насколько критично чуть-чуть уменьшить температуру (если мы всё-таки ошиблись и температура на самом деле в норме). Если даже небольшое уменьшение температуры недопустимо, то имеет смысл провести повторное, более качественное исследование: увеличить количество замеров n, использовать более совершенный термометр, улучшить условия эксперимента и т.д.
Задача 2.
Средний вес таблетки сильнодействующего лекарства (номинал) должен быть равен 0,5 мг. Выборочная проверка n=100 выпущенных таблеток показала, что средний вес таблетки равен мг. Многократными предварительными опытами по взвешиванию таблеток, изготавливаемых фармацевтическим заводом, установлено, что вес таблеток распределен нормально со средним квадратическим отклонением σ=0,11 мг. Требуется на уровне значимости α=0,1 проверить гипотезу о том, что средний вес таблеток действительно равен H0: a= 0,5.
Решение.
Рассмотрим гипотеза H1: a>0,5, так и гипотезу H1: a≠0,5. Так как альтернативные значения генеральной средней больше чем 0,5, то находим правостороннюю критическую область.
Критическое значение определим из соотношения: .
Для уровня значимости α=0,1 получим
При гипотеза принимается, при (критическая область) – отвергается.
Вычислим наблюдаемое значение критерия:
Так как на уровне значимости 0,1 гипотезу H0: a= 0,5 принимаем.
Полученное значение является случайным и в другой выборке оно может запросто оказаться и меньше чем 0,5.
Кстати, это тот самый пример, где ошибка 2-го рода (ошибочное принятие неверной нулевой гипотезы), может повлечь гораздо более тяжелые последствия (опасную передозировку). Поэтому в такой ситуации лучше увеличить уровень значимости до α=0,1 – при этом мы будем чаще отвергать правильную нулевую гипотезу (совершать ошибку 1-го рода), но зато перестрахуемся и проведём более тщательное исследование.
Можно ли одновременно уменьшить вероятности ошибок 1-го и 2-го рода (α и β)? Да можно. Если увеличить объём выборки. Что вполне логично.
Теперь вторая ситуация. Та же самая задача, почти всё то же самое, но:
б) генеральная дисперсия σ2 неизвестна.
В этом случае остаётся ориентироваться на исправленную выборочную дисперсию s2 и критерий , где – случайное значение выборочной средней и S – соответствующее исправленное стандартное отклонение. Данная случайная величина имеет распределение Стьюдента с k=n-1 степенями свободы.
Задача 3.
На основании n=7 измерений найдено, что средняя высота сальниковой камеры равна мм и s=1,2мм. В предположении о нормальном распределении проверить на уровне значимости α=0,05 гипотезу H0: a=50мм против конкурирующей гипотезы H1: a≠ 50мм.
И начнём мы опять со смысла задачи, что здесь произошло? Здесь 7 раз измерили высоту этой камеры, получили среднее значение 51мм и за неимением генеральной дисперсии вычислили исправленную выборочную дисперсию. Но, согласно норме, высота должна равняться 50 мм – эту гипотезу и проверяем.
Решение: так как генеральная дисперсия не известна, то для проверки гипотезы H0: a=a0=50 используем случайную величину .
Конкурирующая гипотеза имеет вид H1: a≠a0, а значит, речь идёт о двусторонней критической области. Критическое значение можно найти. Для уровня значимости α=0,05 и количества степеней свободы k=n-1=7-1=6:
tкр.=tдвуст.кр.(α;k)=tдвуст.кр.(0,05;6)≈2,45.
Таким образом, при -tкр<t<tкр нулевая гипотеза принимается, и вне этого интервала (в критической области при ) – отвергается:
Вычислим наблюдаемое значение критерия:
– полученное значение попало в область принятия гипотезы
(-2,45<t<2,45),
поэтому на уровне значимости 0,05 нулевую гипотезу принимаем.
Ответ: на уровне значимости 0,05 гипотезу H0: a= 50 мм принимаем.
То есть, с точки зрения статистики, выборочный результат мм, скорее всего (но это не точно), обусловлен погрешностью выборки, и на самом деле высота сальниковой камеры соответствует норме (50 мм).
Задача 4.
Нормативный расход автомобильного двигателя составляет 10 л на 100 км. После конструктивных изменений, направленных на уменьшение этого показателя, были получены следующие результаты 10 тестовых заездов:
Расход топлива л/100 км |
9,64 |
10,12 |
9,7 |
9,45 |
10,33 |
9,93 |
9,34 |
10,03 |
9,63 |
9,33 |
На уровне значимости 0,05 выяснить, действительно ли расход топлива стал меньше.
Да, это не редкость – когда в предложенной задаче нужно не только проверить гипотезу, но и предварительно рассчитать выборочные значения. В данной задаче критическая область левосторонняя.
Решение.
Вычислим сумму вариант: ,
найдем выборочную дисперсию: ,
квадраты отклонений и их сумму удобно находить с помощью таблицы.
Выборочная дисперсия: .
Исправленная выборочная дисперсия:.
Исправленное стандартное отклонение: .
На уровне значимости 0,05 проверим нулевую гипотезу H0: a=10 против конкурирующей гипотезы H1: a<10. Для проверки используем случайную величину .
Найдём критическую область. Поскольку в конкурирующей гипотезе речь идёт о меньших значениях, то она будет левосторонней. Для уровня значимости α=0,05 и количества степеней свободы k=n-1=10-1=9 по таблице критических точек распределения Стьюдента, найдём критическое значение для односторонней области:
tкр.=tодн.кр.(α;k)=tодн.кр.(0,05;9)≈1,835.
Таким образом, при t<-tкр. нулевая гипотеза отвергается, а при t>-tкр. принимается:
Вычислим наблюдаемое значение критерия:
.
tнабл.<-tкр., поэтому на уровне значимости 0,05 нулевую гипотезу H0: a=10 отвергаем, иными словами, выборочное значение статистически значимо отличается от 10.
Ответ: на уровне значимости 0,05 можно утверждать, что расход топлива стал ниже.
Контрольные вопросы
1. Понятие статистической гипотезы
2. Нулевая и альтернативная гипотезы
3. Процесс проверки статистических гипотез
4. Гипотеза о законе распределения генеральной совокупности
5. Критерий согласия Пирсона