Практическое занятие 7.1.
Оценка генеральной средней и генеральной дисперсии нормально распределенной совокупности
При изучении генеральной совокупности объёма N из неё производится выборка объёма n, которая хорошо характеризует всю совокупность (свойство представительности). И на основании исследования этой выборочной совокупности мы с некоторой достоверностью можем оценить генеральные характеристики.
Выборочная средняя позволяет нам оценить генеральную среднюю , причём, оценить её точечно. Аналогично, точечной оценкой генеральной дисперсии DГ является исправленная выборочная дисперсия s2, и соответственно, стандартного отклонения – исправленное стандартное отклонение s.
Недостаток точечных оценок состоит в том, что мы можем получать выборочные значения, которые далеки от истины. И в этих случаях логично потребовать, чтобы выборочная характеристика qв (средняя, дисперсия или какая-то другая) отличалась от своего генерального значения qГ не более чем на некоторое положительное значение d .
Значение d называется точностью оценки, и озвученное выше требование можно записать с помощью модуля: .
Можно говорить о вероятности g, с которой это неравенство осуществится: . Интервал (qв-d;qв+d) называется доверительным интервалом и представляет собой интервальную оценку генерального значения qГ по найденному выборочному значению qв.
Задача 1.
По результатам выборочного исследования n =100 объектов найдена выборочная средняя .
1) С какой вероятностью можно утверждать, что генеральная средняя отличается от найденного значения не более чем на 3, если известно, что генеральная совокупность распределения нормально с дисперсией 400?
2) Определить доверительный интервал, который с надежностью g = 0,99 содержит истинное значение генеральной средней
Решение.
Что мы имеем: из генеральной совокупности проведена выборка в n=100 и по её результатам найдена выборочная средняя: .
Выборочная средняя – это точечная оценка неизвестной нам генеральной средней .
1) По условию, точность оценки равна и дисперсия .
Из формулы найдём коэффициент доверия:
.
Вычислим соответствующую доверительную вероятность:
–
таким образом, с вероятностью 86,64% можно утверждать, что генеральная средняя отличается от менее чем на (т.е. находится в доверительном интервале от 90 до 96)
2) Для доверительной вероятности g = 0,99 :
– этому значению функции Лапласа соответствует аргумент: .
Вычислим точность оценки:
Определим доверительный интервал:
–
данный интервал с вероятностью 99% содержит истинное значение .
Ответ: а) , б)
В рассмотренном примере известно стандартное отклонение генеральной совокупности. Дело в том, что в похожих задачах оно бывает и не известно, и тогда решение будет отличаться.
Задача 2. На основании n = 20 испытаний установлено, что в среднем для изготовления полупроводникового диода требуется = 76 секунд, а исправленное среднее квадратическое отклонение составляет s =11 секунд. Предположив, что время изготовления диода есть нормальная случайная величина, определить с надежностью g = 0,999 доверительный интервал для оценки среднего времени изготовления диода.
Решение: доверительный интервал для оценки истинного значения измеряемой величины имеет вид:
Для заданного уровня доверительной вероятности g = 0,999 и количества степеней свободы по таблице распределения Стьюдента находим:. Вычислим точность оценки:
сек.
Таким образом, искомый доверительный интервал:
Ответ: .
Итак, что главное в разобранных задачах? Главное, обратить внимание, генеральное ли нам дано отклонение s или исправленное выборочное s . От этого зависит, какую формулу нужно использовать, эту:
, где 2F(tg ) =γ ,
или эту: , где tγ отыскивается с помощью распределения Стьюдента.
При увеличении объёма выборки n, распределение Стьюдента стремится к нормальному распределению, и поэтому уже при n > 30 во 2-м случае допускается нахождение tg с помощью того же соотношения 2F(tg)=g . Но мы бы не рекомендовал так делать. Потому что если дано s, то предполагается, что решать нужно именно через распределение Стьюдента.
Оценка генеральной дисперсии нормально распределенной совокупности
Этот интервал можно построить несколькими способами, покажем эти варианты. Решим задачу об измерениях.
Задача 3. По n =10 равноточным измерениям найдено исправленное среднее квадратическое отклонение s = 0,76. Предполагая, что результаты измерений распределены нормально, построить доверительный интервал для оценки истинного значения s (генерального стандартного отклонения) с надёжностью g = 0,95 .
Обратите внимание, что для решения этой задачи нам не обязательно знать выборочную среднюю.
Способ первый. Доверительный интервал для оценки неизвестной дисперсии s2 нормальной генеральной совокупности определяется следующим образом:
,
где – распределение «хи-квадрат», а , – критические значения, вычисленные для , и k=n-1.
Данный интервал с вероятностью g (надёжностью) содержит истинное значение генеральной дисперсии s2. А если из всех частей неравенства извлечь корни, то получим соответствующий интервал для оценки генерального стандартного отклонения:
.
Значения n=10, s=0,76 известны, осталось разобраться со знаменателем. Вычислим , , k=n-1=9 и по таблице критических значений распределения χ2 найдём:
, .
В результате:
таким образом, с вероятностью g = 0,95 можно утверждать, что данный интервал содержит генеральное стандартное отклонение s.
Полученный интервал асимметричен относительно выборочного значения s = 0,76, и его широкий диапазон объясним малым объёмом выборки – велика вероятность, что при 10 измерениях значение s действительно далеко от истинного значения σ.
Способ второй, более простой. Он состоит в построении симметричного интервала по формуле: s·(1-q)<σ<s·(1+q), где значение q отыскивается по соответствующей таблице.
Согласно таблице, доверительной вероятности g=0,95 и объёму n=10 соответствует значение q=0,65, таким образом:
0,76·(1 -0,65)<σ<0,76·(1+0,65)
0,266<σ<1,254
В результате мы получили примерно такой же широкий интервал. Для малых выборок может даже получиться q>1, в таких случаях принимают ещё более грубую интервальную оценку: 0<σ<s(1+q).
Ответ: 1) 0,52 <s <1,39 , 2) 0,266 <s <1,254.
Контрольные вопросы
1. Точечные оценки
2. Интервальная оценка и доверительный интервал.
3. Оценка генеральной средней нормально распределенной совокупности.
4. Доверительный интервал.
5. Надёжность интервальной оценки.
6. Оценка генеральной дисперсии нормально распределенной совокупности.