Практическое занятие 15.2.
Значимость коэффициентов и доверительные интервалы для
двухфакторной линейной модели
Задача.
По результатам выборочного исследования n=8 торговых предприятий региона были получены отчётные данные за предыдущий год:
Таблица 1 |
|||
№ п/п |
Число оборотов оборотных средств, раз |
Трудоемкость продаж, чел./1млн.ден.ед. |
Чистая прибыль, млн.ден.ед. |
1 |
4 |
12 |
42 |
2 |
6,2 |
9 |
107 |
3 |
6,1 |
8 |
100 |
4 |
5,4 |
14 |
60 |
5 |
5,9 |
15 |
78 |
6 |
6 |
11 |
79 |
7 |
5,6 |
10 |
90 |
8 |
5,2 |
15 |
54 |
На лекции и предыдущем практическом занятии нами были получены уравнение регрессии:
y=-0,1708+22,044x1-3,9084x2,
парные коэффициенты корреляции:
, ,
Требуется:
– проверить значимость коэффициентов уравнения регрессии на уровне α=0,05;
– определить соответствующие доверительные интервалы для коэффициентов;
– спрогнозировать среднеожидаемую прибыль предприятия при х1=6,5 оборотах и х2=10 чел./1 млн. ден.ед.
Решение.
Проверим значимость коэффициентов уравнения регрессии на уровне значимости α=0,05. При этом рассмотрим лишь ключевые факторные коэффициенты b1, b2.
Алгоритм такой же, как и в однофакторной модели. Но сначала повторим схему действий.
Уравнение y=-0,1708+22,044x1-3,9084x2 получено по результатам выборки. Но существует генеральная совокупность торговых предприятий региона и генеральное уравнение у=В0+В1х1+В2х2. И возникает вопрос, насколько полученные выборочные значения b1=22,044, b2=- 3,9084 далеки от истинных значений В1, В2?
Для проверки статистической значимости полученных значений используем аппарат статистических гипотез.
1) Проверим значимость коэффициента b1=22,044.
Рассмотрим:
нулевую гипотезу H0:B1=0 – о том, что соответствующий коэффициент генерального уравнения у=В0+В1х1+В2х2 равен нулю.
По существу, это означает, что полученный выборочный результат b1=22,044 обусловлен случайностью (малой выборкой, в частности) и на самом деле чистая прибыль не зависит от количества оборотов оборотных средств.
В качестве конкурирующей рассмотрим H1:B1≠0 – гипотезу о том, что линейная корреляционная зависимость прибыли от оборотов существует.
Для проверки гипотезы H0 на уровне значимости α используем статистический критерий
где – значение выборочного коэффициента при 1-й факторной переменной, а – его стандартная ошибка.
Случайная величина T имеет распределение Стьюдента с количеством степеней свободы k=n-m-1, где m – количество факторов модели. Так как в нашей задаче факторов два, m=2 , поэтому k=n-3.
Для уровня значимости α=0,05 и количества степеней свободы
k=n-3=8-3=5
по соответствующей таблице находим критическое значение двусторонней области
tкр.=tдвуст.кр.(α,k)= tдвуст.кр.(0,05; 5)≈2,5706.
Найдём наблюдаемое значение критерия . Если оно попадёт в «красную» область (tнабл.<-tкр. либо tнабл.>tкр.), то нулевая гипотеза отвергается в пользу альтернативной; если же -tкр<tнабл.<tкр, то оснований отвергать нулевую гипотезу на данном уровне значимости – нет.
Рисунок 1 - Критическая область
Вычислим стандартную ошибку коэффициента, учитывая, что m=2-факторная модель и значения, полученные на предыдущих занятиях:
Наблюдаемое значение критерия:
поэтому на уровне значимости α=0,05 гипотезу H0:B1=0 отвергаем в пользу конкурирующей гипотезы H1:B1≠0.
Вывод: коэффициент b1=22,044 статистически значимо отличен от нуля, и полученное значение вряд ли объяснимо случайными факторами.
2) Аналогично проверяем статистическую значимость коэффициента b2=-3,9084, гипотезу H0:B2=0 против конкурирующей гипотезы H1:B2≠0.
Вычислим стандартную ошибку 2-го коэффициента:
и наблюдаемое значение критерия:
поэтому на уровне значимости α=0,05 гипотезу H0:B2=0 отвергаем в пользу конкурирующей гипотезы H1:B2≠0.
Вывод: коэффициент b2=-3,9084 статистически значим.
Определим соответствующие доверительные интервалы.
Для первого коэффициента:
(млн. ден.ед.) – таким образом, с доверительной вероятностью γ=1-α=1-0,05=0,95 данный интервал содержит истинное значение генерального коэффициента В1.
И аналогично для второго коэффициента:
(млн. ден.ед.) – таким образом, с доверительной вероятностью γ=0,95 данный интервал содержит истинное значение генерального коэффициента В2.
Спрогнозируем среднеожидаемую прибыль предприятия при х1=6,5 оборотах и трудоёмкости х2=10 чел./1 млн.:
у(6,5; 10)=-0,1708+22,044·6,5-3,9084·10≈104,03 млн.ден.ед.