Практическое занятие 15.2.

 

Значимость коэффициентов и доверительные интервалы для

двухфакторной линейной модели

 

Задача.

По результатам выборочного исследования n=8 торговых предприятий региона были получены отчётные данные за предыдущий год:

 

Таблица 1

п/п

Число оборотов

оборотных средств, раз

Трудоемкость продаж, чел./1млн.ден.ед.

Чистая прибыль,

млн.ден.ед.

1

4

12

42

2

6,2

9

107

3

6,1

8

100

4

5,4

14

60

5

5,9

15

78

6

6

11

79

7

5,6

10

90

8

5,2

15

54

 

На лекции и предыдущем практическом занятии нами были получены уравнение регрессии:

 

y=-0,1708+22,044x1-3,9084x2,

 

парные коэффициенты корреляции:

 

, ,  

 

Требуется:

– проверить значимость коэффициентов уравнения регрессии на уровне α=0,05;

– определить соответствующие доверительные интервалы для коэффициентов;

– спрогнозировать среднеожидаемую прибыль предприятия при х1=6,5 оборотах и х2=10 чел./1 млн. ден.ед.

 

Решение.

Проверим значимость коэффициентов уравнения регрессии на уровне значимости α=0,05. При этом рассмотрим лишь ключевые факторные коэффициенты b1, b2.

Алгоритм такой же, как и в однофакторной модели. Но сначала повторим схему действий.

Уравнение y=-0,1708+22,044x1-3,9084x2 получено по результатам выборки. Но существует генеральная совокупность торговых предприятий региона и генеральное уравнение у=В01х12х2. И возникает вопрос, насколько полученные выборочные значения b1=22,044, b2=- 3,9084 далеки от истинных значений В1, В2?

Для проверки статистической значимости полученных значений используем аппарат статистических гипотез.

1) Проверим значимость коэффициента b1=22,044.

Рассмотрим:

нулевую гипотезу H0:B1=0 – о том, что соответствующий коэффициент генерального уравнения у=В01х12х2 равен нулю.

По существу, это означает, что полученный выборочный результат b1=22,044 обусловлен случайностью (малой выборкой, в частности) и на самом деле чистая прибыль не зависит от количества оборотов оборотных средств.

В качестве конкурирующей рассмотрим H1:B1≠0 – гипотезу о том, что линейная корреляционная зависимость прибыли от оборотов существует.

 

Для проверки гипотезы H0 на уровне значимости α используем статистический критерий

 

 

где  – значение выборочного коэффициента при 1-й факторной переменной, а – его стандартная ошибка.

Случайная величина T имеет распределение Стьюдента с количеством степеней свободы k=n-m-1, где m – количество факторов модели. Так как в нашей задаче факторов два, m=2 , поэтому k=n-3.

Для уровня значимости α=0,05 и количества степеней свободы

 

k=n-3=8-3=5

 

по соответствующей таблице находим критическое значение двусторонней области

 

tкр.=tдвуст.кр.(α,k)= tдвуст.кр.(0,05; 5)≈2,5706.

 

Найдём наблюдаемое значение критерия . Если оно попадёт в «красную» область (tнабл.<-tкр. либо tнабл.>tкр.), то нулевая гипотеза отвергается в пользу альтернативной; если же -tкр<tнабл.<tкр, то оснований отвергать нулевую гипотезу на данном уровне значимости – нет.

Рисунок 1 - Критическая область

 

Вычислим стандартную ошибку коэффициента, учитывая, что m=2-факторная модель и значения, полученные на предыдущих занятиях:

 

 

Наблюдаемое значение критерия:

 

 

поэтому на уровне значимости α=0,05 гипотезу H0:B1=0 отвергаем в пользу конкурирующей гипотезы H1:B1≠0.

Вывод: коэффициент b1=22,044 статистически значимо отличен от нуля, и полученное значение вряд ли объяснимо случайными факторами.

 

2) Аналогично проверяем статистическую значимость коэффициента b2=-3,9084, гипотезу H0:B2=0 против конкурирующей гипотезы H1:B2≠0.

Вычислим стандартную ошибку 2-го коэффициента:

 

 

и наблюдаемое значение критерия:

 

 

поэтому на уровне значимости α=0,05 гипотезу H0:B2=0 отвергаем в пользу конкурирующей гипотезы H1:B2≠0.

Вывод: коэффициент b2=-3,9084 статистически значим.

 

Определим соответствующие доверительные интервалы.

Для первого коэффициента:

 

 

 

 

 (млн. ден.ед.) – таким образом, с доверительной вероятностью γ=1-α=1-0,05=0,95 данный интервал содержит истинное значение генерального коэффициента В1.

 

И аналогично для второго коэффициента:

 

 

 

 

 (млн. ден.ед.) – таким образом, с доверительной вероятностью γ=0,95 данный интервал содержит истинное значение генерального коэффициента В2.

Спрогнозируем среднеожидаемую прибыль предприятия при х1=6,5 оборотах и трудоёмкости  х2=10 чел./1 млн.:

 

у(6,5; 10)=-0,1708+22,044·6,5-3,9084·10≈104,03 млн.ден.ед.