Практическое занятие 14.2.

Нелинейная регрессия

 

На предыдущем занятии мы рассмотрели общую модель однофакторной регрессии, а также изучили линейный случай. На этом занятии эта тема получает логичное продолжение. Как подобрать вид регрессии разберем на следующих занятиях. Возможны такие основные виды регрессии:

Экспоненциальная регрессия

Гиперболическая регрессия

Степенная регрессия

Параболическая регрессия

Логарифмическая регрессия

Все регрессии строятся по одному шаблону, рассмотрим построение одной из этих линий.

 

Задача 1.

По результатам 12 лет имеются следующие данные:

 

Таблица 1

X

9

12

16

17

18

23

26

27

28

28

31

33

Y

1570

1676

1188

1118

1389

1261

1231

1074

1179

1071

1097

909

 

где Х – средняя цена товара по торговым точкам региона (ден. ед.), а У – общее количество проданных за год товаров (тыс. штук).

Требуется:

1) Методом наименьших квадратов найти функцию спроса у=ахb, выполнить чертёж.

2) Вычислить индексы детерминации и корреляции и проверить значимость построенной модели на уровне α=0,05.

3) Вычислить среднюю ошибку аппроксимации.

4) Определить коэффициент эластичности спроса.

 

1) Составим уравнение регрессионной зависимости спроса у=ахb от цены товара. Почему именно степенная регрессия? Многие примеры показывают, что именно степенная регрессия удачно моделирует спрос.

Приведем расчётную таблицу:

 

 

Таблица 2

9

1570

2,1972

7,3588

4,8278

16,1690

12

1676

2,4849

7,4242

6,1748

18,4484

16

1188

2,7726

7,0800

7,6872

19,6300

17

1118

2,8332

7,0193

8,0271

19,8872

18

1389

2,8904

7,2363

8,3542

20,9157

23

1261

3,1355

7,1397

9,8313

22,3864

26

1231

3,2581

7,1156

10,6152

23,1833

27

1074

3,2958

6,9791

10,8625

23,0021

28

1179

3,3322

7,0724

11,1036

23,5668

28

1071

3,3322

6,9763

11,1036

23,2466

31

1097

3,4340

7,0003

11,7923

24,0391

33

909

3,4965

6,8123

12,2256

23,8194

Сумма

14763

36,4626

85,2145

112,6052

258,2938

 

Коэффициенты регрессии у=ахb найдём из решения системы:

 

, где A=lna.

 

В нашем случае объём совокупности n=12 получим:

 

Таблица 3

xi

yi

lnxi

lnyi

ln2xi

lnxi· lnyi

Ʃ

14763

36,4626

85,2145

112,6052

258,2938

 

 

 

Систему решим по формулам Крамера:

 

,

 

система имеет единственное решение.

 

,

 

после чего находим сам коэффициент:

 

.

 

Найдем коэффициент b:

 

 

 

Таким образом получим степенную регрессионную зависимость количества проданных товаров от цены: y=axb =3519,9x-0,35.

 

Изобразим на чертеже эмпирические точки и график регрессии:

 

Рисунок 1 - Эмпирические точки и график регрессии

 

По полученному графику можно сказать, что при увеличении цены спрос сначала снизился, а затем уже снижается медленнее. Возможно это связано с тем, какой это товар.

 

2) Вычислим индексы детерминации и корреляции. Для этого найдём среднее значение признака-результата  и заполним ещё одну расчётную таблицу:

 

xi

yi

9

1570

115430,1

1631,344

3763,03892

0,0390724

12

1676

198693,1

1475,084

40367,0521

0,119878

16

1188

1785,063

1333,793

21255,5072

0,1227211

17

1118

12600,06

1305,79

35264,9311

0,1679692

18

1389

25201,56

1279,926

11897,0813

0,0785268

23

1261

945,5625

1174,696

7448,33706

0,0684407

26

1231

0,5625

1125,355

11160,8065

0,0858202

27

1074

24414,06

1110,588

1338,68761

0,0340671

28

1179

2626,563

1096,541

6799,42851

0,0699395

28

1071

25360,56

1096,541

652,360699

0,0238481

31

1097

17755,56

1058,166

1508,0929

0,0354003

33

909

103201,6

1035,262

15942,1969

0,1389025

Сумма

528014,3

 

157397,521

0,9845861

 

В результате получили, что общая сумма квадратов Q=528014,3, остаточная сумма квадратов Qe≈157397,521 и индекс детерминации:

– таким образом, в рамках построенной модели спрос на 70,19% зависит от изменения цены, а оставшаяся часть вариации (29,81%) спроса обусловлена факторами, не учтёнными моделью.

 

Вычислим индекс корреляции:

 – таким образом, существует сильная корреляционная зависимость количества проданных товаров от цены.

На уровне значимости α=0,05 проверим нулевую гипотезу  (генеральный индекс детерминации равен нулю), против конкурирующей гипотезы .

 

Используем статистический критерий

 

 

где  – значение выборочного индекса детерминации.

Для α=0,05 и количества степеней свободы k1=1, k2=12-2=10 по соответствующей таблице определим критическое значение критерия:

Fкр.= Fкр.(α; k1; k2)= Fкр.(0,05; 1; 10)≈4,9646

Наблюдаемое значение критерия:

 

 

попало в критическую область:

 

Рисунок 2 Критическая область

 

поэтому на уровне значимости α=0,05 гипотезу  отвергаем в пользу гипотезы .

 

Вывод: выборочное значение  статистически значимо, следовательно, статистически значимо и выборочное уравнение y=3519,9x-0,35 степенной регрессии.

3) Вычислим среднюю ошибку аппроксимации:

 

 

– таким образом, регрессионные значения у(хi) отличаются от соответствующих эмпирических значений yi в среднем на 8,2%, что является хорошим результатом.

 

4) Определим коэффициент эластичности ε.

Этот коэффициент показывает, на сколько процентов изменится значение признака результата Y при увеличении признака-фактора X на 1%. В случае степенной регрессии y=axb коэффициент эластичности ε=b – постоянен и в точности равен параметру b.

В нашей задаче y=3519,9x-0,35 и ε≈-0,35 – таким образом, при увеличении цены (значения x) на один процент – спрос на товар (значение y) уменьшается примерно на 0,35%. Таким образом, спрос падает медленнее, чем растёт цена. Математически этот факт можно записать так:  – и это означает, что такой товар неэластичен по спросу.

Если , то спрос падает быстрее, нежели растёт цена. Такой товар называют эластичным по спросу. Это значит, что его легко заменить или вообще отказаться от покупки.