Практическое занятие 14.2.
Нелинейная регрессия
На предыдущем занятии мы рассмотрели общую модель однофакторной регрессии, а также изучили линейный случай. На этом занятии эта тема получает логичное продолжение. Как подобрать вид регрессии разберем на следующих занятиях. Возможны такие основные виды регрессии:
Экспоненциальная регрессия
Гиперболическая регрессия
Степенная регрессия
Параболическая регрессия
Логарифмическая регрессия
Все регрессии строятся по одному шаблону, рассмотрим построение одной из этих линий.
Задача 1.
По результатам 12 лет имеются следующие данные:
Таблица 1 |
||||||||||||
X |
9 |
12 |
16 |
17 |
18 |
23 |
26 |
27 |
28 |
28 |
31 |
33 |
Y |
1570 |
1676 |
1188 |
1118 |
1389 |
1261 |
1231 |
1074 |
1179 |
1071 |
1097 |
909 |
где Х – средняя цена товара по торговым точкам региона (ден. ед.), а У – общее количество проданных за год товаров (тыс. штук).
Требуется:
1) Методом наименьших квадратов найти функцию спроса у=ахb, выполнить чертёж.
2) Вычислить индексы детерминации и корреляции и проверить значимость построенной модели на уровне α=0,05.
3) Вычислить среднюю ошибку аппроксимации.
4) Определить коэффициент эластичности спроса.
1) Составим уравнение регрессионной зависимости спроса у=ахb от цены товара. Почему именно степенная регрессия? Многие примеры показывают, что именно степенная регрессия удачно моделирует спрос.
Приведем расчётную таблицу:
Таблица 2 |
|||||
|
|
|
|
|
|
9 |
1570 |
2,1972 |
7,3588 |
4,8278 |
16,1690 |
12 |
1676 |
2,4849 |
7,4242 |
6,1748 |
18,4484 |
16 |
1188 |
2,7726 |
7,0800 |
7,6872 |
19,6300 |
17 |
1118 |
2,8332 |
7,0193 |
8,0271 |
19,8872 |
18 |
1389 |
2,8904 |
7,2363 |
8,3542 |
20,9157 |
23 |
1261 |
3,1355 |
7,1397 |
9,8313 |
22,3864 |
26 |
1231 |
3,2581 |
7,1156 |
10,6152 |
23,1833 |
27 |
1074 |
3,2958 |
6,9791 |
10,8625 |
23,0021 |
28 |
1179 |
3,3322 |
7,0724 |
11,1036 |
23,5668 |
28 |
1071 |
3,3322 |
6,9763 |
11,1036 |
23,2466 |
31 |
1097 |
3,4340 |
7,0003 |
11,7923 |
24,0391 |
33 |
909 |
3,4965 |
6,8123 |
12,2256 |
23,8194 |
Сумма |
14763 |
36,4626 |
85,2145 |
112,6052 |
258,2938 |
Коэффициенты регрессии у=ахb найдём из решения системы:
, где A=lna.
В нашем случае объём совокупности n=12 получим:
Таблица 3 |
|||||
xi |
yi |
lnxi |
lnyi |
ln2xi |
lnxi· lnyi |
Ʃ |
14763 |
36,4626 |
85,2145 |
112,6052 |
258,2938 |
Систему решим по формулам Крамера:
,
система имеет единственное решение.
,
после чего находим сам коэффициент:
.
Найдем коэффициент b:
Таким образом получим степенную регрессионную зависимость количества проданных товаров от цены: y=axb =3519,9x-0,35.
Изобразим на чертеже эмпирические точки и график регрессии:
Рисунок 1 - Эмпирические точки и график регрессии
По полученному графику можно сказать, что при увеличении цены спрос сначала снизился, а затем уже снижается медленнее. Возможно это связано с тем, какой это товар.
2) Вычислим индексы детерминации и корреляции. Для этого найдём среднее значение признака-результата и заполним ещё одну расчётную таблицу:
xi |
yi |
|
|
|
|
9 |
1570 |
115430,1 |
1631,344 |
3763,03892 |
0,0390724 |
12 |
1676 |
198693,1 |
1475,084 |
40367,0521 |
0,119878 |
16 |
1188 |
1785,063 |
1333,793 |
21255,5072 |
0,1227211 |
17 |
1118 |
12600,06 |
1305,79 |
35264,9311 |
0,1679692 |
18 |
1389 |
25201,56 |
1279,926 |
11897,0813 |
0,0785268 |
23 |
1261 |
945,5625 |
1174,696 |
7448,33706 |
0,0684407 |
26 |
1231 |
0,5625 |
1125,355 |
11160,8065 |
0,0858202 |
27 |
1074 |
24414,06 |
1110,588 |
1338,68761 |
0,0340671 |
28 |
1179 |
2626,563 |
1096,541 |
6799,42851 |
0,0699395 |
28 |
1071 |
25360,56 |
1096,541 |
652,360699 |
0,0238481 |
31 |
1097 |
17755,56 |
1058,166 |
1508,0929 |
0,0354003 |
33 |
909 |
103201,6 |
1035,262 |
15942,1969 |
0,1389025 |
Сумма |
528014,3 |
|
157397,521 |
0,9845861 |
В результате получили, что общая сумма квадратов Q=528014,3, остаточная сумма квадратов Qe≈157397,521 и индекс детерминации:
– таким образом, в рамках построенной модели спрос на 70,19% зависит от изменения цены, а оставшаяся часть вариации (29,81%) спроса обусловлена факторами, не учтёнными моделью.
Вычислим индекс корреляции:
– таким образом, существует сильная корреляционная зависимость количества проданных товаров от цены.
На уровне значимости α=0,05 проверим нулевую гипотезу (генеральный индекс детерминации равен нулю), против конкурирующей гипотезы .
Используем статистический критерий
где – значение выборочного индекса детерминации.
Для α=0,05 и количества степеней свободы k1=1, k2=12-2=10 по соответствующей таблице определим критическое значение критерия:
Fкр.= Fкр.(α; k1; k2)= Fкр.(0,05; 1; 10)≈4,9646
Наблюдаемое значение критерия:
попало в критическую область:
Рисунок 2 – Критическая область
поэтому на уровне значимости α=0,05 гипотезу отвергаем в пользу гипотезы .
Вывод: выборочное значение статистически значимо, следовательно, статистически значимо и выборочное уравнение y=3519,9x-0,35 степенной регрессии.
3) Вычислим среднюю ошибку аппроксимации:
– таким образом, регрессионные значения у(хi) отличаются от соответствующих эмпирических значений yi в среднем на 8,2%, что является хорошим результатом.
4) Определим коэффициент эластичности ε.
Этот коэффициент показывает, на сколько процентов изменится значение признака результата Y при увеличении признака-фактора X на 1%. В случае степенной регрессии y=axb коэффициент эластичности ε=b – постоянен и в точности равен параметру b.
В нашей задаче y=3519,9x-0,35 и ε≈-0,35 – таким образом, при увеличении цены (значения x) на один процент – спрос на товар (значение y) уменьшается примерно на 0,35%. Таким образом, спрос падает медленнее, чем растёт цена. Математически этот факт можно записать так: – и это означает, что такой товар неэластичен по спросу.
Если , то спрос падает быстрее, нежели растёт цена. Такой товар называют эластичным по спросу. Это значит, что его легко заменить или вообще отказаться от покупки.