Практическое занятие 14.1.
Нахождение уравнения регрессии
На лекции мы разобрали нахождение уравнений регрессии, построение корреляционного поля и линий регрессии. На этом занятии рассмотрим еще один пример на эту тему.
Задача. Известны следующие данные:
Таблица 1 |
||||
У |
Х |
|||
45 |
55 |
65 |
75 |
|
10 |
|
|
5 |
3 |
20 |
|
7 |
15 |
8 |
30 |
3 |
9 |
|
|
Требуется:
1. Найти линейный коэффициент корреляции и уравнения регрессии Y на X и X на Y.
2. Построить корреляционное поле, линии регрессии и определить их точку пересечения.
3. Вычислить y(50) и x(7).
По каждому пункту сделать выводы.
Решение. Вычислим частоты по каждому признаку:
Таблица 2 |
|||||
У |
Х |
mj |
|||
45 |
55 |
65 |
75 |
||
10 |
|
|
5 |
3 |
8 |
20 |
|
7 |
15 |
8 |
30 |
30 |
3 |
9 |
|
|
12 |
ni |
3 |
16 |
20 |
11 |
50 |
Линейный коэффициент корреляции найдём по формуле:
Заполним расчётную таблицу для признака X:
Таблица 3 |
|||||
xi |
45 |
55 |
65 |
75 |
Суммы |
ni |
3 |
16 |
20 |
11 |
50 |
xini |
135 |
880 |
1300 |
825 |
3140 |
xi2ni |
6075 |
48400 |
84500 |
61875 |
200850 |
Вычислим среднее значение и среднее квадратическое отклонение:
.
Заполним расчётную таблицу для признака Y:
Таблица 4 |
||||
уj |
10 |
20 |
30 |
Сумма |
mj |
8 |
30 |
12 |
50 |
yjmj |
80 |
600 |
360 |
1040 |
yj2mj |
800 |
12000 |
10800 |
23600 |
Вычислим
Вычислим произведения :
Таблица 5 |
|||
|
|
3250 |
2250 |
|
7700 |
19500 |
12000 |
4050 |
14850 |
|
|
найдем сумму и среднюю
Вычислим линейный коэффициент корреляции:
таким образом, существует заметная обратная линейная корреляционная зависимость между признаками (в обе стороны).
Составим уравнение линейной регрессии Y на X (здесь и далее вычисления приближённые):
Полученное уравнение показывает, что при увеличении х на 1 единицу у в среднем уменьшается примерно на 0,47 единицы.
Составим уравнение линейной регрессии X на Y:
Полученное уравнение показывает, что при увеличении у на 1 единицу х в среднем уменьшается примерно на 0,87 единицы.
Найдём точки для построения графиков:
Таблица 6
|
|
|
||||
х |
40 |
80 |
у |
5 |
35 |
|
у |
31,47 |
12,75 |
х |
76,54 |
50,45 |
построим корреляционное поле и изобразим линии регрессии:
Рисунок 1 - Линии регрессии
Линии регрессии пересекаются в точке
Вычислим:
среднеожидаемое значение у при x=50;
среднеожидаемое значение х при y=7.