Практическое занятие 10.1.
Равнонаполненные группировки
Рассмотрим некоторую статистическую совокупность. Это множество данных, его можно исследовать как единое целое и рассматривать определенные значения, характеризующие эту совокупность в целом – это количество, среднее значение, например, средний возраст, средняя заработная плата и т.д. Это общие характеристики. Но часто необходимо изучить детали, поэтому возникает вопрос разбиения на группы в зависимости от исследуемых признаков. Группировка - это разделение статистической совокупности (не важно, генеральной или выборочной) на группы по одному или большему количеству признаков.
На лекции была рассмотрена задача 1:
В результате выборочного исследования 30 станков рассчитаны их относительные показатели металлоёмкости (т/кВт):
6 |
1,1818 |
1,6667 |
3,3333 |
3,75 |
0,4 |
0,3333 |
0,5556 |
2,6667 |
0,15 |
0,6923 |
1,6667 |
1,2609 |
2,5 |
1,2 |
0,875 |
2,1667 |
0,5 |
0,5789 |
1,4286 |
2 |
2 |
0,5 |
0,8571 |
2,1429 |
8 |
0,9333 |
0,8182 |
2,3333 |
6 |
Продолжим рассмотрение этой задачи.
Требуется:
а) выполнить структурную равнонаполненную группировку;
б) выбрать наиболее удачную группировку и вычислить выборочные средние; результаты оформить в виде групповой таблицы;
в) по выбранной группировке построить интервальный вариационный ряд;
г) сделать краткие выводы.
Решение.
а) Равнонаполненные группировки - это разбиение совокупности на группы с одинаковым (или примерно одинаковым) количеством объектов, станков в данном случае. Но интервалы здесь получатся разной длины.
Отсортируем числа по возрастанию и выделим 5 групп по станков в каждой:
0,15 |
0,5789 |
1,1818 |
2 |
2,6667 |
0,3333 |
0,6923 |
1,2 |
2 |
3,3333 |
0,4 |
0,8182 |
1,2609 |
2,1429 |
3,75 |
0,5 |
0,8571 |
1,4286 |
2,1667 |
6 |
0,5 |
0,875 |
1,6667 |
2,3333 |
6 |
0,5556 |
0,9333 |
1,6667 |
2,5 |
8 |
Формально всё выглядит нормально (и можно оставить так), но некоторые значения логичнее перенести в соседние группы. Так, значение 0,5789 (верхняя строка) явно ближе к 1-й группе, а значение 2,6667 - к предпоследней группе;
Получим группировку:
0,15 |
0,6923 |
1,1818 |
2 |
3,3333 |
0,3333 |
0,8182 |
1,2 |
2 |
3,75 |
0,4 |
0,8571 |
1,2609 |
2,1429 |
6 |
0,5 |
0,875 |
1,4286 |
2,1667 |
6 |
0,5 |
0,9333 |
1,6667 |
2,3333 |
8 |
0,5556 |
|
1,6667 |
2,5 |
|
0,5789 |
|
|
2,6667 |
|
б) Очевидно, что равнонаполненная группировка более удачна. По каждой группе подсчитаем сумму, объём (количество станков) и выборочную среднюю - как результат деления суммы на соответствующий объём. Вычисления сведём в групповую таблицу:
Номер группы, i |
||||
1 |
2 |
3 |
4 |
5 |
0,15 |
0,6923 |
1,1818 |
2 |
3,3333 |
0,3333 |
0,8182 |
1,2 |
2 |
3,75 |
0,4 |
0,8571 |
1,2609 |
2,1429 |
6 |
0,5 |
0,875 |
1,4286 |
2,1667 |
6 |
0,5 |
0,9333 |
1,6667 |
2,3333 |
8 |
0,5556 |
1,6667 |
2,5 |
||
0,5789 |
2,6667 |
|||
Итого по группам (суммы): |
||||
3,0178 |
4,1759 |
8,4047 |
15,81 |
27,083 |
Количество станков в группе, |
||||
7 |
5 |
6 |
7 |
5 |
Средняя металлоемкость, т/кВт |
||||
0,4311 |
0,8352 |
1,4008 |
2,2585 |
5,4167 |
Примеры расчёта групповых средних:
т/кВт;
т/кВт;
и так далее.
Проконтролируем объём выборки:
в) Построим интервальный вариационный ряд по равнонаполненной группировке. Границы интервалов можно брать как средние арифметические соседних граничных значений, например: (граница между 1-м и 2-м интервалами).
Допустимо разметить интервалы, выбирая удобные округленные значения:
Металлоемкость, т/кВт |
Количество станков в группе, |
0,15-0,6 |
7 |
0,6-1,1 |
5 |
1,1-1,8 |
6 |
1,8-3 |
7 |
3-8 |
5 |
Полученный интервальный ряд имеет разную длину интервалов, но для него точно так же можно построить гистограмму, эмпирическую функцию распределения, а также рассчитать типовые характеристики.
г) Сделаем краткие выводы.
Цель статистического исследования - сделать выводы.
В результате исследования рассчитана средняя металлоёмкость т/кВт по выборке и средние значения по группам равнонаполненной (наиболее удачной) группировки. Большинство станков (18 шт. в первых трёх группах) имеют показатель металлоёмкости меньший, чем средняя металлоёмкость по выборке. Пять станков (группа 5) обладают значительно большей металлоёмкостью, чем остальные, и причины этого требуют отдельного анализа (возможно, станки морально устарели).
Задача 2.
По результатам выборочного исследования 50 предприятий получены данные об их квартальной прибыли (млн. руб).
107 |
113 |
103 |
99 |
116 |
102 |
112 |
113 |
107 |
106 |
107 |
106 |
124 |
87 |
120 |
122 |
111 |
95 |
109 |
105 |
108 |
113 |
102 |
106 |
114 |
108 |
122 |
112 |
113 |
107 |
97 |
118 |
124 |
123 |
115 |
109 |
119 |
116 |
82 |
96 |
101 |
102 |
118 |
104 |
104 |
116 |
100 |
100 |
112 |
108 |
Требуется:
1) вычислить среднюю прибыль;
2) провести равнонаполненную группировку и вычислить групповые средние;
3) построить соответствующий вариационный ряд;
4) сделать выводы.
Решение.
1) вычислим среднюю квартальную прибыль предприятий:
млн. руб.
2) Проведём равнонаполненную группировку с равным или примерно равным количеством предприятий в каждой группе.
Оптимальное количество интервалов определим по формуле Стерджеса:
и, округляя влево, получаем 6 интервалов.
Таким образом, в каждом интервале будет содержаться – от 7 до 9 предприятий:
Интервалы (т/кВт) |
|
0,15 - 1,72 |
8 |
1,72-3,29 |
7 |
3,29 - 4,86 |
2 |
4,86 - 6,43 |
2 |
6,43 - 8 |
1 |
Упорядочим совокупность по возрастанию и выделим в ней следующие группы; в групповой таблице вычислим суммы и групповые средние:
Номер группы, i |
|||||
1 |
2 |
3 |
4 |
5 |
6 |
82 |
101 |
106 |
108 |
113 |
118 |
87 |
102 |
106 |
108 |
113 |
118 |
95 |
102 |
106 |
108 |
113 |
119 |
96 |
102 |
107 |
109 |
113 |
120 |
97 |
103 |
107 |
109 |
114 |
122 |
99 |
104 |
107 |
111 |
115 |
122 |
100 |
104 |
107 |
112 |
116 |
123 |
100 |
105 |
112 |
116 |
124 |
|
112 |
116 |
124 |
|||
Итого по группам: |
|||||
756 |
823 |
746 |
989 |
1029 |
1090 |
Количество предприятий в группе, |
|||||
8 |
8 |
7 |
9 |
9 |
9 |
Средняя прибыль по группе, млн. руб.: |
|||||
94,5 |
102,88 |
106,57 |
109,89 |
114,33 |
121,11 |
Промежуточный контроль: .
3) Построим интервальный вариационный ряд:
Прибыль, млн. руб. |
Количество предприятий в группе, |
81,5-100,5 |
8 |
100,5-105,5 |
8 |
105,5-107,5 |
7 |
107,5-112,5 |
9 |
112,5-116,5 |
9 |
116,5-124,5 |
9 |
4) Средняя прибыль предприятий за квартал составила млн. руб. Прибыль варьируется в пределах от 82 до 124 млн. руб. и равнонаполненная группировка показала, что распределение предприятий по данному показателю близко к равномерному. То есть, практически нет предприятий со слишком большой или слишком малой прибылью.
На следующем занятии рассмотрим другие способы группировки данных.
Контрольные вопросы
1. Основные виды группировок
2. Структурная группировка
3. Равноинтервальная группировка
4. Равнонаполненная группировка
5. Выборочные средние
6. Групповые таблицы
7. Интервальный вариационный ряд