Практическое занятие 10.1.

 

Равнонаполненные группировки

 

Рассмотрим некоторую статистическую совокупность. Это множество данных, его можно исследовать как единое целое и рассматривать определенные значения, характеризующие эту совокупность в целом – это количество, среднее значение, например, средний возраст, средняя заработная плата и т.д. Это общие характеристики. Но часто необходимо изучить детали, поэтому возникает вопрос разбиения на группы в зависимости от исследуемых признаков.   Группировка - это разделение статистической совокупности (не важно, генеральной или выборочной) на группы по одному или большему количеству признаков.

На лекции была рассмотрена задача 1:

 В результате выборочного исследования 30 станков рассчитаны их относительные показатели металлоёмкости (т/кВт):

 

6

1,1818

1,6667

3,3333

3,75

0,4

0,3333

0,5556

2,6667

0,15

0,6923

1,6667

1,2609

2,5

1,2

0,875

2,1667

0,5

0,5789

1,4286

2

2

0,5

0,8571

2,1429

8

0,9333

0,8182

2,3333

6

 

Продолжим рассмотрение этой задачи.

Требуется:

а) выполнить структурную равнонаполненную группировку;

б) выбрать наиболее удачную группировку и вычислить выборочные средние; результаты оформить в виде групповой таблицы;

в) по выбранной группировке построить интервальный вариационный ряд;

г) сделать краткие выводы.

Решение.

а) Равнонаполненные группировки - это разбиение совокупности на группы с одинаковым (или примерно одинаковым) количеством объектов, станков в данном случае. Но интервалы здесь получатся разной длины.

Отсортируем числа по возрастанию и выделим 5 групп по  станков в каждой:

 

0,15

0,5789

1,1818

2

2,6667

0,3333

0,6923

1,2

2

3,3333

0,4

0,8182

1,2609

2,1429

3,75

0,5

0,8571

1,4286

2,1667

6

0,5

0,875

1,6667

2,3333

6

0,5556

0,9333

1,6667

2,5

8

 

Формально всё выглядит нормально (и можно оставить так), но некоторые значения логичнее перенести в соседние группы. Так, значение 0,5789 (верхняя строка) явно ближе к 1-й группе, а значение 2,6667 - к предпоследней группе;

Получим группировку:

 

0,15

0,6923

1,1818

2

3,3333

0,3333

0,8182

1,2

2

3,75

0,4

0,8571

1,2609

2,1429

6

0,5

0,875

1,4286

2,1667

6

0,5

0,9333

1,6667

2,3333

8

0,5556

 

1,6667

2,5

 

0,5789

 

 

2,6667

 

 

б) Очевидно, что равнонаполненная группировка более удачна. По каждой группе подсчитаем сумму, объём (количество станков) и выборочную среднюю - как результат деления суммы на соответствующий объём. Вычисления сведём в групповую таблицу:

 

Номер группы, i

1

2

3

4

5

0,15

0,6923

1,1818

2

3,3333

0,3333

0,8182

1,2

2

3,75

0,4

0,8571

1,2609

2,1429

6

0,5

0,875

1,4286

2,1667

6

0,5

0,9333

1,6667

2,3333

8

0,5556

1,6667

2,5

0,5789

2,6667

Итого по группам (суммы):

3,0178

4,1759

8,4047

15,81

27,083

Количество станков в группе,

7

5

6

7

5

Средняя металлоемкость,  т/кВт

0,4311

0,8352

1,4008

2,2585

5,4167

 

Примеры расчёта групповых средних:

 

 т/кВт;

 т/кВт;

 

и так далее.

Проконтролируем объём выборки:

 

в) Построим интервальный вариационный ряд по равнонаполненной группировке. Границы интервалов можно брать как средние арифметические соседних граничных значений, например:  (граница между 1-м и 2-м интервалами).

Допустимо разметить интервалы, выбирая удобные округленные значения:

 

Металлоемкость, т/кВт

Количество станков

в группе,

0,15-0,6

7

0,6-1,1

5

1,1-1,8

6

1,8-3

7

3-8

5

 

Полученный интервальный ряд имеет разную длину интервалов, но для него точно так же можно построить гистограмму, эмпирическую функцию распределения, а также рассчитать типовые характеристики.

г) Сделаем краткие выводы.

Цель статистического исследования - сделать выводы.

В    результате   исследования   рассчитана   средняя   металлоёмкость  т/кВт  по выборке и средние значения по группам равнонаполненной (наиболее удачной) группировки. Большинство станков (18 шт. в первых трёх группах) имеют показатель металлоёмкости меньший, чем средняя металлоёмкость по выборке. Пять станков (группа 5) обладают значительно большей металлоёмкостью, чем остальные, и причины этого требуют отдельного анализа (возможно, станки морально устарели).

Задача 2.

По результатам выборочного исследования 50 предприятий получены данные об их квартальной прибыли (млн. руб).

 

107

113

103

99

116

102

112

113

107

106

107

106

124

87

120

122

111

95

109

105

108

113

102

106

114

108

122

112

113

107

97

118

124

123

115

109

119

116

82

96

101

102

118

104

104

116

100

100

112

108

 

Требуется:

1) вычислить среднюю прибыль;

2) провести равнонаполненную группировку и вычислить групповые средние;

3) построить соответствующий вариационный ряд;

4) сделать выводы.

Решение.

1)    вычислим среднюю квартальную прибыль предприятий:

 

  млн. руб.

 

2)  Проведём равнонаполненную группировку с равным или примерно равным количеством предприятий в каждой группе.

Оптимальное количество интервалов определим по формуле Стерджеса:

 

 

и, округляя влево, получаем 6 интервалов.

Таким образом, в каждом интервале будет содержаться   – от 7 до 9 предприятий:

 

Интервалы (т/кВт)

0,15 - 1,72

8

1,72-3,29

7

3,29 - 4,86

2

4,86 - 6,43

2

6,43 - 8

1

 

Упорядочим совокупность по возрастанию и выделим в ней следующие группы; в групповой таблице вычислим суммы и групповые средние:

 

Номер группы, i

1

2

3

4

5

6

82

101

106

108

113

118

87

102

106

108

113

118

95

102

106

108

113

119

96

102

107

109

113

120

97

103

107

109

114

122

99

104

107

111

115

122

100

104

107

112

116

123

100

105

112

116

124

112

116

124

Итого по группам:

756

823

746

989

1029

1090

Количество предприятий в группе,

8

8

7

9

9

9

Средняя прибыль по группе,  млн. руб.:

94,5

102,88

106,57

109,89

114,33

121,11

 

Промежуточный контроль: .

 

3)    Построим интервальный вариационный ряд:

Прибыль, млн. руб.

Количество предприятий в группе,

81,5-100,5

8

100,5-105,5

8

105,5-107,5

7

107,5-112,5

9

112,5-116,5

9

116,5-124,5

9

 

4) Средняя прибыль предприятий за квартал составила   млн. руб. Прибыль варьируется в пределах от 82 до 124 млн. руб. и равнонаполненная группировка показала, что распределение предприятий по данному показателю близко к равномерному. То есть, практически нет предприятий со слишком большой или слишком малой прибылью.

На следующем занятии рассмотрим другие способы группировки данных.

 

Контрольные вопросы

1. Основные виды группировок

2. Структурная группировка

3. Равноинтервальная группировка

4. Равнонаполненная группировка

5. Выборочные средние

6. Групповые таблицы

7. Интервальный вариационный ряд