Практическое занятие 5.2.
Выборочный метод. Пример
решения задачи
Установление закономерностей, которым подчинены массовые случайные явления, основано на изучении статистических данных - результатах наблюдений. Первая задача математической статистики - указать способы сбора и группировки (если данных очень много) статистических сведений. Вторая задача математической статистики — разработать методы анализа статистических данных в зависимости от цели исследования.
Целью данного занятия является знакомство с некоторыми методами обработки статистических данных.
Задача. Имеются следующие условные данные о размере квот в млн СДР (специальные права заимствования) 100 стран – членов Международного валютного фонда.
Задание:
1. Составить (приняв начало первого интервала равным 300) интервальный (с шириной интервала 10) и соответствующий ему дискретный вариационные ряды.
2. Посторить гистограмму и полигон частостей (относительных частот) распределения.
3. Найти моду и медиану ( исходя из дискретного ряда).
4. Построить эмпирическую функцию распределения
353 |
326 |
344 |
324 |
339 |
332 |
324 |
344 |
349 |
352 |
348 |
316 |
329 |
354 |
358 |
302 |
325 |
324 |
351 |
333 |
341 |
312 |
331 |
351 |
304 |
345 |
332 |
382 |
342 |
351 |
396 |
341 |
353 |
318 |
325 |
354 |
338 |
321 |
398 |
359 |
376 |
355 |
382 |
342 |
374 |
354 |
358 |
332 |
368 |
343 |
344 |
376 |
324 |
339 |
372 |
366 |
381 |
334 |
369 |
332 |
371 |
312 |
334 |
361 |
304 |
362 |
354 |
366 |
378 |
348 |
352 |
362 |
356 |
364 |
372 |
342 |
344 |
346 |
353 |
334 |
336 |
364 |
352 |
348 |
347 |
368 |
329 |
335 |
363 |
312 |
378 |
342 |
354 |
363 |
361 |
366 |
354 |
364 |
348 |
351 |
Решение 1. Составим интервальный вариационный ряд.
Частичными интервалами будут: 300-310, 310-320, 320-330, 330-340, 340-350, 350-360, 360-370, 370-380, 380-390, 390-400. Наибольшая варината равна 398, поэтому конец последнего интервала – 400.
Подсчитаем частоты, полагая, что каждому интервалу принадлежит лишь один из его концов (в нашем случае правый). Для удобства подсчета частот пользуются следующими обозначениями чисел.
Число |
1 |
2 |
3 |
4 |
5 |
6 |
7 |
8 |
9 |
10 |
Обозначение числа |
|
|
|
|
|
|
|
|
|
|
Учитывая результаты подсчета частот для данной задачи, составим расчетные таблицы 1 и 2.
Искомый интервальный вариационный ряд частот представляет первую и третью строки таблицы 1.
Таблица 1
Интервалы
|
300-310 |
310-320 |
320-330 |
330-340 |
340-350 |
350-360 |
360-370 |
370-380 |
380-390 |
390-400 |
Обозначе-ние числа |
|
|
|
|
|
|
|
|
|
|
Частоты |
3 |
5 |
10 |
14 |
19 |
21 |
15 |
8 |
3 |
2 |
Накоплен-ные частоты |
3 |
3+5=8 |
8+10=18 |
18+14=32 |
32+19=51 |
51+21=72 |
72+15=87 |
87+8=95 |
95+3=98 |
98+2=100 |
Середины частичных интервалов интервального ряда принимают за варианты соответствующего дискретного ряда. В данном случае дискретный вариационный ряд частот представляет собой первую и вторую строки таблицы 2, а дискретный вариационный ряд частостей – это первая и третья строки таблицы 2.
Таблица 2
Середины интервалов |
305 |
315 |
325 |
335 |
345 |
355 |
365 |
375 |
385 |
395 |
Частоты |
3 |
5 |
10 |
14 |
19 |
21 |
15 |
8 |
3 |
2 |
Частости |
0,03 |
0,05 |
0,10 |
0,14 |
0,19 |
0,21 |
0,15 |
0,08 |
0,03 |
0,02 |
Накопленные частости |
0,03 |
0,08 |
0,18 |
0,32 |
0,51 |
0,72 |
0,87 |
0,95 |
0,98 |
1 |
2. Построим гистограмму и полигон частостей.
Для построения гистограммы частостей на оси абсцисс прямоугольной декартовой системы координат отложим интервалы 300-310, 310-320 и т.д. и на них как на основаниях строим прямоугольники с высотами, равными частостям интервалов (рисунок 1). |
Рисунок 1 - Гистограмма |
Для построения полигона частостей строим точки (305; 0,03), (315; 0,04), ..., (395; 0,02), соединяем их последовательного отрезками прямой. Чтобы полигон был замкнутой фигурой, строим еще две точки (295; 0) и (405; 0).
|
Рисунок 2 - Полигон |
3. Найдем моду и медиану.
Середины интервалов |
305 |
315 |
325 |
335 |
345 |
355 |
365 |
375 |
385 |
395 |
Частоты |
3 |
5 |
10 |
14 |
19 |
21 |
15 |
8 |
3 |
2 |
Частости |
0,03 |
0,05 |
0,10 |
0,14 |
0,19 |
0,21 |
0,15 |
0,08 |
0,03 |
0,02 |
Накопленные частости |
0,03 |
0,08 |
0,18 |
0,32 |
0,51 |
0,72 |
0,87 |
0,95 |
0,98 |
1 |
Мода - значение признака с наибольшей частотой.
Медиана - значение признака, соответствующее первой накопленной частоте большей объема совокупности.
Эмпирическая функция распределения
Пусть имеется выборочная совокупность значений некоторой случайной величины объема и каждому варианту их этой совокупности поставлена в соответствие его относительная частота.
Пусть далее - некоторое действительное число, а - число наблюдений (выборочных значений) случайной величины , при которых наблюдалось значение признака, меньшее .
Тогда число является относительной частотой наблюдаемых в выборке значений величины , таким образом, относительная частота есть функция от .
Так как эта функция находится эмпирическим (опытным) путем, то ее называют эмпирической.
Определение. Эмпирической функцией распределения (функцией распределения выборки) называют функцию, определяющую для каждого значения относительную частоту события . Обозначение:
По определению = , где - число наблюдений (выборочных значений) величины , меньших ; - объем выборки.
Свойства эмпирической функции распределения:
Свойство 1. Значения эмпирической функции принадлежат отрезку
Свойство 2. - неубывающая функция.
Свойство 3. Если - наименьшая варианта, то при ;
если - наибольшая варианта, то при
Итак, эмпирическая функция распределения выборки служит для оценки теоретической функции распределения генеральной совокупности.
Построим эмпирическую функцию распределения , где - число вариант, меньших , найдем, используя строку «накопленные частости» по полученной таблице 2
Середины интервалов |
305 |
315 |
325 |
335 |
345 |
355 |
365 |
375 |
385 |
395 |
Частоты |
3 |
5 |
10 |
14 |
19 |
21 |
15 |
8 |
3 |
2 |
Частости |
0,03 |
0,05 |
0,10 |
0,14 |
0,19 |
0,21 |
0,15 |
0,08 |
0,03 |
0,02 |
Накопленные частости |
0,03 |
0,08 |
0,18 |
0,32 |
0,51 |
0,72 |
0,87 |
0,95 |
0,98 |
1 |
Построим график функции сначала на интервалах и , а затем в точках (310; 0,03) и др. Чтобы показать непрерывность изменения функции , полученные точки соединим отрезками прямой (рис. 3).
|
Рисунок 3 - график функции |
Для дискретного вариационного ряда эмпирическая функция распределенная имеет вид, приведенный ниже. График этой функции приведен на рис. 4. Скачки функция имеет в точках, которые соответствуют вариантам 305, 315 и т.д.
|
Рисунок 4.- график функции |
Контрольные вопросы
1. Задача математической статистики.
2. Выборка. Генеральная совокупность.
3. Вариационный ряд. Частоты и относительные частоты.
4. Статистическое распределение для дискретной и непрерывной случайных величин.
5. Эмпирическая и теоретическая функции распределения.
6. Полигон распределения. Гистограмма относительных частот.