Практическое занятие 5.2.

 

Выборочный метод. Пример

решения задачи

 

Установление закономерностей, которым подчинены массовые случайные явления, основано на изучении статистических данных - результатах наблюдений. Первая задача математической статистики - указать способы сбора и группировки (если данных очень много) статистических сведений. Вторая задача математической статистики — разработать методы анализа статистических данных в зависимости от цели исследования.

Целью данного занятия является знакомство с некоторыми методами обработки статистических данных.

Задача.  Имеются следующие условные данные о размере квот в млн СДР (специальные права заимствования) 100 стран – членов Международного валютного фонда.

Задание:

1. Составить (приняв начало первого интервала равным 300) интервальный (с шириной интервала 10) и соответствующий ему дискретный вариационные ряды.

2. Посторить гистограмму  и полигон частостей (относительных частот) распределения.

3. Найти моду и медиану ( исходя из дискретного ряда).

4. Построить эмпирическую функцию распределения

 

353

326

344

324

339

332

324

344

349

352

348

316

329

354

358

302

325

324

351

333

341

312

331

351

304

345

332

382

342

351

396

341

353

318

325

354

338

321

398

359

376

355

382

342

374

354

358

332

368

343

344

376

324

339

372

366

381

334

369

332

371

312

334

361

304

362

354

366

378

348

352

362

356

364

372

342

344

346

353

334

336

364

352

348

347

368

329

335

363

312

378

342

354

363

361

366

354

364

348

351

 

Решение 1.  Составим интервальный вариационный ряд.

Частичными интервалами будут: 300-310, 310-320, 320-330, 330-340, 340-350, 350-360, 360-370, 370-380, 380-390, 390-400. Наибольшая варината равна 398, поэтому конец последнего интервала – 400.

Подсчитаем частоты, полагая, что каждому интервалу принадлежит лишь один из его концов (в нашем случае правый). Для удобства подсчета частот пользуются следующими обозначениями чисел.

 

Число

1

2

3

4

5

6

7

8

9

10

Обозначение числа


 

Учитывая результаты подсчета частот для данной задачи, составим расчетные таблицы 1 и 2.

Искомый интервальный вариационный ряд частот представляет первую и третью строки таблицы 1.

 

Таблица 1

 

Интервалы

300-310

310-320

320-330

330-340

340-350

350-360

360-370

370-380

380-390

390-400

Обозначе-ние числа



Частоты

3

5

10

14

19

21

15

8

3

2

Накоплен-ные частоты

3

3+5=8

8+10=18

18+14=32

32+19=51

51+21=72

72+15=87

87+8=95

95+3=98

98+2=100

 

Середины частичных интервалов интервального ряда принимают за варианты соответствующего дискретного ряда. В данном случае дискретный вариационный ряд частот представляет собой первую и вторую строки таблицы 2, а дискретный вариационный ряд частостей – это первая и третья строки таблицы 2.

 

Таблица 2

 

Середины интервалов

305

315

325

335

345

355

365

375

385

395

Частоты

3

5

10

14

19

21

15

8

3

2

Частости

0,03

0,05

0,10

0,14

0,19

0,21

0,15

0,08

0,03

0,02

Накопленные частости

0,03

0,08

0,18

0,32

0,51

0,72

0,87

0,95

0,98

1

 

2. Построим гистограмму и полигон частостей.

 

  

      Для построения гистограммы частостей на оси абсцисс прямоугольной декартовой системы координат отложим интервалы 300-310, 310-320 и т.д. и на них как на основаниях строим прямоугольники с высотами, равными частостям интервалов (рисунок 1).

Рисунок 1 - Гистограмма

 

 

 

Для построения полигона частостей строим точки (305; 0,03), (315; 0,04), ..., (395; 0,02), соединяем их последовательного отрезками прямой. Чтобы полигон был замкнутой фигурой, строим еще две точки (295; 0) и (405; 0).

 

                     Рисунок 2 - Полигон

 

 

3. Найдем моду и медиану.

 

Середины интервалов

305

315

325

335

345

355

365

375

385

395

Частоты

3

5

10

14

19

21

15

8

3

2

Частости

0,03

0,05

0,10

0,14

0,19

0,21

0,15

0,08

0,03

0,02

Накопленные частости

0,03

0,08

0,18

0,32

0,51

0,72

0,87

0,95

0,98

1

 

Мода  - значение признака с наибольшей частотой.

Медиана - значение признака, соответствующее первой накопленной частоте большей  объема совокупности.

 

Эмпирическая функция распределения

 

Пусть имеется выборочная совокупность значений некоторой случайной величины  объема  и каждому варианту их этой совокупности поставлена в соответствие его относительная частота.

Пусть далее  - некоторое действительное число, а  - число наблюдений (выборочных значений) случайной величины , при которых наблюдалось значение признака, меньшее .

Тогда число  является относительной частотой наблюдаемых в выборке значений величины , таким образом, относительная частота  есть функция от .

 

Так как эта функция находится эмпирическим (опытным) путем, то ее называют эмпирической.

Определение. Эмпирической функцией распределения (функцией распределения выборки) называют функцию, определяющую для каждого значения относительную частоту события . Обозначение:

По определению   = , где  - число наблюдений (выборочных значений) величины , меньших ;  - объем выборки.

 

Свойства эмпирической функции распределения:

 

Свойство 1. Значения эмпирической функции принадлежат отрезку

Свойство 2.   - неубывающая функция.

Свойство 3. Если  - наименьшая варианта, то  при ;

 если  - наибольшая варианта, то  при

Итак, эмпирическая функция распределения выборки служит для оценки теоретической функции распределения генеральной совокупности.

Построим эмпирическую функцию распределения , где - число вариант, меньших , найдем, используя строку «накопленные частости» по полученной таблице 2

 

Середины интервалов

305

315

325

335

345

355

365

375

385

395

Частоты

3

5

10

14

19

21

15

8

3

2

Частости

0,03

0,05

0,10

0,14

0,19

0,21

0,15

0,08

0,03

0,02

Накопленные частости

0,03

0,08

0,18

0,32

0,51

0,72

0,87

0,95

0,98

1

 

Построим график функции  сначала на интервалах и , а затем в точках (310; 0,03) и др. Чтобы показать непрерывность изменения функции , полученные точки соединим отрезками прямой (рис. 3).

 

 

Рисунок 3 - график функции

 

Для дискретного вариационного ряда эмпирическая функция распределенная имеет вид, приведенный ниже. График этой функции приведен на рис. 4. Скачки функция имеет в точках, которые соответствуют вариантам 305, 315 и т.д.

 

Рисунок 4.- график функции

 

 

Контрольные вопросы

1. Задача математической статистики.

2. Выборка. Генеральная совокупность.

3. Вариационный ряд. Частоты и относительные частоты.

4. Статистическое распределение для дискретной и непрерывной случайных величин.

5. Эмпирическая и теоретическая функции распределения.

6. Полигон распределения. Гистограмма относительных частот.