Раздел 2. Математическая статистика

 

Лекция 6. Основные показатели статистической совокупности

 

 

Если в результате наблюдений получены первичные статистические данные. Чаще всего это выборка объёма n. Но бывает и генеральная совокупность объёма N. Объём – это элементарный и важнейший показатель статистической совокупности. Нужно исследовать эту статистическую совокупность и сделать выводы. Составляем дискретный либо интервальный вариационный ряд.

Для статистической совокупности можно рассчитать её ключевые показатели, среди которых выделяют две большие группы: показатели центральной тенденции: среднее арифметическое значение и показатели вариации - они показывают, как варьируются статистические данные, а именно – насколько далеко «разбросаны» варианты относительно средних значений. Эти вопросы будут рассмотрены на этой лекции.

 

План лекции

 

1. Генеральная и выборочная средние;

2. Генеральная и выборочная дисперсия;

3. Моменты распределения вариационных рядов;

4. Мода и медиана.

 

1. Генеральная и выборочная средние

 

Генеральная средняя.

Пусть изучается дискретная генеральная совокупность относительно количественного признака .

Определение. Генеральной средней называют среднее арифметическое значений признака генеральной совокупности:

 

 

Если же значения признака  имеют соответственно частоты , причем ,

 

 

Вычисленное по формуле (1) среднее арифметическое называется взвешенным.

 

Выборочная средняя.

Пусть для изучения генеральной совокупности относительно количественного признака  извлечена выборка объема .

Определение. Выборочной средней называют среднее арифметическое значение признака выборочной совокупности:

 

 

 

Если же значения признака  имеют соответственно частоты , причем ,

 

 

т.е. выборочная средняя есть средняя взвешенная значений признака с весами, равными соответствующим частотам.

 

2. Генеральная и выборочная дисперсия

 

Генеральная дисперсия. Для того чтобы охарактеризовать рассеяние значений количественного признака  генеральной совокупности вокруг своего среднего значения, вводят сводную характеристику – генеральную дисперсию.

Определение. Генеральной дисперсией называют среднее арифметическое квадратов отклонений значений признака генеральной совокупности от их среднего значения . Обозначение:

 

 

 

Если же значения признака  имеют соответственно частоты , причем , то

 

 

т.е. генеральная дисперсия есть средняя взвешенная квадратов отклонений с весами соответствующим частотам.

 

Выборочная дисперсия.  Для того чтобы охарактеризовать рассеяние наблюдаемых значений количественного признака выборки вокруг своего среднего значения , вводят свободную характеристику – выборочную дисперсию.

Определение. Выборочной дисперсией называют среднее арифметическое квадратов отклонения наблюдаемых значений признака от их среднего значения . Обозначение: .

Если все значения  признака выборки объема  различны, то

 

 

Слайд 11

Если же значения признака  имеют соответственно частоты  (сгруппированы), причем , то  

 

 

т.е. выборочная дисперсия есть средняя взвешенная квадратов отклонений с весами равными соответствующим частотам.

А теперь представьте, что вся группа выполняет лабораторную работу по физике, и каждый провёл по 10 испытаний в схожих условиях.

Если в результате испытаний получились несколько разные выборочные значения , но все они будут варьироваться вокруг истинного значения показателя . Это свойство называется несмещённостью оценки генеральной средней, и справедливо, но не для всех показателей.

Поговорим об отклонениях. Всё просто: у кого эти показатели ниже, тот качественнее проводит опыты. В идеале эти отклонения равны нулю, но это только в идеале. В случае с полученными линейными отклонениями – всё то же самое, они будут безо всякой закономерности варьироваться вокруг генерального значения .

Но вот с дисперсией всё не так. Полученные значения выборочной дисперсии  будут давать систематически заниженную оценку генеральной дисперсии . И поэтому выборочную дисперсию следует «поправить» по формуле:

 

 

Показатель s2исправленная выборочная дисперсия, и вот она уже является несмещённой оценкой генеральной дисперсии.

Следует отметить, что в больших выборках (от 30 вариант) этой поправкой можно пренебречь, так как при n ®¥ дробь  и .

Кроме дисперсии, для характеристики рассеяния значений признака выборочной совокупности вокруг своего среднего значения пользуются сводной характеристикой – средним квадратическим отклонением.

Определение. Выборочным средним квадратическим отклонением (стандартом) называют квадратный корень из выборочной дисперсии:. Обозначение:

 

 

Теорема. Дисперсия равна среднему квадратов значений признака минус квадрат общей средней:

 

 

Вычисление дисперсии по формуле:

для не сгруппированных вариант

 

 

 Если значения признака  имеют соответственно частоты  (сгруппированы), причем , то

 

 

 

3. Моменты распределения вариационных рядов

 

Обобщающими характеристиками являются моменты распределения.

При расчете средних в качестве весов можно использовать частоты, относительные частоты или вероятности. При использовании в качестве весов частот или относительных частот моменты называются эмпирическими, а при использовании вероятностей — теоретическими. Порядок момента определяется величиной k.

Эмпирический момент k-го порядка находится как отношение суммы произведений k-х степеней отклонений вариант от постоянной величины A на частоты к сумме частот:

 

 

Если A=0, то моменты называются начальными, обозначаются  и вычисляются по формуле: 

 

 

Если за постоянную величину A взять среднюю , то моменты называются центральными, обозначаются µk и рассчитываются по формуле:

 

 

 

4. Мода и медиана

 

Эти понятия тоже вводятся как для генеральной, так и для выборочной совокупности, и определения мы сформулируем в общем виде.

 

Мода дискретного вариационного ряда – это варианта с максимальной частотой. Моду легко отыскать по таблице, и ещё легче на полигоне частот – это абсцисса самой высокой точки:

http://www.mathprofi.ru/s/moda_mediana_generalnaya_i_vyborochnaya_srednyaya_clip_image054.jpg

Рисунок 2 – Мода дискретного вариационного ряда

 

Медиана вариационного ряда – это значение, которая делит его на две равные части (по количеству вариант).

Для нахождения медианы сортируем варианты по возрастанию или убыванию и находим середину ранжированного ряда.

– если совокупность содержит нечётное количество чисел (наш случай), то делим её объём пополам: и округляем полученное значение в большую сторону;

– если совокупность содержит чётное количество чисел, например 20, то медианное значение здесь рассчитывается как среднее арифметическое двух центральных чисел: