Раздел 2. Математическая статистика
Лекция 6. Основные показатели статистической совокупности
Если в результате наблюдений получены первичные статистические данные. Чаще всего это выборка объёма n. Но бывает и генеральная совокупность объёма N. Объём – это элементарный и важнейший показатель статистической совокупности. Нужно исследовать эту статистическую совокупность и сделать выводы. Составляем дискретный либо интервальный вариационный ряд.
Для статистической совокупности можно рассчитать её ключевые показатели, среди которых выделяют две большие группы: показатели центральной тенденции: среднее арифметическое значение и показатели вариации - они показывают, как варьируются статистические данные, а именно – насколько далеко «разбросаны» варианты относительно средних значений. Эти вопросы будут рассмотрены на этой лекции.
План лекции
1. Генеральная и выборочная средние;
2. Генеральная и выборочная дисперсия;
3. Моменты распределения вариационных рядов;
4. Мода и медиана.
1. Генеральная и выборочная средние
Генеральная средняя.
Пусть изучается дискретная генеральная совокупность относительно количественного признака .
Определение. Генеральной средней называют среднее арифметическое значений признака генеральной совокупности:
Если же значения признака имеют соответственно частоты , причем ,
Вычисленное по формуле (1) среднее арифметическое называется взвешенным.
Выборочная средняя.
Пусть для изучения генеральной совокупности относительно количественного признака извлечена выборка объема .
Определение. Выборочной средней называют среднее арифметическое значение признака выборочной совокупности:
Если же значения признака имеют соответственно частоты , причем ,
т.е. выборочная средняя есть средняя взвешенная значений признака с весами, равными соответствующим частотам.
2. Генеральная и выборочная дисперсия
Генеральная дисперсия. Для того чтобы охарактеризовать рассеяние значений количественного признака генеральной совокупности вокруг своего среднего значения, вводят сводную характеристику – генеральную дисперсию.
Определение. Генеральной дисперсией называют среднее арифметическое квадратов отклонений значений признака генеральной совокупности от их среднего значения . Обозначение:
Если же значения признака имеют соответственно частоты , причем , то
т.е. генеральная дисперсия есть средняя взвешенная квадратов отклонений с весами соответствующим частотам.
Выборочная дисперсия. Для того чтобы охарактеризовать рассеяние наблюдаемых значений количественного признака выборки вокруг своего среднего значения , вводят свободную характеристику – выборочную дисперсию.
Определение. Выборочной дисперсией называют среднее арифметическое квадратов отклонения наблюдаемых значений признака от их среднего значения . Обозначение: .
Если все значения признака выборки объема различны, то
Слайд 11
Если же значения признака имеют соответственно частоты (сгруппированы), причем , то
т.е. выборочная дисперсия есть средняя взвешенная квадратов отклонений с весами равными соответствующим частотам.
А теперь представьте, что вся группа выполняет лабораторную работу по физике, и каждый провёл по 10 испытаний в схожих условиях.
Если в результате испытаний получились несколько разные выборочные значения , но все они будут варьироваться вокруг истинного значения показателя . Это свойство называется несмещённостью оценки генеральной средней, и справедливо, но не для всех показателей.
Поговорим об отклонениях. Всё просто: у кого эти показатели ниже, тот качественнее проводит опыты. В идеале эти отклонения равны нулю, но это только в идеале. В случае с полученными линейными отклонениями – всё то же самое, они будут безо всякой закономерности варьироваться вокруг генерального значения .
Но вот с дисперсией всё не так. Полученные значения выборочной дисперсии будут давать систематически заниженную оценку генеральной дисперсии . И поэтому выборочную дисперсию следует «поправить» по формуле:
Показатель s2– исправленная выборочная дисперсия, и вот она уже является несмещённой оценкой генеральной дисперсии.
Следует отметить, что в больших выборках (от 30 вариант) этой поправкой можно пренебречь, так как при n ®¥ дробь и .
Кроме дисперсии, для характеристики рассеяния значений признака выборочной совокупности вокруг своего среднего значения пользуются сводной характеристикой – средним квадратическим отклонением.
Определение. Выборочным средним квадратическим отклонением (стандартом) называют квадратный корень из выборочной дисперсии:. Обозначение:
Теорема. Дисперсия равна среднему квадратов значений признака минус квадрат общей средней:
Вычисление дисперсии по формуле:
для не сгруппированных вариант
Если значения признака имеют соответственно частоты (сгруппированы), причем , то
3. Моменты распределения вариационных рядов
Обобщающими характеристиками являются моменты распределения.
При расчете средних в качестве весов можно использовать частоты, относительные частоты или вероятности. При использовании в качестве весов частот или относительных частот моменты называются эмпирическими, а при использовании вероятностей — теоретическими. Порядок момента определяется величиной k.
Эмпирический момент k-го порядка находится как отношение суммы произведений k-х степеней отклонений вариант от постоянной величины A на частоты к сумме частот:
Если A=0, то моменты называются начальными, обозначаются и вычисляются по формуле:
Если за постоянную величину A взять среднюю , то моменты называются центральными, обозначаются µk и рассчитываются по формуле:
4. Мода и медиана
Эти понятия тоже вводятся как для генеральной, так и для выборочной совокупности, и определения мы сформулируем в общем виде.
Мода дискретного вариационного ряда – это варианта с максимальной частотой. Моду легко отыскать по таблице, и ещё легче на полигоне частот – это абсцисса самой высокой точки: |
Рисунок 2 – Мода дискретного вариационного ряда |
Медиана вариационного ряда – это значение, которая делит его на две равные части (по количеству вариант).
Для нахождения медианы сортируем варианты по возрастанию или убыванию и находим середину ранжированного ряда.
– если совокупность содержит нечётное количество чисел (наш случай), то делим её объём пополам: и округляем полученное значение в большую сторону;
– если совокупность содержит чётное количество чисел, например 20, то медианное значение здесь рассчитывается как среднее арифметическое двух центральных чисел: