
- •Конспект лекций По курсу «описательная статистика» для студентов 2 курса специальностей:
- •Введение
- •Основные понятия описательной статистики.
- •Основные этапы статистической обработки данных. Формы организации и виды статистического наблюдения.
- •Способы отбора выборки. Точность статистического наблюдения.
- •Раздел I. Одномерные статистические признаки
- •Табличное представление экспериментальных данных.
- •Тема. Графическое изображение статистических данных
- •Средние величины. Степенные средние.
- •Структурные (порядковые) характеристики.
- •Показатели вариации
- •Правило сложения дисперсий
- •Моменты распределения. Характеристики формы распределения
- •Раздел II. Статистическое изучение взаимосвязи между признаками
- •Измерение взаимной зависимости
- •Оба признака заданы в количественной шкале
- •Оба признака заданы в порядковой шкале
- •Оба признака заданы в номинальной шкале.
- •Регрессионная зависимость двух признаков
- •Множественная регрессия
- •Раздел III. Статистическое изучение динамики
- •Характеристики описания временных рядов.
- •Тренды во временных рядах.
Структурные (порядковые) характеристики.
Квантили – порядковые характеристики, т.е. значения признака занимающие определенное место в ранжированной совокупности.
Определение. Квантилем Qp порядка р, 0 < p <1, называется такое значение признака в упорядоченной совокупности, которое делит ее в отношении р:(1-р). Если совокупность объема n, то n1 = np, n2 = n(1-p), n = n1 + n2.
К числу наиболее часто применяемых квантилей относятся:
медиана (р=1/2), т.е. делит упорядоченную выборку на 2 равные части;
квартиль (р=1/4), т.е. делит упорядоченную выборку на 4 равные части;
квинтель (р=1/5), т.е. делит упорядоченную выборку на 5 равных частей;
децили (декатили) (р=1/10);
процентили (персентили, перцентили) (р=1/100).
Если имеется дискретная выборка значений Х = {x1, .., xn}, то их сначала надо упорядочить по возрастанию: x*1,..., x*n. Далее медиану находят по формуле:
Ме
=
Если рассматривается ИВР, то сначала находится интервал, содержащий медиану, а затем применяют формулу
или
,
где n – объем выборки; h – длина интервала ВР;
хМе – левая (нижняя) граница медианного интервала;
–
накопленная
относительная частота интервала,
предшествующего медианному;
– относительная
частота медианного интервала.
В случае ИВР аналогичным образом можно записать формулу для вычисления квантиля порядка р.
или
,
где n – объем выборки; h – длина интервала ВР;
хQp – левая (нижняя) граница квантильного интервала, порядка р;
– относительная
частота квантильного интервала;
–
накопленная
относительная частота интервала,
предшествующего квантильному.
Определение. Мода (Мо) – это значение признака, встречающееся в рассматриваемой совокупности наиболее часто.
Для дискретного ряда мода находится по определению и соответствует варианте с наибольшей частотой.
При определении моды обычно применяют следующие соглашения:
Если все значения ВР имеют одинаковую частоту, то говорят, что этот ряд не имеет моды.
Если две соседние варианты имеют одинаковую доминирующую частоту, то мода вычисляется как среднее арифметическое этих вариант.
Если две несоседние варианты имеют одинаковую доминирующую частоту, то такой ВР называют бимодальным.
Если таких вариант больше двух, то ВР называют полимодальным.
Для вычисления моды интервального вариационного ряда сначала необходимо найти модальный интервал. Если рассматривается ИВР с равными интервалами, то модальный интервал определяется по наибольшей частоте. Далее мода вычисляется по формуле:
,
(6)
n – объем выборки; h – длина интервала ВР;
хМо – левая (нижняя) граница модального интервала,
wМо – относительная частота модального интервала,
wМо-1 – относительная частота интервала, предшествующего модальному.
wМо+1 – относительная частота интервала, следующего за модальным.
Заметим, что в определении (6) вместо относительных частот можно использовать абсолютные:
.
Показатели вариации
Средние значения не дают полной информации о варьирующем признаке.
Определение. Вариацией называют различие значений признака у индивидуальных элементов изучаемой совокупности.
Для измерения величины вариации используют показатели вариации, которые подразделяются на две группы: абсолютные, относительные.
Абсолютные показатели вариации.
1. Абсолютный размах вариации: R = xmax – xmin.
Среднее линейное отклонение
.
Выборочная дисперсия
.
4. Стандартное
отклонение
(среднее
квадратическое отклонение):
.
Дисперсия и стандартное отклонение являются важнейшими и наиболее часто используемыми характеристиками рассеяния среди всех абсолютных показателей вариации.
5. Интерквартильный размах (интерквартильное отклонение) IR = q3 – q1
или средний квартильный размах q = (q3 – q1)/2.
Относительные показатели вариации.
Коэффициент вариации по :
.
Коэффициент осцилляции:
.
Линейный коэффициент вариации:
.
Иногда вместо среднего используют Ме.
Относительное квартильное расстояние:
.
Иногда вместо среднего используют Ме.
Коэффициент дифференциации:
.
Если рассматривается
интервальный вариационный ряд, то
необходимо сначала перейти к условному
дискретному ряду, т.е. найти срединные
значения интервалов
,
а затем вычислить коэффициенты вариации.