Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Psy_stat_bach_1.docx
Скачиваний:
0
Добавлен:
01.07.2025
Размер:
1.74 Mб
Скачать

Квантили

Кроме моды и медианы ряды распределений могут характеризоваться квантилями, понятие которых является обобщением понятия медианы. Квантили предназначены для более глубокого изучения структуры ряда распределения, потому что квантиль – это значение признака, занимающее определенное место в упорядоченной по данному признаку совокупности данных.

Более точно: «квантиль порядка p», который обозначается , и для которого 0<p<1, потому что p – это вероятность, – это значение случайной величины, для которого функция распределения принимает значение p или имеет место «скачок» со значения меньше p до значения больше p. Иначе говоря, «квантиль порядка p» - это такое значение аргумента функции распределения случайной величины, что . Поскольку по определению функции распределения , можно говорить, что такое значение случайной величины , для которого вероятность . Для непрерывных функций распределения, как правило, существует единственная квантиль порядка p, но бывают более сложные распределения, у которых можно обнаружить не одну такую квантиль. Эти более сложные распределения в настоящем курсе не изучаются.

Медиана является частным случаем квантиля, потому что , ведь оба эти значения определяют середину распределения: для медианы и дл квантиля .

Как правило, для характеристики распределений случайных величин, за исключением случая медианы, выбирают не один, а серию квантилей, расположенных на числовой оси на одинаковых расстояниях друг от друга. Наиболее употребительны для этих целей квартили, которые делят распределение на 4 части, децили, которые делят распределение на 10 частей, а также перцентили, которые делят распределение на 100 частей.

Для квартилей часто используют такие обозначения: , , , Квартиль используется крайне редко, потому что он просто характеризует всё распределение. А 1-й квартиль – это значение, ниже которого находится 25% совокупности. 2-й квартиль делит совокупность данным пополам (это совпадает с медианой), а 3-й квартиль отделяет 25% наибольших значений.

Для расчета квартилей в версиях Microsoft Excel до 2007 г. использовалась функция =КВАРТИЛЬ(массив;часть). Начиная с версии Microsoft Excel 2010, применяются две функции: =КВАРТИЛЬ.ВКЛ(массив;часть) и =КВАРТИЛЬ.ИСКЛ(массив;часть), дающие несколько различающиеся значения. При этом функция =КВАРТИЛЬ, использовавшаяся ранее соответствует, современной функции =КВАРТИЛЬ.ВКЛ. Для расчета квартилей в Microsoft Excel с помощью вышеприведенных формул массив данных можно не упорядочивать.

В анализе статистических данных нередко используется так называемый квартильный размах – это разница между 3-м и 1-м квартилями, т.е. . Эта величина позволяет оценить разброс 50% элементов в распределении случайной величины и не учитывать влияние экстремальных элементов. У квартильного размаха есть одно важное и полезное для анализа данных свойство: он является робастным, т.е. не зависит от аномальных отклонений, не зависит от выбросов данных.

Децили – это значения признака, которые ранжированный ряд распределения делят на 10 равных частей. Расчеты ведутся аналогично расчетам квартилей: , что означает выполнение соотношения . При этом децили не совпадают с квартилями, кроме второго или медианы, когда это совпадение есть: . Аналогично квартильному нередко используют децильный размах: . Децильный размах в распределении доходов населения показывает, например, долю тех, кто имеет средние доходы – не бедствует, но и не является очень богатым.

В некоторых случаях вместо децилей используют процентили. Перцентили – это значения признака, делящие ранжированный ряд распределения на 100 равных частей. Все вычисления аналогичны вычислениям децилей и квартилей: . Процентили позволяют вычислять как квартильный размах: , так и децильный размах: .

Нужно ли использовать квантили и какие именно, определяется, как правило, спецификой задачи анализа данных и опытом исследователя.

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]