Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
методичка ППД для СП.doc
Скачиваний:
165
Добавлен:
13.11.2019
Размер:
5.4 Mб
Скачать

Тема 31. Квантили

Цель:

  1. общее понятие квантиля

  2. процентили, децили и квартили

  3. определение процентилей.

1. Одним из наиболее эффективных методов описания группы наблюдений является описание с помощью квантилей. Квантиль (Лат: quantum - насколько возможно, quantillus - насколько возможно малый). – общее понятие, а процентиль, дециль, квартель, квинтель – его частные примеры.

Квантиль (этот термин был впервые использован Кендаллом в 1940 г.) – точка на числовой шкале, которая делит совокупность наблюдений на группы с соответствующими пропорциями в каждой из них. Квантили существуют у каждого распределения вероятностей. Для широко используемых в статистических исследованиях распределений они однозначно определены и представлены в таблицах, например, Большев Л.Н., Смирнов Н.В. Таблицы математической статистики; М., Изд. АН СССР, 1988, Большев Логин Николаевич - советский математик, 1922-1978, Смирнов Николай Васильевич, советский математик, 1900-1966. Они используются при решении многих статистических задач, например при проверке статистических гипотез, и при оценивании (параметров генеральных совокупностей) по выборочным данным. Квантили эмпирических распределений (выборочные, эмпирические квантили ) используются при решении некоторых задач в психологии и социологии.

2. Существует 99 процентилей (Р1, Р2, …. Р99), которые делят числовую прямую на 100 равных частей. Существует 9 децилей (D1, D2,…D9), которые делят числовую прямую на 10 равных частей. Существует 3 квартиля (Q1, Q2, Q3), которые делят числовую прямую на 4 равные части. Существует 4 квинтеля (К1, К2, К3, К4), которые делят числовую прямую на 5 равных частей.

Процентиль (этот термин был впервые использован Галтоном в 1885 г.) распределения - это такое число хp, что значения процентной части совокупности меньше или равны значению xp. Например, 25-я процентиль (также называемая квантилью 0.25 или нижней квартилью) переменной - это такое значение (xp), что 25% (p) значений переменной попадают ниже этого значения.

Аналогичным образом вычисляется 75-я процентиль (также называемая квантилью 0.75 или верхней квартилью) - такое значение, ниже которого попадают 75% значений переменной.

На рисунке 1 представлены взаимосвязи между различными квантилями, определенными выше. Квантили очень удобны для обобщения данных. Простое сообщение о том, что Р5 есть 10,75, а Р10–16,80, сразу же говорит нам о том, что 5% наблюдений меньше 10,75, а 10% из них лежит между 10,75 и 16,80.

Рисунок 1

В случае некоторых больших групп данных, с которыми обычно приходится иметь дело, можно представить себе общую совокупность наблюдений, если известны, к примеру, только величины трех или четырех процентилей. Однако чаще для описания данных используются более сложные обобщающие меры. К сожалению, квантили еще не нашли достаточно широкого применения, и исследователи пытаются просто описывать совокупность данных.

3. Определение процентилей.

Так как между квантилями существуют определенные взаимосвязи, приведенные на рис.1, то достаточно знать только как найти прцентили, что бы определить любые требующиеся квантили (как правило, никто никогда не желает разделить группу наблюдений более чем на 100 квантилей).

Определение процентиля является простым: Р-й прцентиль представляет собой точку, ниже которой лежит Р процентов оценок. Вычисление процентиля немного сложнее, чем определение, которым мы должы руководствоваться.

Перед началом вычисления любого процентиля в группе оценок надо упорядочить эти оценки по возрастанию. Для больших групп оценок это непроизводительно и удобнее использовать сгруппированные данные. Метод, который мы предлагаем для нахождения точки процентиля, общий и пригоден как для ранжированных, так и для сгруппированных оценок.

Преподаватель предложил 125 учащимся контрольное задание, состоящее из 40 вопросов. В качестве оценки теста выбиралось количество вопросов, на которые были получены правильные ответы. Негрупповое распределение частот 125 оценок теста приводится в таблице 1. Каков 25-ый процентиль в группе 125 оценок теста, то есть чему равна величина Р25? Р25 – это точка, ниже которой лежат 25: 125 оценок.

Таблица 1

Оценка в тесте

Частота

Накопленная частота

Вычисления

38

37

36

35

34

33

32

31

30

29│

28│ -----L

27

26

25

24

1

1

3

5

9

8

17

23

34

18│

10│

3

1

0

2

N=125

125

124

123

120

115

106

98

81

58

34│

16│ ---31.25

6

3

2

2

Шаг 1. pn= (p – индекс процентиля, n- количество испытуемых)

Шаг 2. Найти фактическую нижнюю границу разряда оценок, содержащего оценку 31,25.

L --- 28

0.5 - const

L=28 +0.5 = 28.5

Шаг 3. Определяем накопленную частоту f по нижней границе интервала, содержащем оценку 31,25 cumf=16

И после вычислется частота f

pn - cumf = 31,25-16 = 15,25

Шаг 4.

Результат третьего шага делим на f-верхняя граница в интервале содержащем оценку 31,25.

Шаг 5. Прибавить результат 4-ого шага к L

P25 = 28.5 + 0.85 = 29.35

Для закрепления материала студент может рассчитать P20 и Р80