- •План работы
- •Вопросы к экзамену
- •Метрические шкалы измерения признаков.
- •Абсолютная и относительная частота и вероятность случайного события.
- •Совместные и несовместные случайные события. Вероятность суммы несовместных событий.
- •Зависимые и независимые случайные события. Вероятность произведения независимых случайных событий.
- •Дискретные и непрерывные случайные величины. Квантование.
- •§1. Дискретная случайная величина. Закон распределения вероятностей дискретной случайной величины
- •§2. Непрерывная случайная величина, способы ее задания
- •Гистограмма и полигон распределения случайной величины.
- •Меры центральной тенденции, (мода, медиана, среднее арифметическое).
- •Часть I. Основы измерения и количественного описания данных
- •Виды квантилей.
- •Характеристики рассеивания случайной величины (размах, дисперсия, стандартное отклонение, коэффициент вариации).
- •Асимметрия и эксцесс распределения случайной величины.
- •Свойства нормального распределения случайной величины.
- •Стандартное нормальное распределение. Стандартизация распределений.
- •Генеральная совокупность и выборка.
- •Основные способы формирования выборки.
- •Проверка выборки на наличие аномальных значений.
- •Основные правила стандартизации психодиагностических методик.
- •Шкала z-оценок. (???)
- •Шкалы, производные от шкалы z-оценок.
- •Шкала стенов.
Часть I. Основы измерения и количественного описания данных
еще одно важное свойство, не столь очевидное: сумма всех отклонений от среднего равна нулю:
£(*,.-Л/х) = 0. (4.4)
Соответственно, среднее отклонение от среднего также равно 0.
-
Виды квантилей.
090309-matmetody.txt
Разбиение числовой оси на равные интервалы называется квантованием, а полученные интервалы - интервалами квантования. Например, возраст - мы измеряем интервалом, равным одному году. Ряд различных психологических явлений мы измеряем квантованием.
Есть ещё некоторые показатели, которые так или иначе делят выборку.
Квантили - такие значения случайной величины, которые делят распределения на равные части. Их существует несколько видов.
1. Квартили - делят выборку на четыре равные части - по 25% на каждую часть.
2. Квинтили - делять выборку на 5 равных частей - по 20% на каждую часть.
3. Децили - делят выборку на 9 частей, то есть, девять децилей делят выборку на десять равных частей по 10% на каждую часть.
4. Процентили - 99 процентилей делят выборку на 100 равных частей по 1%. Процентили нельзя путать с процентами. Процентные показатели - это первичные показатели, которые определяют, например, количество правильно выполненных заданий. А процентиль - показатель производный, указывающий да долю от общего числа членов группы.
с. 36 (43)
Помимо мер центральной тенденции в психологии широко используются меры положения, которые называются квантилями распределения. Квантиль — это точка на числовой оси измеренного признака, которая делит всю совокупность упорядоченных измерений на две группы с известным соотношением их численности. С одним из квантилей мы уже знакомы — это медиана. Это значение признака, которое делит всю совокупность измерений на две группы с равной численностью. Кроме медианы часто используются про-центили и квартили.
Процентили (Percentiles) — это 99 точек — значений признака (Ри ..., Р99), которые делят упорядоченное (по возрастанию) множество наблюдений на 100 частей, равных по численности. Определение конкретного значения про-центиля аналогично определению медианы. Например, при определении 10-го процентиля, Р10, сначала все значения признака упорядочиваются по возрастанию. Затем отсчитывается 10% испытуемых, имеющих наименьшую выраженность признака. Р]а будет соответствовать тому значению признака, который отделяет эти 10% испытуемых от остальных 90%.
Квартили (Quartiles) — это 3 точки — значения признака (P2i, Pi0, P75), которые делят упорядоченное (по возрастанию) множество наблюдений на 4 равные по численности части. Первый квартиль соответствует 25-му проценти-лю, второй — 50-му процентилю или медиане, третий квартиль соответствует 75-му процентилю.
Процентили и квартили используются для определения частоты встречаемости тех или иных значений (или интервалов) измеренного признака или для выделения подгрупп и отдельных испытуемых, наиболее типичных или нетипичных для данного множества наблюдений.
-
Характеристики рассеивания случайной величины (размах, дисперсия, стандартное отклонение, коэффициент вариации).
090309-matmetody.txt
Характеристики рассеивания. К ним относятся:
1. Размах - это разность между максимальным и минимальным значением величины. (формула рис. 4 в тетради).
2. Дисперсия - характеризует разброс случайной величины вокруг среднего арифметического значения, то есть, насколько плотно значения случайной величины группируются вокруг среднего арифметического значения. Дисперсия обозначается буквой сигма и имеет квадратную размерность (формула на рис. 5 в тетради). Следует отличать теоретическую (генеральную) дисперсию и выборочную (эмпирическую). Первая формула указана для теоретической дисперсии (где просто N) для вычисления дисперсии во всей генеральной совокупности. Вторая формула - эмпирической дисперсии, которая и будет использоваться для вычислений (где N-1).
3. Стандартное отклонение (или среднеквадратическое) - положительная число квадратного корня из дисперсии. (рис 6)
4. Коэффициент вариаций - не имеет размерности и служит для сравнения вариативности, то есть, для изменчивости случайных величин, имеющих различную природу. Обозначается буквой V и считается по формуле (рис 7). Если коеффициент вариаций менее 40%, то говорят о низкой изменчивости признака.
с. 36 (44)
Меры центральной тенденции отражают уровень выраженности измеренного признака. Однако не менее важной характеристикой является выраженность индивидуальных различий испытуемых по измеренному признаку. Меры изменчивости (Dispersion) применяются в психологии для численного выражения величины межиндивидуальной вариации признака.
Наиболее простой и очевидной мерой изменчивости является размах, указывающий на диапазон изменчивости значений. Размах (Range) — это просто разность максимального и минимального значений:
Ясно, что это очень неустойчивая мера изменчивости, на которую влияют любые возможные «выбросы». Более устойчивыми являются разновидности размаха: размах от 10 до 90-го процентиля (Р90 — Р10) или междуквартильный размах (Р75 — P2s)- Последние две меры изменчивости находят свое применение для описания вариации в порядковых данных. А для метрических данных используется дисперсия — величина, название которой в науке является синонимом изменчивости.
Дисперсия (Variance) — мера изменчивости для метрических данных, пропорциональная сумме квадратов отклонений измеренных значений от их арифметического среднего:
Чем больше изменчивость в данных, тем больше отклонения значений от среднего, тем больше величина дисперсии. Величина дисперсии получается
при усреднении всех квадратов отклонении:
Следует отличать теоретическую (генеральную) дисперсию — меру изменчивости бесконечного числа измерений (в генеральной совокупности, популяции в целом) и эмпирическую, или выборочную, дисперсию — для реально измеренного множества значений признака. Выборочное значение в статистике используется для оценки дисперсии в генеральной совокупности. Выше указана формула для генеральной (теоретической) дисперсии (Dx), которая, понятно, не вычисляется. Для вычислений используется формула выборочной (эмпирической) дисперсии (Dx), отличающаяся знаменателем:
Стандартное отклонение (сигма, среднеквадратическое отклонение) - положительное значение квадратного корня из дисперсии:
Свойства дисперсии:
-
Если значения измеренного признака не отличаются друг от друга (рав ны между собой) — дисперсия равна нулю. Это соответствует отсутствию из менчивости в данных.
-
Прибавление одного и того же числа к каждому значению переменной не меняет дисперсию:
Прибавление константы к каждому значению переменной сдвигает график распределения этой переменной на эту константу (меняется среднее), но изменчивость (дисперсия) при этом остается неизменной.
3. Умножение каждого значения переменной на константу с изменяет дисперсию в с2 раз:
При объединении двух выборок с одинаковой дисперсией, но с разными средними значениями дисперсия увеличивается.