- •Математическая статистика для психологов
- •Предмет и содержание курса, взаимосвязь курса со смежными дисциплинами, его значимость для профессиональной подготовки выпускников
- •Стохастичность и вероятность Стохастический характер реальности
- •Современное философское понимание вероятности
- •Роль математики в развитии понятия о вероятности
- •Вероятность как мера случайности
- •Предмет теории вероятностей
- •Определения понятия вероятности
- •Случайные события
- •Классическое определение вероятности
- •Геометрическое определение вероятности
- •Статистическое определение вероятности
- •Субъективная вероятность
- •Алгебра случайных событий
- •Аксиомы алгебры случайных событий
- •Отношения между случайными событиями
- •Простейшие свойства вероятности, помогающие их вычислять
- •Условная вероятность, независимые события и формула умножения вероятностей
- •Формула сложения вероятностей
- •Случайные величины Понятие функции в математике
- •Понятие случайной величины
- •Типы случайных величин
- •Закон распределения случайной величины
- •Ряд распределения дискретной случайной величины
- •Функция распределения случайной величины и её свойства
- •Плотность распределения вероятностей случайной величины
- •Математическое ожидание случайной величины и его свойства
- •Математическое ожидание дискретной случайной величины с конечным числом значений
- •Математическое ожидание дискретной случайной величины с бесконечным числом значений
- •Математическое ожидание непрерывной случайной величины
- •Свойства математического ожидания
- •Дисперсия случайной величины и его свойства
- •Свойства дисперсии
- •Другие характеристики центральных тенденций и изменчивости распределений случайных величин
- •Медиана
- •Квантили
- •Характеристики формы распределения случайной величины Понятие моментов случайной величины и z-оценки
- •Коэффициент асимметрии случайной величины
- •Эксцесс случайной величины
- •Совместные распределения случайных величин
- •Ряд распределения двумерной дискретной случайной величины
- •Плотность распределения для двумерной непрерывной случайной величины
- •Зависимые и независимые случайные величины
- •Понятие ковариации двух случайных величин и его свойства
- •Коэффициент корреляции двух случайных величин и его свойства
- •Законы больших чисел
- •Сходимость по вероятности
- •Неравенства Чебышева
- •Теорема Бернулли
- •Центральная предельная теорема
- •Понятие нормального распределения
- •Стандартное нормальное распределение
- •Правило трёх сигм
- •Нормальное распределение в реальном мире
- •Функция Лапласа
- •Вероятность попадания значения нормальной случайной величины в заданный промежуток
- •Вероятность отклонения значения нормальной случайной величины от математического ожидания
- •Прикладная статистика в психологии Происхождение и история статистики
- •Современное понимание статистики
- •Общее представление о прикладной статистике
- •Основные разделы прикладной статистики
- •Прикладная статистика как способ проверки вероятностных моделей
- •Специфика использования прикладной статистики в психологии
- •Стандарты обработки данных, нормативы представления результатов анализа данных в научной психологии
- •Шкалы измерений, связи и зависимости Научное знание и задачи науки
- •Моделирование в науке
- •Признаки и переменные
- •Понятие измерения в современной науке
- •Мера, метрика, показатель
- •Шкалы измерений, типы данных и переменных
- •Графическое представление данных
- •Зависимые и независимые переменные. Связи и зависимости: причинная и функциональная.
- •Понятие анализа данных, его цели и задачи. Связь анализа данных со статистикой
- •Описательная статистика Понятие описательной статистики
- •Ряд распределения
- •Полигон частот. Выборочная функция распределения и гистограмма.
- •Средние характеристики и характеристики рассеяния рядов распределений
- •Аналитическая статистика Понятие аналитической статистики, её составляющие
- •Выборочный метод в прикладной статистике Выборка как модель генеральной совокупности. Цели и задачи выборочного метода.
- •Статистическое понимание случайной выборки
- •Основные этапы формирования выборки
- •Единица отбора выборки
- •Определение объема выборки
- •Типы выборки и методы отбора Многоступенчатая и одноступенчатая выборки
- •Случайные и неслучайные выборки
- •Выборки для психологических исследований
- •Эмпирическая функция распределения и её свойства
- •Статистические оценки параметров генеральной совокупности
- •Параметры генеральной совокупности и выборочные статистики
- •Понятие точечной оценки и её свойства
- •Выборочное среднее как статистическая оценка среднего в генеральной совокупности
- •Статистическая оценка генеральной дисперсии
- •Статистическая оценка вероятности или генеральной доли
- •Понятие интервальной оценки
- •Доверительный интервал и доверительная вероятность
- •Основные задачи интервального оценивания
- •Доверительный интервал для математического ожидания при известном стандартном квадратичном отклонении
- •Доверительный интервал для математического ожидания при неизвестном стандартном квадратичном отклонении
- •Доверительный интервал для генеральной доли
- •Проверка статистических гипотез Понятие статистической проверки гипотез, её цели, задачи и основные понятия
- •Статистический критерий для проверки статистической гипотезы
- •Критическая область критерия: односторонняя и двусторонняя
- •Основной принцип проверки статистической гипотезы
- •Этапы проверки статистических гипотез, минимальный уровень значимости
- •Проверка статистической гипотезы о среднем
- •Проверка статистической гипотезы о равенстве средних
- •Проверка статистической гипотезы о генеральной доле
- •Проверка статистической гипотезы о равенстве долей или вероятностей
- •Программное обеспечение прикладной статистики Информационные технологии расчётов в электронных таблицах (пример - Microsoft Excel)
- •Статистические функции и их использование в Microsoft Excel
- •Построение диаграмм и графиков в Microsoft Excel
- •Информационные технологии статистической обработки данных
Шкалы измерений, типы данных и переменных
Переменные различаются тем, как много измеряемой информации они содержат. Объём этой информации определяется выбранной шкалой измерения.
Шкала – это совокупность числовых значений какого-то признака, в которой введена единица измерения, направление возрастания или убывания и начало отсчета. Каждая шкала, как правило, применяется ко многим признакам и переменным. Шкала является инструментом измерения признаков или свойств тех или иных объектов. Каждая шкала предполагает наличие определенных правил её использования, например установление соответствия между числами и признаками или свойствами эмпирических объектов, преобразований шкал, т.е. приданию иных значений числовых выражений этих признаков и свойств, методов вычислений с числовыми значениями шкал. Шкалы могут объединяться в группы, которые имеют одинаковую форму и сходные правила использования.
Различают следующие типы шкал:
Номинальная (номинативная) шкала.
Порядковая (ординальная) или ранговая шкала.
Интервальная шкала.
Шкала отношений (шкала отношений или равных отношений).
Первые два вида шкал называются неметрическими, а последние два – метрическими шкалами.
Эти четыре шкалы измерения принадлежат к трем типам данных: качественные, порядковые и количественные. Данные – это информация, предназначенная для обработки с применением процедур, основанных на алгоритмах. Данные в ходе обработки нередко классифицируются, разбиваются на категории или преобразуются. Типы измеряемых данных определяют допустимые для данной шкалы математические преобразования, а также типы отношений, отображаемых соответствующей шкалой.
В номинальных шкалах нет ни единиц, ни направлений, а в порядковых – единиц. Но такие совокупности данных тоже включаются в типологию шкал для обеспечения единообразия изложения: от номинальной шкалы до шкалы отношений в каждом типе будут появляться те или иные дополнительные их свойства.
Номинальные переменные используются только для качественной классификации. Это означает, что данные переменные могут быть измерены только в терминах принадлежности к некоторым, существенно различным классам. Эти классы не могут быть упорядочены по увеличению или уменьшению интенсивности какого-то качества, например, лучше или хуже, больше или меньше. Типичные примеры номинальных переменных – пол, национальность, цвет, группа крови, город и т.д. Номинальные переменные – наблюдение, классифицированные в одну из целого ряда взаимоисключающих категорий. Например, человек может иметь лишь одну из четырех групп крови (I, II, III, IV). При этом установить, как группа крови лучше или какой пол у людей лучше – невозможно. Хотя обычно можно определить и группу крови и какому полу принадлежит человеческий индивид, а различать индивидов разного пола или с разными группами крови по их социальному статусу запрещают современные нормы прав человека. Часто номинальные переменные называют категориальными. Никакие арифметические операции с номинальными переменными невозможны, их можно только сравнивать на совпадение.
Порядковые переменные позволяют ранжировать (упорядочить) объекты, указав какие из них в большей или меньшей степени обладают качеством, выраженным данной переменной. На порядковой шкале значения переменных можно сравнивать только по порядку: какое больше или меньше, выше или ниже. Никакие другие сравнения невозможны. В частности, нельзя сказать «на сколько больше» или «на сколько меньше» одно значение другого. Порядковые переменные иногда также называют ординальными. Типичный пример порядковой переменной – социоэкономический статус семьи. Мы понимаем, что верхний средний уровень выше среднего уровня, однако сказать, что разница между ними равна, скажем, 18% мы не сможем. Другой пример – оценки на экзамене. Понятно, что высший балл – отлично, ниже – хорошо, ещё ниже – удовлетворительно. Но определить, например, насколько хорошо лучше, чем удовлетворительно невозможно. Никакие арифметические операции с номинальными переменными невозможны, их можно только сравнивать на совпадение или больше – меньше.
Интервальные переменные позволяют не только упорядочивать объекты измерения, но и численно выразить и сравнить различия между ними. Для значений по этой шкале вполне осмыслен вопрос насколько одно значение больше или меньше другого. Например, температура, измеренная в градусах Фаренгейта или Цельсия, образует интервальную шкалу. Можно не только сказать, что температура 40 градусов выше, чем температура 30 градусов, но и что увеличение температуры с 20 до 40 градусов вдвое больше увеличения температуры от 30 до 40 градусов. С интервальными переменными возможны операции сложения и вычитания, операции умножения и деления - невозможны.
Относительные переменные очень похожи на интервальные переменные. В дополнение ко всем свойствам переменных, измеренных в интервальной шкале, их характерной чертой является наличие определенной точки абсолютного нуля или точки отсчёта. Таким образом, для этих переменных являются обоснованными предложения типа: одно значение в два раза больше, чем другое. Типичными примерами шкал отношений являются измерения времени или пространства. Например, температура по Кельвину образует шкалу отношения, и можно не только утверждать, что температура 200 градусов выше, чем 100 градусов, но и что она вдвое выше. Интервальные шкалы (например, шкала Цельсия) не обладают данным свойством шкалы отношения. С относительными переменными возможны любые арифметические операции.
Правда, в большинстве статистических процедур не делается различия между свойствами интервальных шкал и шкал отношений. Это означает просто, что для интервальных шкал исследователи вводят условные точки отсчёта, которые фактически преобразуют интервальные переменные в относительные. Но для интервальных переменных такие точки отсчёта могут поменяться в других исследованиях, и тогда, например, пропорции значений таких переменных могут измениться. Это необходимо учитывать при интерпретации результатов анализа данных.
Сводная таблица характеристик типов шкал
Тип шкалы |
Отношения между шкальными значениями |
Допустимые преобразования шкалы |
Допустимые статистические расчеты |
Наличие нуля и единиц измерения |
Номинальная шкала |
отношения неравенства, различия |
установление взаимооднозначных соответствий |
процент, доля, мода |
нет нуля, нет единиц измерения |
Порядковая шкала |
есть иерархия признаков, сравнение, отношение неравенства. Больше, меньше, равно, не равно. |
сохранение порядка |
процент, доля, мода, медиана |
нет нуля, нет единиц измерения |
Интервальная шкала |
равенство, неравенство, больше, меньше, больше на, меньше на. Отношения между интервалами. |
можно менять единицу измерения и условный ноль |
процент, доля. мода, медиана, среднее арифметическое, дисперсия, среднеквадратическое отклонение |
условный ноль, есть единицы измерения |
Шкала отношений |
равенство, неравенство, больше, меньше, больше на, меньше на, больше в..., меньше в.... |
можно менять единицы измерения, ноль переносить нельзя |
процент, доля. мода, медиана, среднее арифметическое, дисперсия, среднеквадратическое отклонение |
абсолютный ноль, есть единицы измерения |
Таблицы данных
Результаты сбора данных располагаются обычно в таблицах данных. В современной науке существует стандарт отображения данных в таблицах, который позволяет легко обрабатывать эти табличные данные с помощью практически любых статистических программ.
Таблица является весьма рациональной, наглядной и компактной формой представления результатов измерения тех или иных признаков, выраженных в соответствующих значениях переменных.
Таблица должна иметь заголовок, который показывает, какая информация располагается в ней. В самой таблице по столбцам располагаются наименования переменных, а по строкам – номера или много реже наименования объектов, признаки которых были измерены в переменных. Для использования методов современной прикладной статистики для целей анализа данных предпочтительно все результаты измерений признаков выражать в числовом виде. Тогда каждая номинальная или ранговая переменная получает коды значений соответствующего признака, которые часто имеют и словесное объяснение.
Примеры.
Список учебной группы (номинальная переменная):
Иванов
Петрова
Сидоров
Пол (номинальная переменная):
мужской
женский
Оценка на экзамене (ранговая переменная):
неудовлетворительно
удовлетворительно
хорошо
отлично
Рост в сантиметрах (относительная переменная).
Таблица данных оценок группы на экзамене может выглядеть так:
Оценки учебной группы на экзамене
№ по списку |
Пол |
Оценка |
Рост в см |
1 |
1 |
3 |
175 |
2 |
2 |
4 |
160 |
3 |
1 |
3 |
180 |
В таком виде оценки учебной группы могут быть подвергнуты статистическому анализу. В частности, можно проверить, нет ли зависимости оценки на экзамене от пола, нет ли связи пола и роста. Это довольно обычные вопросы социальных и экономических исследований.
