- •Математическая статистика для психологов
- •Предмет и содержание курса, взаимосвязь курса со смежными дисциплинами, его значимость для профессиональной подготовки выпускников
- •Стохастичность и вероятность Стохастический характер реальности
- •Современное философское понимание вероятности
- •Роль математики в развитии понятия о вероятности
- •Вероятность как мера случайности
- •Предмет теории вероятностей
- •Определения понятия вероятности
- •Случайные события
- •Классическое определение вероятности
- •Геометрическое определение вероятности
- •Статистическое определение вероятности
- •Субъективная вероятность
- •Алгебра случайных событий
- •Аксиомы алгебры случайных событий
- •Отношения между случайными событиями
- •Простейшие свойства вероятности, помогающие их вычислять
- •Условная вероятность, независимые события и формула умножения вероятностей
- •Формула сложения вероятностей
- •Случайные величины Понятие функции в математике
- •Понятие случайной величины
- •Типы случайных величин
- •Закон распределения случайной величины
- •Ряд распределения дискретной случайной величины
- •Функция распределения случайной величины и её свойства
- •Плотность распределения вероятностей случайной величины
- •Математическое ожидание случайной величины и его свойства
- •Математическое ожидание дискретной случайной величины с конечным числом значений
- •Математическое ожидание дискретной случайной величины с бесконечным числом значений
- •Математическое ожидание непрерывной случайной величины
- •Свойства математического ожидания
- •Дисперсия случайной величины и его свойства
- •Свойства дисперсии
- •Другие характеристики центральных тенденций и изменчивости распределений случайных величин
- •Медиана
- •Квантили
- •Характеристики формы распределения случайной величины Понятие моментов случайной величины и z-оценки
- •Коэффициент асимметрии случайной величины
- •Эксцесс случайной величины
- •Совместные распределения случайных величин
- •Ряд распределения двумерной дискретной случайной величины
- •Плотность распределения для двумерной непрерывной случайной величины
- •Зависимые и независимые случайные величины
- •Понятие ковариации двух случайных величин и его свойства
- •Коэффициент корреляции двух случайных величин и его свойства
- •Законы больших чисел
- •Сходимость по вероятности
- •Неравенства Чебышева
- •Теорема Бернулли
- •Центральная предельная теорема
- •Понятие нормального распределения
- •Стандартное нормальное распределение
- •Правило трёх сигм
- •Нормальное распределение в реальном мире
- •Функция Лапласа
- •Вероятность попадания значения нормальной случайной величины в заданный промежуток
- •Вероятность отклонения значения нормальной случайной величины от математического ожидания
- •Прикладная статистика в психологии Происхождение и история статистики
- •Современное понимание статистики
- •Общее представление о прикладной статистике
- •Основные разделы прикладной статистики
- •Прикладная статистика как способ проверки вероятностных моделей
- •Специфика использования прикладной статистики в психологии
- •Стандарты обработки данных, нормативы представления результатов анализа данных в научной психологии
- •Шкалы измерений, связи и зависимости Научное знание и задачи науки
- •Моделирование в науке
- •Признаки и переменные
- •Понятие измерения в современной науке
- •Мера, метрика, показатель
- •Шкалы измерений, типы данных и переменных
- •Графическое представление данных
- •Зависимые и независимые переменные. Связи и зависимости: причинная и функциональная.
- •Понятие анализа данных, его цели и задачи. Связь анализа данных со статистикой
- •Описательная статистика Понятие описательной статистики
- •Ряд распределения
- •Полигон частот. Выборочная функция распределения и гистограмма.
- •Средние характеристики и характеристики рассеяния рядов распределений
- •Аналитическая статистика Понятие аналитической статистики, её составляющие
- •Выборочный метод в прикладной статистике Выборка как модель генеральной совокупности. Цели и задачи выборочного метода.
- •Статистическое понимание случайной выборки
- •Основные этапы формирования выборки
- •Единица отбора выборки
- •Определение объема выборки
- •Типы выборки и методы отбора Многоступенчатая и одноступенчатая выборки
- •Случайные и неслучайные выборки
- •Выборки для психологических исследований
- •Эмпирическая функция распределения и её свойства
- •Статистические оценки параметров генеральной совокупности
- •Параметры генеральной совокупности и выборочные статистики
- •Понятие точечной оценки и её свойства
- •Выборочное среднее как статистическая оценка среднего в генеральной совокупности
- •Статистическая оценка генеральной дисперсии
- •Статистическая оценка вероятности или генеральной доли
- •Понятие интервальной оценки
- •Доверительный интервал и доверительная вероятность
- •Основные задачи интервального оценивания
- •Доверительный интервал для математического ожидания при известном стандартном квадратичном отклонении
- •Доверительный интервал для математического ожидания при неизвестном стандартном квадратичном отклонении
- •Доверительный интервал для генеральной доли
- •Проверка статистических гипотез Понятие статистической проверки гипотез, её цели, задачи и основные понятия
- •Статистический критерий для проверки статистической гипотезы
- •Критическая область критерия: односторонняя и двусторонняя
- •Основной принцип проверки статистической гипотезы
- •Этапы проверки статистических гипотез, минимальный уровень значимости
- •Проверка статистической гипотезы о среднем
- •Проверка статистической гипотезы о равенстве средних
- •Проверка статистической гипотезы о генеральной доле
- •Проверка статистической гипотезы о равенстве долей или вероятностей
- •Программное обеспечение прикладной статистики Информационные технологии расчётов в электронных таблицах (пример - Microsoft Excel)
- •Статистические функции и их использование в Microsoft Excel
- •Построение диаграмм и графиков в Microsoft Excel
- •Информационные технологии статистической обработки данных
Графическое представление данных
Существует три основных метода графического представления данных – гистограмма (столбиковая диаграмма), полигон частот и сглаженная кривая (огива).
Гистограмма представляет последовательность столбцов, каждый из которых опирается на один интервал группирования данных, а высота столбца соответствует количеству элементов выборки, попавших в этот интервал группирования. Для построения гистограммы по горизонтальной оси откладываются границы интервалов группирования данных, а по вертикальной оси частоты попадания наблюдений в интервалах.
Пример. Построим гистограмму для частот в границах интервалов, заданных таблицей:
Границы интервалов |
Частоты |
40-50 |
2 |
50-60 |
4 |
60-70 |
5 |
70-80 |
8 |
80-90 |
7 |
90-100 |
7 |
100-110 |
4 |
110-120 |
1 |
Рисунок. Гистограмма частот в границах интервалов, заданных таблицей.
Интервалы для построения гистограммы, как правило, берутся равной длины, но это необязательно. Длина интервалов должна быть такой, чтобы каждый интервал оказался достаточно наполненным значениями случайной величины, а число интервалов не было слишком большим для наглядного представления распределения этой случайной величины на графике.
Полигон частот строится во многом, как и гистограмма, только в этом случае по горизонтальной оси откладываются значения середин интервалов сгруппированных данных, а по вертикальной оси – суммарные частоты по каждому интервалу, как и для гистограммы. После этого на координатной плоскости наносятся точки, первая координата каждой из которых соответствует середине интервала группирования, а вторая координата – суммарной частоте по этому интервалу. Для окончательного построения полигона частот эти точки соединяются отрезками прямых с получением кусочно-линейного графика. Этот кусочно-линейный график и является полигоном частот.
Полигон частот для предыдущего примера приведён на следующем рисунке.
Рисунок. Полигон частот для данных предыдущего примера.
Сглаженная кривая или огива иногда используется вместо гистограммы или полигона частот. Основное отличие огивы в том, что она проводится по точкам таким образом, чтобы график не имел острых углов или зубцов. Для ее построения по горизонтальной оси всегда откладываются значения от 0 до 100, они соответствуют частотам в процентах, а сами частоты являются накопленными. Поэтому огива не только гладкая кривая, но и представляющая неубывающую функцию.
Для построение огивы, как правило, по вертикальной, а не по горизонтальной оси откладываются границы интервалов группирования данных. После этого на координатной плоскости наносятся точки, вторая координата которой соответствует границе интервала, а первая координата – накопленной частоте попадания в этот интервал, выраженной в процентах. Для окончательного построения огивы нанесенные точки соединяются гладкой кривой.
В следующем примере в качестве исходных данных для построения огивы используется таблица, полученная после табулирования данных первого примера, но при этом второй столбец этой таблицы (частоты) преобразован в накопленные частоты, а затем третий - в проценты. И именно этот третий столбец используется для построения огивы.
Границы интервалов |
Частоты |
Накопленные частоты |
Накопленные частоты в процентах |
40-50 |
2 |
2 |
5 |
50-60 |
4 |
6 |
16 |
60-70 |
5 |
11 |
29 |
70-80 |
8 |
19 |
50 |
80-90 |
7 |
26 |
68 |
90-100 |
7 |
33 |
87 |
100-110 |
4 |
37 |
97 |
110-120 |
1 |
38 |
100 |
На рисунке ниже сначала показана огива для накопленных частот в процентах, а проценты отложены по оси абсцисс, горизонтальной. Видно, что огива представляет собой график возрастающей функции, потому что её значения только возрастают при движении по горизонтали слева направо.
Ниже на том же рисунке показана кривая, которая не может быть огивой, потому что не представляет график неубывающей функции, а только такой график возможен для отображения накопленных частот в процентах.
Ещё ниже на том же графике показаны варианты огив для результатов тестирования интеллекта по тесту IQ. Верхняя огива зелёного цвета соответствует ситуации, когда для невысоких значений IQ имеется довольно много индивидов, их получивших в тестировании, а для больших значений IQ таких индивидов оказалось меньше. В результате наглядно видно, что в данном тестировании оказалось больше нормы индивидов с невысокими значениями IQ.
Напротив, нижняя огива синего цвета соответствует ситуации, когда для невысоких значений IQ имеется довольно мало индивидов, их получивших в тестировании, а для больших значений IQ таких индивидов оказалось существенно больше. В результате наглядно видно, что в данном тестировании оказалось больше нормы индивидов с высокими значениями IQ.
Средняя огива красного цвета показывает ситуацию, когда доли индивидов, получивших в тестировании и невысокие, и высокие значения IQ примерно равномерно распределены по вертикальной оси координат. Ведь накопленные частоты растут примерно пропорционально росту величин IQ, т.е. доли получивших всё большие значения IQ примерно совпадают с долями, получивших меньшие значения IQ. Поэтому для такой ситуации можно считать, что в тестировании принимала участие группа индивидов, в которой было сбалансированное их число по долям имеющих как низкие, так и высокие значения IQ. В реальности такого практически никогда не бывает, потому что распределение результатов тестирования на IQ, как правило, бывает близко к нормальному для достаточно больших по размерам групп индивидов. Т.е. существенно больше индивидов имеют по результатам тестирования на IQ средние значения, а малые и большие имеют сравнительно небольшие доли индивидов.
Рисунок. Огива для первого примера, а также, какой огива не может быть, и какой она бывает для теста IQ.
