- •Математическая статистика для психологов
- •Предмет и содержание курса, взаимосвязь курса со смежными дисциплинами, его значимость для профессиональной подготовки выпускников
- •Стохастичность и вероятность Стохастический характер реальности
- •Современное философское понимание вероятности
- •Роль математики в развитии понятия о вероятности
- •Вероятность как мера случайности
- •Предмет теории вероятностей
- •Определения понятия вероятности
- •Случайные события
- •Классическое определение вероятности
- •Геометрическое определение вероятности
- •Статистическое определение вероятности
- •Субъективная вероятность
- •Алгебра случайных событий
- •Аксиомы алгебры случайных событий
- •Отношения между случайными событиями
- •Простейшие свойства вероятности, помогающие их вычислять
- •Условная вероятность, независимые события и формула умножения вероятностей
- •Формула сложения вероятностей
- •Случайные величины Понятие функции в математике
- •Понятие случайной величины
- •Типы случайных величин
- •Закон распределения случайной величины
- •Ряд распределения дискретной случайной величины
- •Функция распределения случайной величины и её свойства
- •Плотность распределения вероятностей случайной величины
- •Математическое ожидание случайной величины и его свойства
- •Математическое ожидание дискретной случайной величины с конечным числом значений
- •Математическое ожидание дискретной случайной величины с бесконечным числом значений
- •Математическое ожидание непрерывной случайной величины
- •Свойства математического ожидания
- •Дисперсия случайной величины и его свойства
- •Свойства дисперсии
- •Другие характеристики центральных тенденций и изменчивости распределений случайных величин
- •Медиана
- •Квантили
- •Характеристики формы распределения случайной величины Понятие моментов случайной величины и z-оценки
- •Коэффициент асимметрии случайной величины
- •Эксцесс случайной величины
- •Совместные распределения случайных величин
- •Ряд распределения двумерной дискретной случайной величины
- •Плотность распределения для двумерной непрерывной случайной величины
- •Зависимые и независимые случайные величины
- •Понятие ковариации двух случайных величин и его свойства
- •Коэффициент корреляции двух случайных величин и его свойства
- •Законы больших чисел
- •Сходимость по вероятности
- •Неравенства Чебышева
- •Теорема Бернулли
- •Центральная предельная теорема
- •Понятие нормального распределения
- •Стандартное нормальное распределение
- •Правило трёх сигм
- •Нормальное распределение в реальном мире
- •Функция Лапласа
- •Вероятность попадания значения нормальной случайной величины в заданный промежуток
- •Вероятность отклонения значения нормальной случайной величины от математического ожидания
- •Прикладная статистика в психологии Происхождение и история статистики
- •Современное понимание статистики
- •Общее представление о прикладной статистике
- •Основные разделы прикладной статистики
- •Прикладная статистика как способ проверки вероятностных моделей
- •Специфика использования прикладной статистики в психологии
- •Стандарты обработки данных, нормативы представления результатов анализа данных в научной психологии
- •Шкалы измерений, связи и зависимости Научное знание и задачи науки
- •Моделирование в науке
- •Признаки и переменные
- •Понятие измерения в современной науке
- •Мера, метрика, показатель
- •Шкалы измерений, типы данных и переменных
- •Графическое представление данных
- •Зависимые и независимые переменные. Связи и зависимости: причинная и функциональная.
- •Понятие анализа данных, его цели и задачи. Связь анализа данных со статистикой
- •Описательная статистика Понятие описательной статистики
- •Ряд распределения
- •Полигон частот. Выборочная функция распределения и гистограмма.
- •Средние характеристики и характеристики рассеяния рядов распределений
- •Аналитическая статистика Понятие аналитической статистики, её составляющие
- •Выборочный метод в прикладной статистике Выборка как модель генеральной совокупности. Цели и задачи выборочного метода.
- •Статистическое понимание случайной выборки
- •Основные этапы формирования выборки
- •Единица отбора выборки
- •Определение объема выборки
- •Типы выборки и методы отбора Многоступенчатая и одноступенчатая выборки
- •Случайные и неслучайные выборки
- •Выборки для психологических исследований
- •Эмпирическая функция распределения и её свойства
- •Статистические оценки параметров генеральной совокупности
- •Параметры генеральной совокупности и выборочные статистики
- •Понятие точечной оценки и её свойства
- •Выборочное среднее как статистическая оценка среднего в генеральной совокупности
- •Статистическая оценка генеральной дисперсии
- •Статистическая оценка вероятности или генеральной доли
- •Понятие интервальной оценки
- •Доверительный интервал и доверительная вероятность
- •Основные задачи интервального оценивания
- •Доверительный интервал для математического ожидания при известном стандартном квадратичном отклонении
- •Доверительный интервал для математического ожидания при неизвестном стандартном квадратичном отклонении
- •Доверительный интервал для генеральной доли
- •Проверка статистических гипотез Понятие статистической проверки гипотез, её цели, задачи и основные понятия
- •Статистический критерий для проверки статистической гипотезы
- •Критическая область критерия: односторонняя и двусторонняя
- •Основной принцип проверки статистической гипотезы
- •Этапы проверки статистических гипотез, минимальный уровень значимости
- •Проверка статистической гипотезы о среднем
- •Проверка статистической гипотезы о равенстве средних
- •Проверка статистической гипотезы о генеральной доле
- •Проверка статистической гипотезы о равенстве долей или вероятностей
- •Программное обеспечение прикладной статистики Информационные технологии расчётов в электронных таблицах (пример - Microsoft Excel)
- •Статистические функции и их использование в Microsoft Excel
- •Построение диаграмм и графиков в Microsoft Excel
- •Информационные технологии статистической обработки данных
Понятие анализа данных, его цели и задачи. Связь анализа данных со статистикой
Анализ данных – это область математики и информатики, занимающаяся построением и исследованием наиболее общих математических методов и вычислительных алгоритмов извлечения знаний из экспериментальных (в широком смысле) данных.
Анализ данных – это изучение модели реальности, представленной в соответствующих данных. Данные – это информация, организованная, предназначенная для автоматической или автоматизированной обработки. Можно считать, что вся информация, введённая в компьютер, становится данными.
Целью анализа данных является построение, а потом анализ модели реальности. Анализ данных должен выявлять существенные закономерности реальности. Эти цели реализуются в задачах анализа данных: построение модели реальности, сбор данных, анализ модели по собранным данным, интерпретация результатов анализа, выводы и рекомендации. Под интерпретацией результатов анализа данных понимается приписывание содержательного смысла этим результатам. Этот процесс слабо формализуем, для его успеха необходим опыт исследователя и его развитая интуиция.
В анализе данных часто используется прикладная статистика, основанная на математической статистике. Особенно часто это происходит, когда данные представлены в числовом виде. Тогда анализ данных производится с таблицей данных, к которой можно применять разнообразные статистические процедуры.
Анализ данных, тем не менее, не сводится к применению статических процедур. Необходимость исследования больших массивов данных, не являющихся случайными выборками, - например, содержимого баз данных и данных в сети Интернет - привели к созданию других подходов, из которых в первую очередь следует отметить так называемый Data Mining (DM), что может быть переведено как "раскапывание данных" (в русскоязычной литературе термин обычно используется без перевода). DM в настоящее время несколько эклектичен по набору используемых методов и представляет собой скорее некоторую идеологию. Разницу между математической статистикой и DM можно проиллюстрировать следующим образом. Если типичной задачей математической статистики является задача "найти зависимость между заданными переменными", то для DM характерны задачи типа "найти переменные, между которыми существует достаточно хорошо выраженная зависимость". Связи и зависимости в данных в DM выявляются на основе применения разнообразных алгоритмов перебора вариантов, классификаций и других. DM находится в стадии интенсивного развития как в плане расширения арсенала используемых методов, так и углубления концепции. Это направление анализа данных можно реализовать только на современных компьютерах, и это направление изучается в цикле программистских дисциплин. В настоящем курсе это направление анализа данных не рассматривается.
Описательная статистика Понятие описательной статистики
Описательная статистика – это совокупность методов и способов сбора и суммирования количественных данных, используемая для превращения больших объёмов цифровых данных в форму, удобную для восприятия и обсуждения.
Описательная статистика позволяет обобщать первичные результаты, полученные при наблюдении или в эксперименте. Процедуры здесь сводятся к группировке данных по их значениям, построению распределения их частот, выявлению центральных тенденций распределения (например, средней арифметической) и, наконец, к оценке разброса данных по отношению к найденной центральной тенденции.
Описательная статистика нужна, как правило, для понимания характера совокупности, сырых данных. Включает в себя различные методы агрегирования данных. Общие из них таковы:
Частотный анализ
Анализ гистограммы
Подгонка распределения
Вычисление и анализ показателей центра распределения
Мода
Медиана
Среднее
Оценка разброса данных в совокупности
Стандартное отклонение
Дисперсия
Коэффициенты вариации
Расчет средних величин производится разными способами, и, соответственно, применение их тоже зависит от исследуемой совокупности.
