
- •. Основные понятия и определения математической статистики
- •Основными этапами статистического анализа данных являются:
- •Данные и их разновидности
- •Измерительные шкалы
- •Основные характеристики и примеры измерительных шкал
- •Генеральная совокупность и выборка
- •Статистическое распределение выборки
- •Описательный (дескриптивный) анализ
- •Структурирование, ввод и проверка данных.
- •Меры центральной тенденции
- •Выбор меры центральной тенденции в зависимости от типа измерительной шкалы
- •Меры изменчивости
- •Меры связи между признаками
- •Корреляция метрических переменных
- •Корреляция ранговых переменных
- •Статистические гипотезы
- •Статистические критерии
- •Процедура проверки статистических гипотез
- •Основные законы распределения
- •Нормальное распределение.
- •-Распределение
- •Распределение Стьюдента
- •Распределение Фишера,
- •Проверка гипотез о законе распределения
- •Критерий Колмогорова
. Основные понятия и определения математической статистики
Введение
Основной задачей математической статистики является разработка методов получения научно обоснованных выводов о массовых явлениях и процессах из данных наблюдений и экспериментов. Эти выводы и заключения относятся не к отдельным испытаниям, из повторения которых складывается данное массовое явление, а представляют собой утверждения об общих вероятностных характеристиках данного процесса, то есть о вероятностях, законах распределения, математических ожиданиях, дисперсиях и т. д. Такое использование фактических данных как раз и является отличительной чертой статистического метода.
В математической статистике рассматриваются две основные категории задач: оценивание и статистическая проверка гипотез.
Первая задача разделяется на точечное оценивание и интервальное оценивание параметров распределения. Например, может возникнуть необходимость по наблюдениям получить точечные оценки среднего значения и дисперсии. Если мы хотим получить некоторый интервал, с той или иной степенью достоверности содержащий истинное значение параметра, то это задача интервального оценивания.
Вторая задача – проверка гипотез – заключается в том, что мы делаем предположение о распределении вероятностей случайной величины (например, о значении одного или нескольких параметров функции распределения) и решаем, согласуются ли в некотором смысле эти значения параметров с полученными результатами наблюдений.
Статистические методы применяются при обработке материалов исследований для того, чтобы извлечь из тех количественных данных, которые получены в экспериментах, при опросе и наблюдениях, возможно больше полезной информации.
Математическую статистику условно делят на 3 части:
описательная статистика;
теория статистического вывода;
планирование и анализ эксперимента.
Описательная статистика занимается описанием, графическим представлением и табулированием совокупности исходных данных.
Теория статистического вывода – общий класс задач, характеризующийся попытками вывести свойства большого массива данных путем обследования небольшого массива данных, т.е. выборки.
Планирование и анализ эксперимента – статистические методы, разработанные для обнаружения и проверки причинной связи между изучаемыми переменными (показателями).
Основными этапами статистического анализа данных являются:
1 этап – исходный предварительный анализ исследуемой реальной системы. В результате этого этапа определяются:
основные цели исследования на содержательном неформализованном уровне;
совокупность единиц, представляющих предмет статистического исследования;
перечень отобранных из представленных специалистами априорных (независимых от опыта человека) показателей, характеризующих каждого из исследуемых объектов;
степень формализации соответствующих записей при сборе исходных данных;
общее время и трудозатраты на планируемые работы.
формализованная постановка задачи, по возможности включающая статистическую модель изучаемого явления.
2 этап – составление детального плана сбора исходной информации. При составлении этого плана необходимо по возможности учитывать полную схему дальнейшего статистического анализа.
3 этап – сбор исходного материала и ввод данных.
4 этап – первичная статистическая обработка данных. В ходе этой обработки решаются следующие задачи:
Отображение переменных, описанных текстом в номинальную или порядковую шкалу.
Анализ резко выделяющихся наблюдений.
Восстановление пропущенных наблюдений.
Проверка статистической независимости элементов исходной выборки.
5 этап – составление детального плана вычислительного анализа исходного материала. На этом этапе определяются основные группы, для которых будет проводиться дальнейший анализ. Обычно описывается блок-схема анализа с указанием привлекаемого метода.
6 этап – вычислительная реализация основной части статистической обработки данных.
7 этап – подведение итогов исследования. На этом этапе проверяется, в какой мере достигнуты сформулированные на 1 этапе содержательные цели работы. Если эти цели не достигнуты, то объясняется, почему. Работа завершается содержательной формулировкой новых задач, вытекающих из проведенного исследования.
Правильное применение статистики позволяет:
доказывать правильность и обоснованность используемых методических приемов и методов;
строго обосновывать экспериментальные планы; обобщать данные эксперимента;
находить зависимость между экспериментальными данными;
выявлять наличие существенных различий между группами испытуемых (например, экспериментальными и контрольными);
строить статистические предсказания;
избегать логических и содержательных ошибок и многое другое.
Нельзя забывать, что статистика – это инструментарий, помогающий эффективно исследователю в сложном экспериментальном материале. Наиболее важным в любом эксперименте является четкая постановка задачи, тщательное планирование эксперимента, построение не противоречивых гипотез.