- •Шкалы количественных признаков.
- •Лекция 3. Анализ динамики.
- •2 Таблицы.
- •Составляющие временного ряда.
- •Лекция 4. Формы графического изображения данных.
- •Лекция 6. Методы несплошного наблюдения.
- •Многомерный статистический анализ.
- •Синергетика.
- •Дисперсионный анализ.
- •Математические методы исследования текстов.
Дисперсионный анализ.
Используется для выявления влияния отдельных независимых друг от друга переменных или факторов на целевую переменную. Метод был предложен в 1920 г Фишером и состоит в сравнении между собой оценок дисперсии, целевой переменной, полученной при разных условиях. Предполагается, что имеются различные источники изменчивости целевой переменной У, которые порождают отдельные компоненты вариации значений У. Выделить их можно, разложив общую вариацию SS на составные части. Метод возник как метод клонирования эксперимента и используется для выявления различий между результатами непосредственных измерений, выполненных в меняющихся условиях.
Пример 1. Фотка. Представляем эти данные в виде таблицы. Фотка.
Наиболее благоприятные условия для применения дисперсионного анализа:
независимость факторов
Данные, представленные в отдельной ячейке, должны подчиняться нормальному закону распределения
Число наблюдений или объектов в ячейках должно быть одинаково
Дисперсия У в ячейках также должна быть одинакова
Общая вариация SS в соответствии с таблицей может быть разложена на компоненты, каждая из которых обусловлена определенным источником изменчивости ее значений. Число источников зависит от числа изучаемых факторов.
Фотка.
Во все жим разложения входят три группы компонентов.
Компоненты первой группы с одним индексом обусловлены главными эффектами факторов. В нашем примере SSa - это компонента изменчивости удовлетворенности работой, обусловленной только возрастом. Для ее вычисления сначала усредняют значения удовлетворенности по полу внутри ячеек, затем вычисляют SSa, на ее основе оценку дисперсии У при действии только фактора образования без учета остальных источников дисперсии.
Компоненты второй группы, обусловлены взаимодействиями факторов: SSab - это компонента вариации удовлетворенности работой обусловлены одновременным воздействием на У уровня образования и пола респондента. Также вычисляются последние значения в ячейках.
Компоненты третьей группы - остаточная вариация. Ее источником являются факторы, влияние которых обнаруживаются при анализе изменчивости признака У внутри ячейки. Эти факторы одинаково действуют на изменчивость в каждой ячейки.
Процедура анализа начинается с вычисления данных компонент. На их основе рассчитываются различные оценки дисперсии У. Число этих оценок равно числу источников дисперсии. Эти оценки называют средними квадратами. Вычисляются Японии делением значения соответствующей компоненты SS на отвечающие ей число степеней свободы.
Фотка. R - уровни фактора а, С - уровни фактора б, н - число наблюдений в ячейках, Н - общее число наблюдений.
Суждение о значимости влияния того или иного источника дисперсии выносится после сравнения двух оценок дисперсии отвечающий этому источнику и SS достаточному. Такое сравнение проводится на основе критериев Фишера. Для этого вычисляется значение отношения двух оценок.
Например, для выявления влияния фактора а на изменчивость признака У вычисляется величина Fa. Фотка.
Полученная величина сравнивается с табличным значением Ft, которая определяется однозначно при заданных степенях свободы и для заданного уровня значимости по специальным таблицам. Если Fa будет больше Ft, то влияние фактора а будет статистически значимым.
