- •Статистический анализ взаимосвязи социально-экономических явлений
- •Брянск издательство бгту
- •Карабан, л.А. Статистический анализ взаимосвязи социально-экономических явлений: учеб.- практ. Пособие / л.А. Карабан. – бгту, 2010. – 152 с. – (Сер. «Необъятная статистика»).
- •Предисловие
- •Введение
- •Раздел I. МетоДы изучения взаимосвязей в статистике
- •Глава 1. Теоретические основы исследования взаимосвязей социально-экономических явлений
- •Виды и формы взаимосвязи между явлениями
- •1.2. Общие понятия о стохастических, функциональных и корреляционных связях
- •1.4. Основные приемы изучения взаимосвязей
- •Глава 2. Теоретические основы Корреляционного анализа
- •2.2. Статистические методы изучения корреляционной связи
- •2.3. Измерение тесноты корреляционной связи
- •Рассмотрим использование парных коэффициентов корреляции для измерения многофакторной связи
- •2.5. Корреляционный анализ порядковых переменных или ранговая корреляция
- •Рассмотрим применение коэффициента корреляции рангов Спирмэна
- •Оценим возможности использования коэффициента корреляции рангов Кендэлла
- •Определим возможности применения коэффициента конкордации
- •2.6. Корреляция категоризированных (номинальных) переменных
- •Рассмотрим использование коэффициентов взаимной сопряженности
- •Глава 3. Дисперсионный анализ как метод установления тесноты связи между Явлениями
- •3.1. Общее понятие и цели дисперсионного анализа
- •3.2. Оценка существенности и достоверности связи. Многофакторный дисперсионный анализ
- •Глава 4. Проведение регрессионного анализа
- •4.1. Построение однофакторного уравнения регрессии
- •4.3. Построение и статистический анализ двухфакторной линейной модели (трехмерной регрессии)
- •4. 4. Экономическая интерпретация многофакторной регрессионной модели
- •Раздел II. Практическая реализация методов расчета показателей связи ______________________________________________
- •Глава 1. Использование средств microsoft excel для оценки взаимосвязей явлений
- •1.1.Технология решения задач корреляционного
- •Рассмотрим процедуру построения системы показателей и анализ матрицы коэффициентов парной корреляции.
- •Проведём обзор выбора вида моделей с оценкой их параметров
- •Рассмотрим порядок проведения проверки качества построенной модели
- •Рассмотрим практическую оценку влияния отдельных факторов на зависимую переменную в построенной модели регрессии.
- •Разберём вопрос использования многофакторных моделей для анализа и прогнозирования развития экономических систем.
- •Глава 2. Примеры решения типовых задач
- •2.1. Определение параметров уравнения регрессии
- •2.2. Вычисление линейного коэффициента корреляции
- •2. 3. Задачи для закрепления изученного материала
- •2.4. Задачи для самостоятельного выполнения
- •Правила ответа на письменный тест
- •Заключение
- •Список использованной и рекомендуемой литературы
- •Приложения приложение 1
- •Приложение 2
- •Приложение 3
- •Приложение 4
3.2. Оценка существенности и достоверности связи. Многофакторный дисперсионный анализ
Теперь перейдем к изучению оценки существенности корреляционного отношения с использованием уровня значимости.
Дисперсионный анализ позволяет не только определить роль случайной и систематической вариации в общей вариации, но и оценить достоверность вариации, обнаруженной методом аналитических группировок.
Определение достоверности вариации дает возможность с заданной степенью вероятности установить, вызвана ли межгрупповая вариация признаком, положенным в основание группировки, или она является результатом действия случайных причин. Для оценки существенности корреляционного отношения η2 при разных условиях вероятности или значимости α.
Уровень значимости – это достаточно малое значение вероятности, отвечающее событиям, которые в данных условиях исследования будут считаться указанием на неправильность начального предположения. Чаще всего пользуются уровнями α=0,05 или α=0,01. Критические значения корреляционного отношения содержатся в специальных таблицах.
В этих таблицах распределение η2 при случайных выборках зависит от числа степеней свободы факторной и случайной дисперсий. Число степеней свободы факторной дисперсии K1=m-1, где m-число групп, а для случайной дисперсии K2=n-m, где n-число вариант, m-число групп.
В примере №10 рабочие сгруппированы в две группы по числу обслуживаемых станков. Поэтому K1=m-1=2-1-1, а K2=n-m=10-2=8. По специальной таблице приложений можно найти критическое значение η2, соответствующее К1=1 и К2=8 для уровня значимости α=0,05, которое равно: . Это значит, что только в пяти случаях из 100 может случайно возникнуть корреляционное отношение, превышающее 0,399, а в 95 случаях из 100 корреляционное отношение не может быть больше 0,399.
Затем фактическое отношение корреляционного отношения надо сравнить с критическим, табличным. Если оно окажется больше критического, то связь между результативным и факторным признаками считается существенной, если же фактическое значение η2 меньше табличного, то связь между указанными признаками считается несущественной.
В рассматриваемом нами примере фактическое значение корреляционного отношения η2=0,931 больше табличного, которое составляет . Поэтому связь между числом обслуживаемых станков и выработкой является существенной.
При проверке существенности связи чаще пользуются критерием Фишера, потому что при больших числах степеней свободы его табличные значения мало изменяются в отличие от корреляционного отношения, которое требует более громоздких таблиц. Критерий Фишера представляет собой отношение межгрупповой дисперсии к средней из внутригрупповых дисперсий, исчисленных с учетом числа степеней свободы:
(44)
Для этих отношений Р. Фишер (отсюда название «критерий Фишера») составил таблицы, по которым можно определить, какая величина F при данном числе степей свободы по факторной вариации (К1) и остаточной вариации (К2) дает основание утверждать с определенной вероятностью (например, 0,95; 0,99), что положенный в основание группировки признак является существенным, или не дает такого основания, и, следовательно, группировочный признак является несущественным.
В нашем примере 10 …
, .
По правилу сложения вариаций
.
Исчислим критерий Фишера F
При уровне значимости α=0,05, К1=1 и К2=8 критическое, табличное значение F=5,32. Значит, уже при значении F=5,32 можно с вероятностью 0,95 утверждать, что группировочный признак (число обслуживаемых станков) является весьма существенным. В нашем примере он составляет F=108,1. Тем более есть основание считать, что полученные в результате группировки данные являются вполне достоверными.
Можно использовать другой способ расчёта. Зная корреляционное отношение, можно определить критерий Фишера по следующей формуле:
. (45)
Для примера 10…
Обычно используются две таблицы, позволяющие судить о предельно высокой величине показателя F при доверительных вероятностях 0,05 и 0,01 (5%-ный и 1%- уровень).
В таблице, где указана вероятность 0,05, приведены предельные теоретические значения F, которые только в 5 случаях из 100 (соответственно в другой таблице, где указана вероятность 0,01, только в одном случае из 100) могут достигать фактические значения F, если вариация всецело обусловлена только случайными причинами.
В таблице с доверительными вероятностями 0,01 соответствующие предельные теоретические значения F выше, чем в таблице с вероятностью 0,05, так как если принимается более высокая доверительная вероятность, то увеличивается и возможное предельное отношение F, обусловленное воздействием на вариацию только случайных факторов.
Табличные значения F используются как критерий для оценки фактических значений F, полученных в результате обработки статистического материала. Если Fфакт>Fтеор, то это значит, что очень мала вероятность того, что отношение оценочных дисперсий и, следовательно, вариация признаков обусловлена только случайными факторами. В этом случае есть основание утверждать, что между факторным группировочным признаком и результативным признаком существует взаимосвязь. Когда же Fфакт<Fтеор, это значит, что отношение оценочных дисперсий и вариация групповых средних факторного признака не выходят за пределы возможных случайных колебаний.
В таблице значений F в заголовках столбцов и строк указаны степени свободы вариации оценочных дисперсий. В заголовках столбцов приведены степени свободы для большей оценочной дисперсии, а в заголовках строк – для меньшей. На пересечении столбцов и строк, соответствующих степеням свободы сравниваемых оценочных дисперсий, и находится теоретическое значение F, отвечающее величине доверительной вероятности.
▼▼▼▼▼▼▼▼▼▼▼▼▼▼▼▼▼▼▼▼▼▼▼▼▼▼▼▼▼▼▼
│►11 . Предположим, что имеются 4 группы однотипных станков. Эти группы станков различаются между собой по времени производственной эксплуатации. Стоит задача выяснить, влияет ли в сложившихся условиях период эксплуатации станков на их работу.
Показателем, характеризующим работу станков, является выработка одноименных и чаще всего выпускаемых деталей на каждом станке.
Для исследования на основе случайного отбора приведены измерения выработки на пяти станках из каждой группы и получены следующие результаты:
на станках первой группы – 4, 7, 8, 10, 6 деталей в час;
второй группы – 9, 10, 10, 5, 6 деталей в час;
третьей группы – 9, 11, 8, 7, 10 деталей в час;
четвертой группы – 10, 5, 4, 6, 5 деталей в час.
Составим расчетную табл. 12.
Таблица 12
Расчетная таблица
Группа станков |
Выработка деталей в час х |
Суммы вариантов |
Групповые средние и общая средняя |
Отклонения групповых средних от средней общей |
Квадраты отклонений |
Отклонения вариантов от групповых средних |
Квадраты отклонений |
Первая |
4 7 8 10 6 |
35 |
7 |
-0,5 |
0,25 |
-3 0 1 3 -1 |
9 0 1 9 1 |
Вторая |
9 10 10 5 6 |
40 |
8 |
+0,5 |
0,25 |
1 2 2 -3 -2 |
1 4 4 9 4 |
Третья |
9 11 8 7 10 |
45 |
9 |
+1,5 |
2,25 |
0 2 -1 -2 1 |
0 4 1 4 1 |
Четвертая |
10 5 4 6 5 |
30 |
6 |
-1,5 |
2,25 |
4 -1 -2 0 -1 |
16 1 4 0 1 |
Суммы, средняя и девиация |
n=20 |
=150 |
=7,5 |
- |
D22=5 |
- |
D21=74 |
Следовательно, внутригрупповая девиация D21=74, межгрупповая девиация D22=5, а общая девиация D2= D21+ D22=74+5=79. Число степеней свободы для общей девиации n-1=20-1=19, для внутригрупповой девиации n-m=20-4=16, а для межгрупповой девиации m-1=4-1=3. Определим оценочные дисперсии:
Вследствие того, что девиация делится на различное число степеней свободы, то
Находим значение критерия F:
В соответствии с числом степеней свободы для S21, равным 16, и для S22, равным 3, в таблице для 5%-ного уровня распределения F на пересечении соответствующего столбца и строки находим значение этого показателя Fфакт=8,69, а для 1%-ного уровня распределения Fтеор=26,83.
Так как даже для доверительной вероятности 0,05 (5%-ный уровень) Fфакт<Fтеор, следует считать, что длительность эксплуатации станков в сложившихся условиях не влияет на работу станков, на их производительность. Нулевая гипотеза, т.е. то, что межгрупповая вариация производительности станков всецело обусловлена случайными факторами, остается не опровергнутой [8].
.
Об отсутствии связи между длительностью работы станков и их производительностью свидетельствует низкое значение корреляционного отношения. ◄
▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲
Следует отметить, что принципиальной разницы между многофакторным и однофакторным дисперсионным анализом нет. Многофакторный анализ не меняет общую логику дисперсионного анализа, а лишь несколько усложняет ее, поскольку, кроме учета влияния на зависимую переменную каждого из факторов по отдельности, следует оценивать и их совместное действие.
Таким образом, то новое, что вносит в анализ данных многофакторный дисперсионный анализ, касается в основном возможности оценки межфакторного взаимодействия.
Тем не менее, по-прежнему остается возможность оценивать влияние каждого фактора в отдельности. В этом смысле процедура многофакторного дисперсионного анализа (в варианте ее компьютерного использования), несомненно, более экономична, поскольку всего за один запуск решает сразу две задачи: оценивается влияние каждого из факторов и их взаимодействие.
Необходима оценка достоверности влияния не только каждого положенного в основание группировки фактора в отдельности, но и результата их взаимодействия.
Последний определяется как разность между эффектом совместного влияния двух группировочных признаков и суммой эффектов влияния каждого из этих факторных признаков, взятых в отдельности. Это осложняет расчеты суммы квадратов отклонений и числа степеней свободы вариации. Но сам принцип дисперсионного анализа, заключающийся в сопоставлении факторной дисперсии со случайной для оценки достоверности результатов статистической группировки, неизменен при любом числе признаков группировки.
В основе применения дисперсионного анализа лежит закон разложения дисперсий признака на составляющие. Общая вариация (D0) результативного признака при группировке может быть разложена на следующие составные части: на межгрупповую (Dм), связанную с группировочными признаками; и на остаточную (внутригрупповую Dв), не связанную с группировочным признаком.
Для проведения дисперсионного анализа необходимо установить источники варьирования признака, объем вариации по источникам; определить число степеней свободы для каждой компоненты вариации и дисперсии для каждой составляющей (межгрупповой и внутригрупповой).
РЕЗЮМЕ
Аналитические группировки и другие приёмы исследования при всей своей значимости не дают количественного выражения тесноты связи между признаками. Эта задача решается при помощи дисперсионного и корреляционного анализов.
Дисперсионный анализ позволяет оценить достоверность вариации, обнаруженной методом аналитических группировок и доказать существенность связей между признаками. В основе применения дисперсионного анализа лежит закон разложения дисперсий признака на составляющие.
Связь между общей, межгрупповой и внутригрупповой дисперсиями получила в статистке название закона сложения (разложения) вариации. Для проведения дисперсионного анализа необходимо установить источники варьирования признака, объем вариации по источникам; определить число степеней свободы для каждой компоненты вариации и дисперсии для каждой составляющей (межгрупповой и внутригрупповой).
Значимость определяют с помощью критерия Фишера, представляющего собой отношение межгрупповой дисперсии к средней из внутригрупповых дисперсий, исчисленных с учетом числа степеней свободы. Многофакторный анализ не меняет общую логику дисперсионного анализа, а лишь несколько усложняет ее, поскольку, кроме учета влияния на зависимую переменную каждого из факторов по отдельности, следует оценивать и их совместное действие.
.
В этой главе приведено:
▼
▲ |
|
-
Общие понятия и цели дисперсионного анализа.
-
Оценка существенности корреляционного отношения с использованием уровня значимости.
-
Проверка существенности связи с применением критерия Фишера.
|
|