Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Лекции сокращен 14 час.doc
Скачиваний:
31
Добавлен:
02.09.2019
Размер:
1.78 Mб
Скачать

Оценка существенности связи. Принятие решений на основе уравнения регрессии

Поскольку анализ связи осуществляется в выборочных совокупностях, а данные затем распространяются на генеральную совокупность, то необходимо провести проверку значимости каждого коэффициента уравнения регрессии. Оценки значимости коэффициентов уравнения регрессии дают возможность распространить выводы по результатам выборки на генеральную совокупность. Найдя по эмпирическим данным параметры уравнения, определяют их среднюю ошибку µаi и с заданной вероятностью пределы, в которых могут находиться эти параметры.

Расчет ошибок параметров а , b, и с основан на использовании остаточного среднего квадратического отклонения, характеризующего расхождение между эмпирическими и теоретическими значениями результативного признака.

-остаточное среднее квадратическое отклонение, отображающее вариацию результативного признака y от всех прочих кроме x факторов. Где yi - результативный признак; - выровненные значения по уравнению регрессии;

где n-число единиц совокупности.

Средняя ошибка параметра а

,

а средняя ошибка параметров уравнения регрессии

где среднее квадратическое отклонение факторного признака хi от общей средней .

Рассчитав среднюю ошибку параметра и задавшись определенной вероятностью можно определить доверительные интервалы для каждого параметра как а(b,с) ± t*µa(b,c)

Значимость параметра проверяется путем сопоставления его значения со средней ошибкой.

По значению t в зависимости от объема исследуемой совокупности и судят о значении параметра. При n >30 параметры считаются значимыми, если ta(d,c)>3.

Критерии существенности (значимости) связи основываются на нормальном распределении признака в исследуемой совокупности.

При n30 значимость коэффициента регрессии осуществляется с помощью t-критерия Стьюдента

Для параметра а

Для параметра b, с

Параметр модели признается статистически значимым, если tрtкр(определяется по таблице Стьюдента при соответствующем числе степеней свободы и уровня значимости, число степеней свободы =n-2 где n - число единиц в совокупности.

Линейный коэффициент корреляции.

Более совершенным показателем степени тесноты связи является линейный коэффициент корреляции (r), который был предложен английским ученым К. Пирсоном.

При расчете этого показателя учитываются не только знаки отклонений индивидуальных значений признака от средней, но и сама величина таких отклонений, т.е. соответственно для факторного и результативного признаков определяют величины (xi, - ) и i - ).

Сравнению могут подлежать нормированные отклонения. Т.к. зачастую факторный и результативный признак имеют разные единицы измерения и не могут подлежать сравнению, то необходимо их перевести в относительные величины. Так, для факторного признака будем иметь совокупность величин

, а для результативного

Полученные нормированные отклонения можно сравнивать между собой. Для того чтобы получить обобщающую характеристику степени тесноты связи между признаками для всей совокупности, рассчитывают среднюю величину произведений нормированных отклонений. Полученная таким образом средняя и будет являться линейным коэффициентом корреляции (г):

Вычисление коэффициента корреляции по формуле (7.2) является достаточно трудоемкой операцией. Выполнив несложные преобразования, можно получить следующую формулу для расчета линейного коэффициента корреляции:

При пользовании этой формулой отпадает необходимость вычислять отклонения индивидуальных значений признаков от средней величины, что исключает ошибку в расчетах при округлении средних величин.

Сделав несложные математические преобразования (разделим на n) получим

Линейный коэффициент корреляции изменяется в пределах от -1 до +1. Чем ближе коэффициент корреляции по абсолютной величине к 1, тем теснее связь между признаками. Знак указывает на направление связи: прямой зависимости соответствует знак «плюс», а обратной зависимости — знак «минус».

Используем данные табл. 5 и рассчитаем линейный коэффициент корреляции:

, ,

, , тогда,

Полученная величина линейного коэффициента корреляции свидетельствует о возможном наличии достаточно тесной прямой зависимости между рассматриваемыми признаками.

Индекс линейной корреляции служит для характеристики степени тесноты связи при прямолинейной зависимости.

При криволинейной зависимости для характеристики степени тесноты связи используют теоретическое корреляционное отношение (индекс корреляции).

Поскольку на результативный признак помимо факторного признака оказывают влияние случайные факторы, то для оценки тесноты связи применяются следующие показатели вариации:

  1. общая дисперсия результативного признака , отображающая совокупное влияние всех факторов , где yi-значение результативного признака; - среднее значение результативного признака.

  2. Факторная дисперсия, отражает вариацию yi только от воздействия факторного признака x. где - среднее значение результативного признака. - выровненные значения результативного признака по уравнению регрессии.

  3. Остаточная дисперсия , отображающая вариацию результативного признака y от всех прочих кроме факторов. , где - выровненные значения результативного признака по уравнению регрессии; yi-значение результативного признака.

Соотношение между факторной и общей дисперсиями характеризует степень тесноты связи между признаками x и y

Показатель 2 называется индексом детерминации (причинности). На основе этого соотношения определяется индекс корреляции

На основе правила сложения дисперсий = + получают формулу индекса корреляции:

Для распространения выводов по результатам выборки на генеральную совокупность необходима оценка существенности(значимости) коэффициента регрессии.

Для оценки значимости коэффициента корреляции r применяется критерий Стьюдента t (для n30). Расчетная величина t-критерия или распределена по закону Стьюдента с (п - 2) степенями свободы.

Полученную величину t расч сравнивают с табличным значением t-критерия (число степеней свободы равно п- 2 и при соответствующем уровне значимости).

Если tрасчtk то величина коэффициента корреляции признается существенной, а это значит, что связь между признаками существует. Если tрасчtk , то полагают, что связь между признаками носит случайный характер.

Применим указанный метод к оценке существенности корреляции между уровнем затрат туристических фирм на рекламу и числом туристов, воспользовавшихся услугами фирм. При объеме выборки, равном 20, и при условии, что величина коэффициента корреляции равна 0,8105

=5,872

В таблице для числа степеней свободы к=n - 2 = 18 и уровня значимости 1% находим, что t = 2,878 (см. Приложение 4).

Т. о. можно считать с вероятностью 99%, что в генеральной совокупности действительно существует прямая зависимость между изучаемыми признаками.