Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Лекции сокращен 14 час.doc
Скачиваний:
31
Добавлен:
02.09.2019
Размер:
1.78 Mб
Скачать

Парная корреляция и построение однофакторной модели

При корреляционной зависимости изменяются средние значения результативного признака в зависимости от того, какие значения принимает факторная переменная. Но поскольку на результативный признак влияет несколько факторов, то проявление закономерности затемняется влиянием случайностей. При вычислении средних значений результативного признака мы частично пренебрегаем влиянием случайных факторов. При вычислении параметров теоретической линии связи, мы получаем однозначное изменение переменной у с изменением фактора х.

Теоретической линией регрессии называется линия, вокруг которой группируются точки корреляционного поля и которая указывает основное направление, основную тенденцию связи. Теоретическая линия регрессии линия должна быть проведена так, чтобы сумма отклонений точек поля корреляции от соответствующих точек теоретической линии регрессии равнялась нулю, а сумма квадратов этих отклонений была бы минимальной величиной.

Важным этапом регрессионного анализа является определение типа функции, с помощью которой характеризуется зависимость между признаками.

Необходимо провести содержательный анализ природы изучаемой зависимости и сделать выводы относительно направления связи, возможности его изменения в исследуемой совокупности.

Приблизительное представление о линии связи можно получить, используя графический метод.

Можно также использовать опыт предыдущих исследований, и там, где выбранные формы уравнений связи давали удовлетворительный результат, рекомендовать их использовать в дальнейшем.

Наиболее часто для характеристики связей экономических показателей используют следующие типы функций:

В нашем примере (зависимости числа туристов от затрат фирмы на рекламу) эмпирическая линия регрессии все же больше всего приближается к прямой и, следовательно, теоретическая линия регрессии может быть представлена уравнением вида:

(Данная запись читается как «игрек выровненный по x»)

Для нахождения параметров а и b уравнения регрессии используем метод наименьших квадратов. При применении метода наименьших квадратов, считается, что сумма квадратов отклонений эмпирических точек теоретической линии регрессии должна быть величиной минимальной:

Следовательно, применение метода наименьших квадратов для определения параметров а и b прямой, наиболее соответствующей эмпирическим данным, сводится к задаче на экстремум.

Функция двух переменных S(а, b) может достигнуть экстремума в том случае, когда первые частные производные этой функции равняются нулю, т.е. когда:

Вычисляя эти частные производные, получим

После несложных преобразований получим систему нормальных уравнений способа наименьших квадратов для определения величины параметров а и b уравнения прямолинейной корреляционной связи по эмпирическим данным:

(2)

Решая систему уравнений (2) относительно a и b, получим следующие формулы для определения этих параметров:

=(19050*2013-192310*199)/20*2013-1992=77960/659=118,3

=20*192310-199*19050/659=55250/659=83,84

Для определения коэффициентов a и b составим вспомогательную таблицу 5

Получим систему уравнений

Таблица 5

№ п/п

Затраты на рекламу (усл. ден. ед.) х

Кол-во туристов, воспользовавшихся услугами фирмы, чел. У

x*y

x^2

y регрессии

y регрессии по корреляционной таблице

у2

Итого 20

199

19050

192310

2013

19050,16

18754,97

18497700

В результате: а = 118,3; b = 83,84 и = 118,3+ 83,84x.

Параметр a – это свободный член уравнений регрессии, он определяет положение начальной точки линии регрессии в системе координат при х=0 y=а

Параметр b называется коэффициентом регрессии, является угловым коэффициентом линии регрессии и показывает, насколько изменяется в абсолютном значении результативный признак при изменении на единицу признака фактора х.

Если данные сгруппированы (например, представлены в виде корреляционной таблицы 4), то система нормальных уравнений имеет вид

где fx— частота повторения данного варианта значения у;

fy — частота повторения данного варианта значения х;

fxyчастота повторения данного сочетания значений х и у

Для нашего примера имеем:

Выражаем из первого уравнения системы показатель a, подставляем во второе уравнение системы

а=937,75-9,95b; 937,75-9,95b +10,12b=948,84; b=11,09/0,166=66,81;

а=937,75-9,95*66,81=273,02 и получаем

a=273,02; b=66,81

Уравнение регрессии будет иметь вид: =273,02 + 66,81x

Графическое изображение эмпирической и теоретической линии связи представлено на рис. 1.

Для нахождения параметров гиперболы =а+b/х по способу наименьших квадратов пользуются аналогичной прямолинейной зависимости системой нормальных уравнений, в которой х заменен на 1/х.

Для определения параметров параболы второго порядка =а+bх+сх2 в соответствии метода наименьших квадратов решается система, состоящая из трех нормальных уравнений:

Выбор теоретической формы корреляционной связи всегда несколько условен, так как в действительности зависимости между признаками лишь приблизительно соответствуют функциональным. Поэтому только при высокой тесноте связи между признаками линия регрессии имеет содержательный смысл и практическое значение.