Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
labor3_new.doc
Скачиваний:
11
Добавлен:
30.08.2019
Размер:
1.15 Mб
Скачать

ТЮМЕНСКАЯ ГОСУДАРСТВЕННАЯ

СЕЛЬСКОХОЗЯЙСТВЕННАЯ АКАДЕМИЯ

ЛАБОРАТОРНЫЙ ПРАКТИКУМ

ПО

МАТЕМАТИЧЕСКОЙ

СТАТИСТИКЕ

методические указания

и варианты индивидуальных заданий

для выполнения расчётно-графических

работ

Часть 3

г. Тюмень 2007

Предисловие

В сборнике содержатся методические указания и варианты лабораторной работы по теме: Установление линейной корреляционной связи между двумя случайными величинами.

Методика сборника обеспечивает самостоятельное выполнение расчётно-графической работы.

Описание лабораторной работы включает краткие теоретические сведения и план выполнения работ; образец выполнения работы; контрольные вопросы; варианты заданий.

Лабораторный практикум содержит 50 вариантов и гарантирует индивидуальность его выполнения.

Рекомендуется для инженерных, экономических и сельскохозяйственных специальностей.

Лабораторная работа №3 Установление линейной корреляционной связи между двумя случайными величинами

Цель работы: привить навыки по анализу связи между двумя случайными величинами.

Содержание работы:

  1. Записать исходные данные в виде корреляционной таблицы.

  2. Предварительно оценить связи.

  3. Выполнить необходимые промежуточные расчеты.

  4. Вычислить выборочный коэффициент линейной корреляции, установить его значимость, силу и тесноту связи.

  5. Вычислить коэффициенты линейной регрессии. Записать уравнения регрессии.

  6. Дать содержательную и графическую интерпретацию корреляционного и регрессионного анализа.

Форма отчета:

1. Представление работы по указанному в методике образцу.

2. Самостоятельное изучение теоретического материала с помощью предлагаемых контрольных вопросов.

3. Устное собеседование по работе, сдача зачета.

§ 1.1. Краткие теоретические сведения

Взаимосвязь между случайными величинами изучается с помощью корреляционного анализа в том случае, если взаимодействие случайных величин нельзя изолировать от влияния большого числа посторонних факторов.

В основе корреляционного анализа лежит соотношение, существующее между значением одной случайной величины и средним значением другой.

Задача установления корреляционной связи распадается на две. Первая задача состоит в установлении формы корреляционной связи, т.е. в определении вида функции, связывающей значения одной случайной величины со средним значением другой. Вторая задача состоит в оценке силы (тесноты) корреляционной связи.

Если изучаются две случайные величины X и Y, заданные парами значений (xi , yi) причем такие, что связь между ними предположительно можно считать линейной, то первая задача решается путем составления линейных уравнений, называемых уравнениями линейной регрессии:

у = ах + b – уравнение линейной регрессии Y на X, где под y понимается среднее значения случайной величины Y.

Х = су + d – уравнение линейной регрессии X на Y, где под x понимается среднее значения случайной величины X.

Неизвестные коэффициенты находятся методом наименьших квадратов. В общем виде требования метода, например, для уравнения

у = ах + b,

состоят в минимизации функции

,

т. Е. в нахождении таких значений а и b, при которых

Решение второй задачи сводится к нахождению выборочного коэффициента линейной корреляции

где – среднее значение произведений значений случайных величин X, Y.

– среднее значение случайной величины X.

- среднее значение случайной величины Y.

- среднее квадратическое отклонение случайной величины Х.

- среднее квадратическое отклонение случайной величины Y.

Значения изменяются в пределах от -1 до 1. Чем ближе значение к единице, тем корреляционная связь теснее. Значения близкие к нулю свидетельствуют о слабой корреляционной связи.

Если =1, то анализируемая связь является функциональной, если =0, то корреляционная связь не существует, последнее, однако не означает отсутствия других видов связи.

Направление связи определяется по знаку . Если знак положителен, то связь между случайными величинами прямая, т.е. большему значению одной случайной величины соответствует большее значение другой. Если знак отрицателен, то связь обратная, т.е. большему значению одной случайной величины соответствует меньшее значение другой. Особо подчеркнем, что выборочный коэффициент линейной корреляции ( ) свидетельствует только о тесноте линейной корреляционной связи но не говорит как конкретно зависит одна случайная величина от другой. Зависимость устанавливается с помощью уравнения линейной регрессии.

Учитывая, что в работе необходимо решить обе задачи, т.е. установить не только форму связи, но и измерить тесноту этой связи, уравнения линейной регрессии целесообразно искать в следующем виде:

и

где - коэффициент линейной регрессии Y на X,

- коэффициент линейной регрессии X на Y,

Коэффициенты линейной регрессии выражаются через выборочный коэффициент линейной корреляции с помощью формул:

,

Решение обеих задач корреляционного анализа осуществляется на ограниченном числе наблюдений по выборочным из генеральной совокупности данным, поэтому естественно, что вычисляемые характеристики отличаются от аналогичных характеристик генеральной совокупности.

Если выборочный коэффициент линейной корреляции не равен нулю( ), то еще нельзя заключить, что и коэффициент линейной корреляции генеральной совокупности также не равен нулю( ). Возможно, что значение получилось случайно, поэтому необходимо убедиться в том, что вычисленное значение неслучайно, что оно действительно отличается от нуля на значимую величину, и это значение можно перенести на .

Проверка этой гипотезы осуществляется по t критерию, путем сравнения наблюдаемого значения случайной величины с критическим значением , берущимся из таблиц распределения критических точек Стьюдента (σГ - стандартное отклонение rв).

Подобные рассуждения о значимости в случае необходимости можно провести и относительно вычисленных по выборочным данным значений коэффициентов линейной регрессии ρy/x и ρx/y

Отметим, что если форма связи между двумя случайными величинами более сложная, то иногда с помощью специальной замены от нелинейных связей можно перейти к линейным, т.е. провести линеаризацию.

1. Если связь типа гиперболической , то замена

приводит к линейной связи

2. Если связь типа показательной то замена ln у = у',

a'0=ln a0

приводит к линейной связи у' = а'о + a1x

3. Если связь типа

степенной у' = a0xa

то замена ln у = у', ln x = x', ln a0 = a'0

приводит к линейной связи у'= а'о + a1x'

4. Если связь типа логарифмической

у = ао + a1 ln x, то замена ln x = x' приводит к линейной связи

у' = ао + a1x'

Итак, корреляционный анализ количественно оценивает связь между двумя (или нескольким) случайными величинами. Его применение позволяет определить наличие и силу связи. Регрессионный анализ позволяет установить как в среднем изменяется результативный признак под влиянием одного или нескольких факторов.

По составленному уравнению линейной регрессии можно находить значение одной случайной величины в зависимости от значения другой, не заданной в таблице, если значение последней соответствует тем же условиям, при которых было составлено уравнение. Это позволяет с помощью уравнений линейной регрессии производить недолгосрочное планирование и прогноз.

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]