Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Kovalchuk_V_M_Vysshaya_matematika_Chast_3_Teor....docx
Скачиваний:
30
Добавлен:
20.11.2019
Размер:
2.03 Mб
Скачать

Свойства выборочного (статистического) коэффициента корреляции

Для оценки тесноты связи между переменными и по выборочным значениям используют статистический коэффициент корреляции :

.

Если данные не сгруппированы в виде корреляционной таблицы и представляют пар чисел , то для вычисления коэффициента корреляции проводят по следующей формуле:

.

Между коэффициентом корреляции и коэффициентами регрессии и существует связь: , , .

Основные свойства коэффициента корреляции (при достаточно большом объеме выборке ):

  1. Коэффициент корреляции лежит в пределах: ;

  2. Если все значения переменных увеличить (уменьшить) на одно и то же число или в одно и то же число раз, по величина коэффициента корреляции не изменится.

  3. При корреляционная связь представляет линейную функциональную зависимость.

  4. При корреляционная линейная связь отсутствует.

При оценке тесноты связи между переменными и по выборочному коэффициенту корреляции необходимо проверить значимость этого коэффициента, т.е. установить достаточна ли его величина для обоснования вывода о наличии корреляционной связи. Для этого необходимо проверить нулевую гипотезу : - коэффициент корреляции между генеральными совокупностями и равен нулю. При справедливости этой гипотезы статистика (критерий)

Имеет - распределение Стьюдента с степенями свободы. При заданном уровне значимости и степени свободы находим по таблицам закона распределения Стьюдента критическое значение . Если , то нулевая гипотеза об отсутствии корреляционной связи между переменными и отвергается и переменные считаются зависимыми. При нет оснований отвергать нулевую гипотезу. Значимость коэффициента корреляции свидетельствует и о значимости коэффициентов регрессии, соответственно и о значимости линейного уравнения регрессии.

Понятие о нелинейной регрессии, индекс корреляции и коэффициент детерминации

В экономических приложениях часто возникает необходимость выражать корреляционную зависимость в виде нелинейных уравнений регрессии, поскольку линейные зависимости приводят к большим ошибкам. Выбор вида нелинейной регрессии называется спецификацией или этапом параметризации модели и осуществляется методами визуального оценивания точек корреляционного поля, анализа сути наблюдаемых экономических процессов и т.п. Наиболее часто в экономических исследованиях используют следующие виды нелинейной регрессии:

  • Полиноминальная ;

  • Гиперболическая ;

  • Степенное и т.п.

Для определения неизвестных параметров выбранного уравнения регрессии используется метод наименьших квадратов.

При нелинейной регрессии для оценки тесноты связи между переменными используют не коэффициент корреляции , а индекс корреляции и коэффициент детерминации .

Индекс корреляции по вычисляется по формуле:

,

где - межгрупповая дисперсия, выражающая ту часть вариации переменной , которая обусловлена изменчивостью переменной или регрессией и вычисляемая по формуле:

;

- общая дисперсия переменной:

Коэффициент детерминации, равный квадрату индекса корреляции, показывает долю общей вариации зависимой переменной, обусловленной регрессией или изменчивостью объясняющей переменной:

.

Чем ближе к единице, тем теснее наблюдения примыкают к линии регрессии, тем лучше регрессия описывает зависимость переменных.

При парной линейной регрессии индекс корреляции равен коэффициенту корреляции по абсолютному значению: .

Табличный процессор Excel так же позволяет проводит автоматизированный корреляционно- регрессионный анализ. Для этого в опции Сервис находим пакет анализа данных (см. рис.)

Тесты для самоконтроля:

  1. К оценкам генеральной совокупности предъявляются следующие требования:

  • Оценка должна быть стационарной, эргодичной и эффективной;

  • Оценка должна быть состоятельной, эргодичной и эффективной;

  • Оценка должна быть состоятельной, стационарной и эргодичной ;

  • Оценка должна быть состоятельной, эффективной и несмещенной;

  • Оценка должна быть несмещенной, стационарной и эффективной;

  1. Статистической гипотезой называют:

  • Предположение относительно параметров и вида закона распределения генеральной совокупности;

  • Предположение относительно объема генеральной совокупности;

  • Предположение относительно параметров и вида закона распределения выборки;

  • Предположение относительно объема выборочной совокупности;

  • Предположение относительно статистического критерия ;

  1. При проверки статистической гипотезы ошибка первого рода это:

  • Принятие в действительности неверной гипотезы;

  • Отвержение в действительности правильной гипотезы;

  • Принятие в действительности правильной гипотезы;

  • Отвержение в действительности неправильной гипотезы;

  1. В критерии Колмогорова за меру качества согласия эмпирического и теоретического распределения принимается:

  • Относительное расхождение между теоретической и эмпирической частотами попадания случайной величины в интервал;

  • Максимальное расхождение по модулю между теоретической и эмпирической частотами попадания случайной величины в интервал;

  • Среднее квадратичное отклонение между теоретической и эмпирической частотами попадания случайной величины в интервал;

  • Максимальное расхождение модуля разности между эмпирической и теоретической функциями распределения;

  • Максимальное расхождение модуля разности между эмпирической и теоретической функциями плотности распределения;

  1. Дисперсионный анализ позволяет:

  • Установить степень влияния фактора на изменчивость признака;

  • Установить количество факторов влияния на изменчивость признака;

  • Установить степень влияния факторов на дисперсию;

  • Установить степень влияния фактора на среднее значение;

  • Установить степень влияния фактора на числовые характеристики случайной величины;

  1. Задачами регрессионного анализа являются:

  • Выявление связи между случайными величинами и оценка их тесноты;

  • Выявление связи между случайными величинами и их числовыми характеристиками;

  • Выявление уравнения связи между случайными величинами;

  • Выявление уравнения связи между случайной зависимой переменной и неслучайными независимыми переменными и оценка неизвестных значений зависимой переменной;

  • Выявление уравнения связи между неслучайной зависимой переменной и случайными независимыми переменными и оценка неизвестных значений независимой переменной;

  • Выявление уравнения связи между неслучайной независимой переменной и случайными независимыми переменными и оценка неизвестных значений зависимой переменной;

Задачи для самостоятельной работы

  1. Из группы деталей делается случайная выборка ( с возвратом) 20 штук. Найти доверительный интервал для генерального среднего с вероятностью 0,95, если результаты выборки представлены в таблице:

    Вес деталей, кГ

    500

    510

    520

    530

    Количество (частота)

    3

    6

    10

    1

  2. Предполагается произвести выборочное обследование 2000 ламп с целью установления продолжительности их горения. Каким должен быть объем повторной выборки, чтобы можно было гарантировать с вероятностью 0,9, что генеральное среднее отличается от выборочного по абсолютной величине меньше, чем на 20 часов, если генеральная дисперсия меньше 10000 часов.

  3. Распределение признака Х в выборке дается следующим вариационным рядом:

3,0-3,6

3,6-4,2

4,2-4,8

4,8-5,4

5,4-6,0

6,0-6,6

6,6-7,2

2

8

35

43

22

15

5

При уровне значимости 0,01 проверить гипотезу о нормальном законе распределения по критерию Пирсона.

  1. Из партии деталей делается случайная выборка 10 штук. Найти доверительный интервал для генерального среднего с вероятностью 0,95, если результаты выборки представлены в таблице

Вес деталей, кг

400

410

420

430

Количество (частота)

2

2

5

1

  1. Из 500 деталей было отобрано 100, распределение которых по весу дается таблицей

Вес деталей, кг

10

12

14

16

Количество (частота)

40

30

20

10

Найти среднюю ошибку выборки в случаях повторного и бесповторного отбора.

  1. На предприятии работает 20000 ткачих. Определить объем бесповторной выборки для определения средней дневной выработки ткачих с точностью до 0,5 метров и гарантировать полученный результат с вероятностью 0,9545, если известно что среднее квадратическое отклонение дневной выработки ткачих составляет 8 м.

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]