- •Кафедра информатики, статистики и высшей математики
- •Часть 3 «теория вероятностей и математическая статистика»
- •Случайные события. Вероятность.
- •Классический способ задания вероятности
- •Геометрический способ задания вероятности
- •Дискретный способ задания вероятности
- •Статистический способ задания вероятности
- •Задачи для самостоятельной работы
- •Лекция №2 Свойства вероятностей. Условная вероятность. Теоремы сложения и умножения вероятностей.
- •Лекция №3 Случайные величины. Функции распределения случайных величин
- •Показательное распределение. Показательным (экспоненциальным) называют распределение вероятностей непрерывной случайной величины , которое описывается функцией плотности вероятности:
- •Лекция №4. Нормальное распределение.
- •Лекция 5. Предельные теоремы и законы больших чисел
- •Лекция №7. Предмет математической статистики. Генеральная и выборочная совокупности. Вариационные ряды и их характеристики
- •Лекция 8. Связь между генеральной и выборочной совокупностью.
- •Предельные ошибки и необходимый объем выборки (Повторный и бесповторный отбор)
- •Лекция №9. Проверка статистических гипотез.
- •Проверка гипотез о равенстве средних значений при известной и неизвестной дисперсии.
- •Проверка гипотезы о равенстве дисперсий двух нормальных генеральных совокупностей.
- •Лекция№10.Проверка статистических гипотез о законе распределения генеральной совокупности
- •Критерий согласия (хи- квадрат) Пирсона
- •Критерий согласия Колмогорова
- •Лекция №11. Основные понятия дисперсионного анализа
- •Однофакторный дисперсионный анализ
- •Понятие о двухфакторном дисперсионном анализе
- •Лекция№12. Корреляционно – регрессионный анализ
- •Свойства выборочного (статистического) коэффициента корреляции
- •Понятие о нелинейной регрессии, индекс корреляции и коэффициент детерминации
- •Вопросы
Свойства выборочного (статистического) коэффициента корреляции
Для оценки тесноты связи между переменными и по выборочным значениям используют статистический коэффициент корреляции :
.
Если данные не сгруппированы в виде корреляционной таблицы и представляют пар чисел , то для вычисления коэффициента корреляции проводят по следующей формуле:
.
Между коэффициентом корреляции и коэффициентами регрессии и существует связь: , , .
Основные свойства коэффициента корреляции (при достаточно большом объеме выборке ):
Коэффициент корреляции лежит в пределах: ;
Если все значения переменных увеличить (уменьшить) на одно и то же число или в одно и то же число раз, по величина коэффициента корреляции не изменится.
При корреляционная связь представляет линейную функциональную зависимость.
При корреляционная линейная связь отсутствует.
При оценке тесноты связи между переменными и по выборочному коэффициенту корреляции необходимо проверить значимость этого коэффициента, т.е. установить достаточна ли его величина для обоснования вывода о наличии корреляционной связи. Для этого необходимо проверить нулевую гипотезу : - коэффициент корреляции между генеральными совокупностями и равен нулю. При справедливости этой гипотезы статистика (критерий)
Имеет - распределение Стьюдента с степенями свободы. При заданном уровне значимости и степени свободы находим по таблицам закона распределения Стьюдента критическое значение . Если , то нулевая гипотеза об отсутствии корреляционной связи между переменными и отвергается и переменные считаются зависимыми. При нет оснований отвергать нулевую гипотезу. Значимость коэффициента корреляции свидетельствует и о значимости коэффициентов регрессии, соответственно и о значимости линейного уравнения регрессии.
Понятие о нелинейной регрессии, индекс корреляции и коэффициент детерминации
В экономических приложениях часто возникает необходимость выражать корреляционную зависимость в виде нелинейных уравнений регрессии, поскольку линейные зависимости приводят к большим ошибкам. Выбор вида нелинейной регрессии называется спецификацией или этапом параметризации модели и осуществляется методами визуального оценивания точек корреляционного поля, анализа сути наблюдаемых экономических процессов и т.п. Наиболее часто в экономических исследованиях используют следующие виды нелинейной регрессии:
Полиноминальная ;
Гиперболическая ;
Степенное и т.п.
Для определения неизвестных параметров выбранного уравнения регрессии используется метод наименьших квадратов.
При нелинейной регрессии для оценки тесноты связи между переменными используют не коэффициент корреляции , а индекс корреляции и коэффициент детерминации .
Индекс корреляции по вычисляется по формуле:
,
где - межгрупповая дисперсия, выражающая ту часть вариации переменной , которая обусловлена изменчивостью переменной или регрессией и вычисляемая по формуле:
;
- общая дисперсия переменной:
Коэффициент детерминации, равный квадрату индекса корреляции, показывает долю общей вариации зависимой переменной, обусловленной регрессией или изменчивостью объясняющей переменной:
.
Чем ближе к единице, тем теснее наблюдения примыкают к линии регрессии, тем лучше регрессия описывает зависимость переменных.
При парной линейной регрессии индекс корреляции равен коэффициенту корреляции по абсолютному значению: .
Табличный процессор Excel так же позволяет проводит автоматизированный корреляционно- регрессионный анализ. Для этого в опции Сервис находим пакет анализа данных (см. рис.)
Тесты для самоконтроля:
К оценкам генеральной совокупности предъявляются следующие требования:
Оценка должна быть стационарной, эргодичной и эффективной;
Оценка должна быть состоятельной, эргодичной и эффективной;
Оценка должна быть состоятельной, стационарной и эргодичной ;
Оценка должна быть состоятельной, эффективной и несмещенной;
Оценка должна быть несмещенной, стационарной и эффективной;
Статистической гипотезой называют:
Предположение относительно параметров и вида закона распределения генеральной совокупности;
Предположение относительно объема генеральной совокупности;
Предположение относительно параметров и вида закона распределения выборки;
Предположение относительно объема выборочной совокупности;
Предположение относительно статистического критерия ;
При проверки статистической гипотезы ошибка первого рода это:
Принятие в действительности неверной гипотезы;
Отвержение в действительности правильной гипотезы;
Принятие в действительности правильной гипотезы;
Отвержение в действительности неправильной гипотезы;
В критерии Колмогорова за меру качества согласия эмпирического и теоретического распределения принимается:
Относительное расхождение между теоретической и эмпирической частотами попадания случайной величины в интервал;
Максимальное расхождение по модулю между теоретической и эмпирической частотами попадания случайной величины в интервал;
Среднее квадратичное отклонение между теоретической и эмпирической частотами попадания случайной величины в интервал;
Максимальное расхождение модуля разности между эмпирической и теоретической функциями распределения;
Максимальное расхождение модуля разности между эмпирической и теоретической функциями плотности распределения;
Дисперсионный анализ позволяет:
Установить степень влияния фактора на изменчивость признака;
Установить количество факторов влияния на изменчивость признака;
Установить степень влияния факторов на дисперсию;
Установить степень влияния фактора на среднее значение;
Установить степень влияния фактора на числовые характеристики случайной величины;
Задачами регрессионного анализа являются:
Выявление связи между случайными величинами и оценка их тесноты;
Выявление связи между случайными величинами и их числовыми характеристиками;
Выявление уравнения связи между случайными величинами;
Выявление уравнения связи между случайной зависимой переменной и неслучайными независимыми переменными и оценка неизвестных значений зависимой переменной;
Выявление уравнения связи между неслучайной зависимой переменной и случайными независимыми переменными и оценка неизвестных значений независимой переменной;
Выявление уравнения связи между неслучайной независимой переменной и случайными независимыми переменными и оценка неизвестных значений зависимой переменной;
Задачи для самостоятельной работы
Из группы деталей делается случайная выборка ( с возвратом) 20 штук. Найти доверительный интервал для генерального среднего с вероятностью 0,95, если результаты выборки представлены в таблице:
Вес деталей, кГ
500
510
520
530
Количество (частота)
3
6
10
1
Предполагается произвести выборочное обследование 2000 ламп с целью установления продолжительности их горения. Каким должен быть объем повторной выборки, чтобы можно было гарантировать с вероятностью 0,9, что генеральное среднее отличается от выборочного по абсолютной величине меньше, чем на 20 часов, если генеральная дисперсия меньше 10000 часов.
Распределение признака Х в выборке дается следующим вариационным рядом:
3,0-3,6 |
3,6-4,2 |
4,2-4,8 |
4,8-5,4 |
5,4-6,0 |
6,0-6,6 |
6,6-7,2 |
2 |
8 |
35 |
43 |
22 |
15 |
5 |
При уровне значимости 0,01 проверить гипотезу о нормальном законе распределения по критерию Пирсона.
Из партии деталей делается случайная выборка 10 штук. Найти доверительный интервал для генерального среднего с вероятностью 0,95, если результаты выборки представлены в таблице
Вес деталей, кг |
400 |
410 |
420 |
430 |
Количество (частота) |
2 |
2 |
5 |
1 |
Из 500 деталей было отобрано 100, распределение которых по весу дается таблицей
Вес деталей, кг |
10 |
12 |
14 |
16 |
Количество (частота) |
40 |
30 |
20 |
10 |
Найти среднюю ошибку выборки в случаях повторного и бесповторного отбора.
На предприятии работает 20000 ткачих. Определить объем бесповторной выборки для определения средней дневной выработки ткачих с точностью до 0,5 метров и гарантировать полученный результат с вероятностью 0,9545, если известно что среднее квадратическое отклонение дневной выработки ткачих составляет 8 м.