
- •Предисловие
- •Введение
- •1 Первичная обработка статистических данных.
- •1.1 Проверка данных
- •1.2 Группировка статистических данных
- •1.3 Графическое представление статистических данных
- •1.4 Задача 1. Первичная обработка
- •2 Точечные оценки параметров распределения.
- •2.1 Несгруппированные статистические данные
- •2.2 Статистические дискретный и интервальный ряды
- •2.3 Метод “условного нуля”
- •2.2.4 Задача 1. Точечные оценки
- •Выборочное среднее квадратическое отклонение равно
- •Выборочное среднее квадратическое отклонение равно
- •3 Интервальные оценки параметров распределения
- •3.1 Доверительные интервалы для некоторых параметров распределения
- •3.2 Примеры построения доверительных интервалов
- •4 Проверка статистических гипотез
- •4.1 Сравнение двух дисперсий нормально распределенных генеральных совокупностей
- •4.2 Сравнение двух математических ожиданий нормально распределенных генеральных совокупностей, дисперсии которых неизвестны и одинаковы
- •4.3 Сравнение двух вероятностей биномиальных распределений
- •4.4 Проверка гипотезы о виде распределения генеральной совокупности по критерию Пирсона
- •4.5 Проверка гипотезы о виде распределения генеральной совокупности по критерию Колмогорова-Смирнова
- •4.6 Примеры
- •Выборочное среднее квадратическое отклонение равно
- •5 Элементы корреляционного и регрессионного анализа
- •5.1 Корреляционное поле
- •5.2 Эмпирическая ломаная регрессии
- •5.3 Эмпирический коэффициент детерминации и эмпирическое корреляционное отношение
- •5.4 Линейная регрессия
- •5.5 Проверка коэффициента корреляции на значимость.
- •5.6 Теоретический коэффициент детерминации и теоретическое корреляционное отношение
- •5.7 Нелинейная корреляция
- •5.8 Множественная регрессия
- •5.9 Оценка погрешности модели
- •5.10 Задача 1. Установления корреляционной зависимости
- •Реализация статистических расчетов при помощи компьютера
- •6.1 Табличный процессор Microsoft Excel
- •6.2 Пакет программ statistica
- •Задачи для самостоятельного решения
- •Вариант № 1
- •Вариант № 2
- •Вариант № 3
- •Вариант № 4
- •Вариант № 5
- •Вариант № 6
- •Вариант № 7
- •Вариант № 8
- •Вариант № 9
- •Вариант № 10
- •Вариант № 11
- •Вариант № 12
- •Вариант № 13
- •Вариант № 14
- •Вариант № 15
- •Вариант № 16
- •Вариант № 17
- •Вариант № 18
- •Вариант № 19
- •Вариант № 20
- •Вариант № 21
- •Вариант № 22
- •Вариант № 23
- •Вариант № 24
- •Вариант № 25
- •Вариант № 26
- •Вариант № 27
- •Вариант № 28
- •Вариант № 29
- •Вариант № 30
- •8. Контрольные задания по статистике для студентов дневной формы обучения
- •Основные вопросы теории математической статистики
- •Типы отборов и виды выборок.
- •8.2 Варианты контрольных работ Вариант № 1
- •Вариант № 2
- •Вариант № 3
- •Вариант № 4
- •Вариант № 5
- •Вариант № 6
- •Вариант № 7
- •Вариант № 8
- •Вариант № 9
- •Вариант № 10
- •Семестровые задания по статистике
- •9.1 Условие семестрового задания для студентов дневной формы обучения
- •9.2 Условие контрольной работы по статистике для студентов заочной формы обучения
- •9.3 Варианты заданий вариант 1
- •Вариант 2
- •Вариант 3
- •Пример выполнения контрольной работы по статистике для студентов заочной формы обучения
- •Выборочное среднее квадратическое отклонение равно
- •Выборочное среднее квадратическое отклонение равно
- •Приложения !!!! в отдельном файле “ Приложения” Рекомендуемая литература
5.5 Проверка коэффициента корреляции на значимость.
Пусть признаки Х и У распределены нормально. Из генеральной совокупности извлечена выборка объема n и по ней найден выборочный коэффициент корреляции rв . Требуется проверить гипотезу о значимости генерального коэффициента корреляции rг .
Выдвигаются гипотезы
Основная гипотеза Н0 : rг = 0
Конкурирующая гипотеза Н1 : rг ≠ 0
Для проверки гипотезы H 0 вычисляется наблюдаемое значение критерия:
.
Этот критерий является случайной величиной, которая подчиняется закону распределения Стьюдента с k = n – 2 степенями свободы. Критическая область является двусторонней. По таблице критических точек распределения Стьюдента (Приложение 6) определяется критическое значение критерия при выбранном уровне значимости ошибки и числе степеней свободы k :
tкр = tкр (α; k).
Если Тнабл > tкр , то нулевая гипотеза отвергается. Это значит, что коэффициент корреляции значимо отличается от нуля и признаки Х и У коррелированы.
Если Тнабл < tкр , то нулевая гипотеза не отвергается. Это значит, что коэффициент корреляции незначимо отличается от нуля и признаки Х и У некоррелированы.
5.6 Теоретический коэффициент детерминации и теоретическое корреляционное отношение
Теоретический коэффициент детерминации и теоретическое корреляционное отношение определяются по уравнению регрессии :
, где Dобїясн
уравн регр
–
дисперсия
результативного признака У,
объясненная
уравнением
регрессии;
Dобщ
– общая дисперсия результативного
признака У .
(8)
n – объем выборки;
yi – индивидуальные значения результативного признака У;
– среднее значение признака У;
yiтеор – индивидуальные значения результативного признака У, рассчитанные по уравнению регрессии: yiтеор=f(xi); если уравнение регрессии линейное, то yiтеор=kxi + b, а корреляционное отношение совпадает с модулем коэффициента корреляции η = rв , коэффициент детерминации равен R2= rв2 .
Коэффициент детерминации характеризует тесноту связи между признаками. В количественной форме он указывает какая часть общей дисперсии результативного признака У объясняется вариаций признака Х. Например, если построена статистическая модель, описывающая зависимость объема суточной добычи (У) от мощности пласта (Х) и коэффициент детерминации равен 0,56, то это значит, что 56% дисперсии объема суточной добычи объясняется по выбранной модели вариацией мощности пласта.
Для получения выводов о практической значимости синтезированной модели используются качественные оценки, которые даются на основе шкалы Чеддока [8].
R2 |
0,1 – 0,3 |
0,3 – 0,5 |
0,5 – 0,7 |
0,7 – 0,9 |
0,9 – 0,99 |
Характеристика силы связи |
слабая |
умеренная |
заметная |
высокая |
весьма высокая |
5.7 Нелинейная корреляция
Если
график регрессии – кривая линия, то
корреляцию называют криволинейной.
Параметры уравнения криволинейной
регрессии
находят по методу наименьших квадратов,
а в некоторых случаях сводят задачу к
линейной регрессии путем введения
соответствующих замен. Ниже приводятся
наиболее типичные случаи криволинейной
регрессии.
а)
Параболическая зависимость
Параметры регрессии a, b, c находятся из решения системы:
(9)
б)
Гиперболическая зависимость
Делаем
замену
и сводим задачу к линейной регрессии
.
Параметры k
и b
находятся по формулам линейной регрессии
( с точностью до обозначений):
,
. (10)
где
.
в)
Логарифмическая зависимость
Делаем
замену
и сводим задачу к линейной регрессии
.
г)
Экспоненциальная зависимость
Делаем замену z = ex и сводим задачу к линейной регрессии .
д)
Степенная зависимость
Делаем замену z = xm и сводим задачу к линейной регрессии .
Теснота связи между результативным признаком Х и фактором У при нелинейной форме их связи оценивается при помощи коэффициента детерминации R2, который находится по той же формуле (8) из п.5.6, что и для линейной связи. Качественная оценка тесноты связи производится по шкале Чеддока.
Аналогом
коэффициента корреляции для нелинейного
случая служит корреляционное отношение
.