
- •Предисловие
- •Введение
- •1 Первичная обработка статистических данных.
- •1.1 Проверка данных
- •1.2 Группировка статистических данных
- •1.3 Графическое представление статистических данных
- •1.4 Задача 1. Первичная обработка
- •2 Точечные оценки параметров распределения.
- •2.1 Несгруппированные статистические данные
- •2.2 Статистические дискретный и интервальный ряды
- •2.3 Метод “условного нуля”
- •2.2.4 Задача 1. Точечные оценки
- •Выборочное среднее квадратическое отклонение равно
- •Выборочное среднее квадратическое отклонение равно
- •3 Интервальные оценки параметров распределения
- •3.1 Доверительные интервалы для некоторых параметров распределения
- •3.2 Примеры построения доверительных интервалов
- •4 Проверка статистических гипотез
- •4.1 Сравнение двух дисперсий нормально распределенных генеральных совокупностей
- •4.2 Сравнение двух математических ожиданий нормально распределенных генеральных совокупностей, дисперсии которых неизвестны и одинаковы
- •4.3 Сравнение двух вероятностей биномиальных распределений
- •4.4 Проверка гипотезы о виде распределения генеральной совокупности по критерию Пирсона
- •4.5 Проверка гипотезы о виде распределения генеральной совокупности по критерию Колмогорова-Смирнова
- •4.6 Примеры
- •Выборочное среднее квадратическое отклонение равно
- •5 Элементы корреляционного и регрессионного анализа
- •5.1 Корреляционное поле
- •5.2 Эмпирическая ломаная регрессии
- •5.3 Эмпирический коэффициент детерминации и эмпирическое корреляционное отношение
- •5.4 Линейная регрессия
- •5.5 Проверка коэффициента корреляции на значимость.
- •5.6 Теоретический коэффициент детерминации и теоретическое корреляционное отношение
- •5.7 Нелинейная корреляция
- •5.8 Множественная регрессия
- •5.9 Оценка погрешности модели
- •5.10 Задача 1. Установления корреляционной зависимости
- •Реализация статистических расчетов при помощи компьютера
- •6.1 Табличный процессор Microsoft Excel
- •6.2 Пакет программ statistica
- •Задачи для самостоятельного решения
- •Вариант № 1
- •Вариант № 2
- •Вариант № 3
- •Вариант № 4
- •Вариант № 5
- •Вариант № 6
- •Вариант № 7
- •Вариант № 8
- •Вариант № 9
- •Вариант № 10
- •Вариант № 11
- •Вариант № 12
- •Вариант № 13
- •Вариант № 14
- •Вариант № 15
- •Вариант № 16
- •Вариант № 17
- •Вариант № 18
- •Вариант № 19
- •Вариант № 20
- •Вариант № 21
- •Вариант № 22
- •Вариант № 23
- •Вариант № 24
- •Вариант № 25
- •Вариант № 26
- •Вариант № 27
- •Вариант № 28
- •Вариант № 29
- •Вариант № 30
- •8. Контрольные задания по статистике для студентов дневной формы обучения
- •Основные вопросы теории математической статистики
- •Типы отборов и виды выборок.
- •8.2 Варианты контрольных работ Вариант № 1
- •Вариант № 2
- •Вариант № 3
- •Вариант № 4
- •Вариант № 5
- •Вариант № 6
- •Вариант № 7
- •Вариант № 8
- •Вариант № 9
- •Вариант № 10
- •Семестровые задания по статистике
- •9.1 Условие семестрового задания для студентов дневной формы обучения
- •9.2 Условие контрольной работы по статистике для студентов заочной формы обучения
- •9.3 Варианты заданий вариант 1
- •Вариант 2
- •Вариант 3
- •Пример выполнения контрольной работы по статистике для студентов заочной формы обучения
- •Выборочное среднее квадратическое отклонение равно
- •Выборочное среднее квадратическое отклонение равно
- •Приложения !!!! в отдельном файле “ Приложения” Рекомендуемая литература
3.2 Примеры построения доверительных интервалов
Приведем примеры расчета доверительных интервалов.
Пример1.
Построим 95% доверительные интервалы для оценки математического ожидания и СКО генеральных совокупностей признака Х из задачи 1, пункт 4.
Для признака Х имеем:
= 1,14м; S = 0,16м; n =50
Для оценки математического ожидания используем формулу (2)
при =0,95. По таблице приложения 3 находим
t = t(0,95;50)=2,009. Подставляя в формулу (2), получим
Окончательно,
получим
.
Следовательно, средняя мощность пласта
по всей генеральной совокупности
находится в пределах от 1,09м до 1,19м.
Надежность этого прогноза равна 95%.
Для оценки СКО по таблице приложения 4 находим
q= q(0,95;50)=0,21. Подставляя в формулу (3), получим
P{0,16(1 – 0,21) < <0,16(1+0,21)} = 0,95.
Окончательно, получим P{0,13 < <0,19} = 0,95. Следовательно, средний разброс мощности пласта вокруг среднего по всей генеральной совокупности находится в пределах от 0,13м до 0,19м. Надежность этого прогноза равна 95%.
Построение доверительных интервалов для признака У проводится аналогично.
Пример 2. Объединение закупает партию перфораторов в количестве 1000 шт. По предварительной договоренности объединение берет товар по цене S, если доля нестандартной продукции во всей партии не превышает 3%; если же эта доля находится в пределах от 3% до 8%, то производитель дает скидку на 10%, если доля в пределах от 8% до 20%, то предполагается скидка на 25%. При доле нестандартного товара больше чем на 20%, объединение отказывается от предложенной сделки. Для проверки качества товара была сделана выборка объемом 60 шт. Из них не прошли контроль 6 перфораторов. Следует ли объединению покупать предложенную партию, и по какой цене? При расчетах взять надежность прогноза 90%.
Пусть событие А – перфоратор оказался нестандартным.
Тогда р = Р(А) является неизвестной вероятностью, которую нужно оценить по выборке и по результатам испытаний и оценки сделать вывод о возможности и условиях сделки.
Запишем исходные данные задачи:
N = 1000; n = 60; m = 6; = 0,9.
Выборочная доля равна = 6/60 = 0,1.
Для построения доверительного интервала используем формулу (5), случай с).
Имеем : 2Ф(t) = 0,9. Отсюда Ф(t) = 0,45. По таблице приложения 2 находим t = 1,64. Подставляем в формулу (5) и находим верхнюю и нижнюю границы искомой вероятности:
Следовательно, с надежностью прогноза 90% можно утверждать, что процент нестандартной продукции во всей закупаемой партии перфораторов находится в пределах от 4% до 16%. Значит, партию перфораторов можно купить, но при этом потребовать скидку у производителя на 25%.
4 Проверка статистических гипотез
Гипотеза – это высказывание предположительного характера. Под статистической гипотезой понимают гипотезу о параметрах распределения или виде функции распределения генеральной совокупности.
Примерами статистических гипотез являются следующие высказывания: генеральная совокупность, описывающая мощность пласта угля, имеет нормальный закон распределения или генеральная средняя (математическое ожидание мощности пласта) равна 1 м.
Определение. Статистическая гипотеза называется непараметрической, если в ней сформулированы предположения относительно вида функции распределения.
Определение. Статистическая гипотеза называется параметрической, если в ней сформулированы предположения относительно значений параметров функции распределения известного вида.
Определение. Нулевой гипотезой называют основную гипотезу и обозначают символом Но. Обычно нулевые гипотезы утверждают, что различие между сравниваемыми величинами (параметрами или функциями распределения) отсутствуют, а наблюдаемые отклонения объясняются лишь случайными колебаниями выборки.
Определение. Альтернативной (конкурирующей) называется гипотеза, конкурирующая с нулевой гипотезой в том смысле, что если нулевая гипотеза отвергается, то принимается альтернативная, которую обозначают символом Н1 .
Проверку статистических гипотез обычно осуществляют в следующем порядке:
А) Располагая выборочными данными х1, х2, …, хn и руководствуясь конкретными условиями рассматриваемой задачи, формулируют гипотезу Н0, которую называют основной или нулевой, и конкурирующую гипотезу Н1 . Конкурирующая гипотеза представляет собой ту гипотезу, которая будет принята, если отвергнут основную гипотезу.
Б) Задаются вероятностью , которую называют уровнем значимости ошибки первого рода. Поясним ее смысл. Решение о том, можно ли считать высказывание Н0 справедливым для генеральной совокупности, принимается по выборочным данным, т.е. по ограниченному ряду наблюдений, следовательно, это решение может быть ошибочным. При этом может иметь место ошибка двух родов: отвергают гипотезу Н0, или, иначе, принимают альтернативную гипотезу Н1, тогда как на самом деле гипотеза Н0 верна – это ошибка первого рода; принимают гипотезу Н0, тогда как на самом деле высказывание Н0 неверно, т.е. верной является гипотеза Н1 – это ошибка второго рода.
Значит, уровень значимости - это вероятность ошибки первого рода, то есть вероятность того, что верная основная гипотеза будет отвергнута и принята ошибочная конкурирующая гипотеза.
В). Вводят статистический критерий проверки сформулированных гипотез, который представляет собой случайную величину, подчиняющуюся определенному заранее известному закону распределения, если верна основная гипотеза. По уровню значимости ошибки первого рода строят допустимую область (где принимается гипотеза Н0) и критическую область где отвергается гипотеза Н0 и принимается гипотеза Н1).
Г). По результатам выборки вычисляют наблюдаемое значение критерия и определяют область, в которую полученное значение критерия попадает. Если наблюдаемое значение критерия попало в критическую область, то гипотезу Н0 отвергают и принимают гипотезу Н1. Если наблюдаемое значение критерия попало в допустимую область, то говорят, что нет оснований отвергнуть гипотезу Н0 .
В математической статистике изучено множество различных гипотез, каждая из которых проверяется своим способом. Рассмотрим некоторые из них, наиболее часто встречаемых в горно-геологических статистических расчетах.