- •Методические указания по выполнению самостоятельных работ по твмс на ппп статграф с
- •Теоретический минимум.
- •5) Среднее (математическое ожидание).
- •12) Гистограмма и полигон.
- •Выполнение:
- •Задание
- •Вопросы к лабараторной работе
- •Лабораторная работа №2 Связь статистики с теорией вероятности.
- •Теоретический минимум
- •Выполнение:
- •Задание
- •Задание
- •Вопросы к лабараторной работе
- •Лабораторная работа №3. Построение доверительных интервалов. Теоретический минимум.
- •2) Доверительный интервал для математического ожидания нормальной выборки.
- •3) Доверительный интервал для дисперсии нормальной выборки.
- •4) Доверительная вероятность.
- •5) Проверка статистических гипотез.
- •Выполнение:
- •Построение доверительных интервалов
- •Задание:
- •Вопросы к лабораторной работе
- •3. Уровень значимости (Статистическая значимость)
- •Выполнение:
- •Проверка параметрических гипотез о математическом ожидании нормального распределения. Ошибка первого рода. Задание:
- •Поверка параметрических гипотез.
- •Ошибки второго рода. Связь вероятностей ошибок первго и второго рода.
- •Задание
- •Вопросы к лабораторной работе
Выполнение:
Для получения нужных нам на занятиях выборок не обязательно организовывать и проводить специальное исследование, можно поступить проще. В пакете Statgraphics есть генератор случайных чисел, позволяющий имитировать случайный выбор из генеральных совокупностей различной природы. Воспользуемся им сейчас. В строке меню выберите Tools(Инструменты), в раскрывшемся окне выберите Probability Distribution(Распределение вероятностей), раскроется диалоговое окно (Рис. 2.3)
Рис. 2.3
В данном окне можно выбрать одно из 22-х возможных распределений, выберите Normal(Нормальный), нажмите кнопку OK. Перед Вами раскрылось окно Probability Distribution(Распределение вероятностей), щелкните в нем правой кнопкой, в появившемся контекстном меню выберите Analysis Options(Настройки анализа), раскроется окно (Рис. 2.4)
Рис. 2.4
В этом окне укажите параметры распределения (т.е. среднее и стандартное отклонение), нажмите кнопку OK. Если Вы хотите вывести на экран несколько выборок из нормально распределенных генеральных совокупностей, можно набрать в этом окне их параметры.
Для того чтобы данные появились в таблице
нажмите кнопку Save
results(сохранить
результат)
,
раскроется диалоговое окно (Рис. 2.5)
Рис. 2.5
В этом окне надо включить Random Numbers for Dist.1. Если Вы не изменили имя RAND1 в поле Target Variables(Целевые переменные), то столбец данных будет называться RAND1. Если же Вы хотите изменить имя столбца, сделайте это. Затем нажмите кнопку ОК. Вы можете посмотреть, что у Вас получилось, раскрыв окно, которое пока имеет имя Untitled.
По умолчанию объем выборки будет 100. Допустим, Вы хотите использовать выборку другого объема. Нажмите кнопку Tables, выберите там Random Numbers, нажмите кнопку ОК, в раскрывшемся окне щелкните правой кнопкой, в контекстном меню выберите Pane Options. Перед Вами раскроется окно, в нем задайте объем выборки. Нажмите кнопку ОК. Снова щелкните правой кнопкой, выберите Analysis Options, повторите все действия. Если Вы хотите, чтобы обе выборки существовали одновременно, измените имя в поле Target Variables, в противном случае первая выборка будет перекрыта второй. Выполните операцию генерирования выборки.
Задание
1) Сгенерируйте выборку из распределения Bernoulli (Бернулли) размером 10. Таким же образом сгенерируйте еще пять выборок с объемами n=50, 100, 200, 500, 1000. Назовите столбцы RAND 10, RAND50, RAND 100, RAND200, RAND500, RAND 1000. Посмотрите, какие выборки получились. Вы должны обнаружить, что выборки состоят из нулей и единиц. В случае необходимости измените тип чисел на Integer (вспомните, как это сделать, посмотрите работу №1). Можно представить себе, что эти выборки были получены в результате наблюдений некоторого случайного события А: так, первая выборка есть серия из 10 наблюдений, в некоторых из них событие А произошло (1), в других — не произошло (0)
2) Посмотрим, что происходит с частостью события А при увеличении объема выборки. Для бернуллиевского распределения эта частость совпадает с выборочным средним (почему?). Щелкните правой кнопкой по названию столбца, в появившемся контекстном меню выберите Generate Data (генерация данных), щелкните левой кнопкой. Раскроется окно Generate Data, в нем в правой части в поле Operators выберите AVG(?) (среднее)
(рис. 2.6)
Рис. 2.6
щелкните дважды, название перейдет в поле Expression (выражение). Затем щелкните в этом поле, сотрите в скобках вопросительный знак, щелкните дважды в поле Variables по названию нужного вам столбца, например, RAND 10. Проделайте это для каждой из выборок. В первой строке Вашей таблицы будут выписаны частости для каждой из выборок. Хотелось бы представить результаты графически, пока Вы не умеете этого делать. Нарисуйте в тетради график изменения частости в зависимости от объема выборки. Проанализируйте полученные результаты.
Теоретический аналог полигона Сгенерируйте (тип датчика — Normal) выборку объема n=20. Сохраните ее с именем N20. Постройте полигон для выборки. Далее будем строить выборки этого распределения с разными объемами и сохранять их с именами N100, N500, N1000. Сделаем так, чтобы полигоны для всех выборок можно было просмотреть на одном экране. Щелкните снова правой кнопкой по графику, выберите в контекстном меню Сору to Gallery, в этом окне нужно выбрать, где мы хотим расположить полигоны. Допустим, мы хотим расположить в левом углу, выберите Top Left. Для первого полигона в левом нижнем углу выберите Replace (перемещение).
Сгенерируйте вторую выборку объемом n=100. Постройте для нее полигон, щелкните дважды по графику, чтобы раскрыть во все окно, затем щелкните по полигону правой кнопкой, смените его цвет заполнения. Затем снова выберите Copy to Gallery, в раскрывшемся окне выберите Top Left, в левом нижнем углу выберите на сей раз Overlay (наложение), щелкните ОК. Разверните в нижней части экрана StatGallery. На раскрывшемся экране увидите два полигона, наложенные друг на друга. Сверните экран StatGallery снова. Самостоятельно постройте полигоны для выборок объема n=500 и n=1000. Все четыре полигона должны быть на одном графике. Покажите результат преподавателю.
Чтобы убедиться, что не всегда полигон при увеличении объема выборки приближается к нормальной кривой Гаусса, сгенерируйте выборку объема 1000 из генеральной совокупности с распределением Uniform (равномерное распределение)4, назовите ее U1000. Постройте для этой выборки гистограмму частостей с аппроксимирующей кривой типа Normal. Для того чтобы это сделать, выберите в меню Describe, Numeric Data, Distribution Fitting. Выберите переменную U1000, нажмите ОК. Покажите результат преподавателю.
Построение графиков различных распределений
В пакете Statgraphics вы можете построить графики плотностей (и функций распределений) для некоторых типичных распределений. До сих пор Вы строили их статистические аналоги. Давайте посмотрим, как будет меняться графики плотности некоторых известных вам распределений при изменении параметров. Постройте графики нормального распределения N(0,1), N(0,2), N(6,1). Для этого в строке меню выберите Plot, затем Probability Distributions. Нажмите кнопку Graphics Options, выберите Density/Mass Functions (плотность/масса функции). Если Вы выберите здесь еще и CDF, то будет выводиться и график функции распределения. Постройте графики. Чем отличается график распределения N(0,2) от N(0,1), N(6,1) от N(0,1)? Покажите результат преподавателю.
Повторите то же самое для распределения χ 2-квадрат. Задайте число степеней свободы 4, 10, 50. Что происходит с графиками с увеличением числа степеней свободы? Покажите результат преподавателю.
Повторите все для распределения Стьюдента (Student's t). Задайте числа степеней свободы 1, 5, 30. Что происходит с графиками с увеличением числа степеней свободы?
Покажите результат преподавателю.
То же самое для распределения Фишера F(Variance Ratio). В поле Numenator df (число степеней свободы числителя) задайте параметры 6, 12, 6. В поле Denumenator df (число степеней свободы знаменателя) задайте значения параметра 6,6, 60. Покажите результат преподавателю.
Постройте графики выборок
из распределений N(0,1),
t(30),
χ
2(50), N(50,10).
Теперь сделайте так, чтобы в окне
StatGallery
в левой части экрана
были наложены друг на друга графики
N(0,1),
t(30),
а в правой — χ
2(50), N(50,10).
В итоге Вы должны увидеть, что распределение
t(30)
практически не отличается от N(0,1),
а χ2(50)
мало отличается от
N(50,10).
В статистике часто используется этот
факт: распределение Стьюдента и
распределение χ
2 являются асимптотически
нормальными, т.е. при v>
30 t(v)
N(0,1),
a
χ
2(v)
= N(v,
при v
50. Покажите результат
преподавателю.
