- •I. Порядок выполнения лабораторных работ по дисциплине «Статистические методы исследований»
- •II. Задания к лабораторным работам по дисциплине «Статистические методы в инженерных исследованиях»
- •Границы интервалов для заданного к рассчитать, используя Таблицу 2.
- •III. Методические указания для выполнения лабораторных работ с использованием пакета statistica V.5.5
Границы интервалов для заданного к рассчитать, используя Таблицу 2.
-
Найти квантили, отвечающие уровню вероятности p, для распределений с соответствующими параметрами из Таблицы 1.
Значения вероятностей заданы в Таблице 3.
Для четных функций плотности распределения рассчитать левую и правую границы симметрично расположенного интервала.
-
Оформить отчет, используя MS WORD. Таблицы переносятся в текстовый файл копированием (Copy Graph из выпадающего меню при нажатии ПКМ на графике) или экспортом в форматах ХХХХХ1.txt или ХХХХХ1.xls (File->Export Data).
Контрольные вопросы:
-
Как создать таблицу для размещения 100 значений 22 переменных?
-
Как рассчитать значения переменных, заданных с помощью некоторого аналитического выражения и разместить их в таблице?
-
Какие стандартные функции вы использовали в работе для расчетов?
-
Как рассчитать среднее значение по столбцу (строке) ?
-
Как построить график по значениям в столбце таблицы?
-
Что такое случайное событие? Приведите пример.
-
Какими свойствами обладают случайные события? Классификация случайных событий. Что такое случайная величина? Типы случайных величин Приведите пример.
-
Понятие частоты появления случайного события, ее свойства.
-
Понятие вероятности случайного события. Свойства вероятности случайного события.
-
Функция закона распределения случайной величины в интегральной форме, ее свойства. Пример.
-
Функция закона распределения случайной величины в дифференциальной форме, ее свойства. Пример.
-
Расчет вероятности попадания случайной величины в заданный интервал с использованием закона распределения в интегральной форме. Пример.
-
Расчет вероятности попадания случайной величины в заданный интервал с использованием закона распределения в дифференциальной форме. Пример.
-
Типовые законы распределения: аналитический и графический вид плотности распределения, параметры, типовая ситуация формирования случайной величины.
-
Понятие квантиля распределения и его расчет.
Таблица 1. Типы распределений и их параметры
Тип распределения
|
Нормальное |
Лапласа |
Логнормальное |
Экспоненциальное |
Параметры -> № варианта |
1; 2 |
1; 2 |
1; 2 |
1 |
K=1..15
K=16..30 |
-K/10; K/2
K/10; К/20 |
-K/10; K/10
K/10; K/10 |
K/10; K/10
1+K/10; K/20 |
1+K/10
K/10 |
Таблица 2. Границы интервалов
Тип распределения
|
Нормальное 1, 2 |
Лапласа 1, 2 |
Логнормальное 1, 2 |
Экспоненциальное 1 |
||
№ варианта |
Заданный диапазон |
|||||
K=1..15
|
(K/10+1); (K/10); K/10+0.5)
|
-; (K/10-1)
|
K/10;
|
K/10 ;
|
||
K=16..30 |
(K/20-2); (K/10); (K/10+1) |
-; (-K/10-1) |
(K/10+0.05*K); |
K/50 ; |
Таблица 3. Значения вероятностей
Тип распределения
|
Нормальное 1, 2 |
Лапласа 1, 2 |
Логнормальное 1, 2 |
Экспоненциальное 1 |
№ варианта |
Заданная вероятность попадания в симметричный ( +/-x ) и асимметричный (- ; x) интервалы
|
Заданная вероятность попадания в асимметричный интервал (- ; x) |
||
K |
0.95; 0.99
|
К/100
|
Лабораторная работа 2.
Тема: Оценивание функции плотности и интегрального закона распределения вероятностей по выборке заданного объема.
Задание.
-
Начать работу с модулем Basic Statistics и подготовить таблицу, содержащую 10 столбцов и 10 строк.
-
В первом столбце с именем X10 cгенерировать выборку объема N1=10 случайных величин с нормальным распределением и заданными значениями параметров (см. Таблицу 1). Для этого открыть выпадающее меню на заголовке столбца, выбрать
Variable Specs-> Functions->Distributions-> VNormal -> Insert,
а затем ввести в окно Long Names… формулу для расчета в виде
=Vnormal ( rnd(1); m; ) .
Сохранить таблицу в файле с соответствующим именем.
-
Перейти к работе с модулем Data Management, открыть таблицу, созданную в предыдущем пункте, скопировать переменную X10 во второй столбец и упорядочить его значения по возрастанию. Для этого выбрать в горизонтальном меню позицию Analysis->Sort.
Упорядоченным данным присвоить имя VX_10, сохранить таблицу. Записать в отчет упорядоченный ряд данных и его название.
-
Построить гистограмму по значениям X_10. Для этого выбрать Graph->Stats 2D Graphs-> Histograms и установить параметры окна:
-
необходимое количество интервалов (требует предварительного расчета по формуле r=1+3,2*lg N),
-
вывод значений ординат в процентах,
-
тип подгоночной кривой – тип теоретического распределения моделируемой случайной величины.
График сохранить для отчета.
-
Построить диаграмму накопленных частот по значениям X_10. Для этого выполнить все действия п.4, отметив дополнительно позицию Cumulative Counts.
-
В таблицу добавить 490 строк и повторить п.п. 2―5 для того же типа распределения, но―объем выборки N2=500. Сгенерированные и упорядоченные данные поместить соответственно в столбцы X_500 и VX_500. Провести расчеты из п.п. 3-5 и сравнить полученные результаты с результатами для X10.
-
Сгенерировать новые случайные величины:
-
в столбцах Y1 – Y6 -> Yi=Rnd(1), i=1..6;
-
в столбцах Z1 – Z5 Z1=(-1/K)*Ln(1-Y1); Z2=K*Y1, Z3=Y1+K,
Z4=(Yi-1)/(1/6) , i=1, 2; Z5=(Yi-3)/(1/2), i=1,2,…, 6;
где К – номер студента по журналу.
-
Построить гистограммы для величин Y1 и Z1 – Z6 и сделать выводы относительно изменений вида закона распределения вероятностей при различных преобразованиях исходной случайной величины.
-
Построить график по значениям переменной Х_10, выбрав Analyses->Descriptive Statistics->Normal Probability Plots. Объяснить назначение используемого метода анализа.
Пункт 10 выполняется на зачетном занятии
-
Проверить предпосылку о нормальности распределения Z5, используя критерий Пирсона. Для этого выполнить следующие действия:
-
Перейти в модуль Nonparametric/Distrib, в горизонтальном меню окна выбрать Analyses-> Startup Panel. В открытом окне отметить Distribution Fitting, а на панели Continues Distributions выбрать тип распределения – Normal и нажать кнопку ОК,
-
В окне Distribution Fitting выбрать две переменные для исследования Z5 и Z1, отметить «No» для теста Smirnov-Kolmogorov Test, рассчитать и ввести количество интервалов для построения гистограммы (Categories), отметить позиции Frequency Distributions и Row Frequencies, нажать кнопку ОК,
-
Для каждой переменной в окне результатов записать значения Chi-square (выборочное значение статистики хи-квадрат), df (число степеней свободы), p (вероятность, соответствующая Chi-square) и на одном графике построить зависимости значений в столбцах Observed Frequency и Expected Frequency от номера интервала.
-
Проанализировать результаты и принять решение относительно выдвинутой гипотезы.
-
Оформить отчет, содержащий расчеты и графики по всем пунктам задания.
Контрольные вопросы:
-
Что такое вариационный ряд измерений ? Как его получить ?
-
Что такое гистограмма ? Как строится эта функция ?
-
Как рассчитать оценку вероятности попадания случайной величины в заданный интервал, используя гистограмму ?
-
Что такое диаграмма накопленных частот? Как строится эта функция?
-
Как рассчитать оценку вероятности попадания случайной величины в заданный интервал, используя диаграмму накопленных частот ?
-
Как сгенерировать измерения случайной величины с заданным типовым законом распределения ?
-
Как будет изменяться вид гистограммы (диаграммы накопленных частот) при увеличении числа измерений ?
-
Как влияет линейное (нелинейное) преобразование случайной величины на вид ее распределения ?
-
Как можно практически использовать центральную предельную теорему для формирования случайных величин ?
-
Пояснить, для какой цели могут быть использованы формулы формирования случайных величин Z4 и Z5.
Лабораторная работа 3.
Тема: Свойства точечных оценок математического ожидания M[x] и дисперсии D[x] (стандартного отклонения SD[x]).
Задание.
-
Начать работу в модуле Basic Statistics и подготовить таблицу с 10 столбцами и 1000 строками.
-
Сгенерировать 10 выборок объема N=1000 нормально распределенных случайных величин с заданными параметрами ( см. п.2 в лаб. работе 2). Для этого выбрать позицию горизонтального меню Vars->All Specs и ввести в окне Long Name в первую строку формулу для расчета. В остальные 9 строк формулу перенести копированием. Далее выбрать Vars->Recalculate-> All variables и рассчитать значения всех выборок.. Выборки обозначить Х1―Х10.
-
Рассчитать оценки М[х] для всех выборок по N1=10 значениям. Для этого выделить блок значений, содержащий 10 строк, вызвать выпадающее меню и выбрать Block Stats/Columns->Means.
Увеличивать объем выборки последовательно до 50, 500 и 1000 и повторять расчет оценки M[x].
-
По аналогии повторить расчеты для SD[x], выбирая Block Stats/Columns->SDs.
Убедиться, что внизу таблицы появились восемь новых строк, в которых рассчитаны десять оценок М[х] и SD[x] по 10, 50, 500 и 1000 значениям.
-
Построить зависимости значений оценок от номера выборки:
-
По строкам Mean1_10, Mean1_50, Mean1_100, Mean1_1000―на одном графике;
-
по строкам SD1_10, SD1_50, SD1_500, SD1_1000―на втором графике.
Объяснить поведение графиков с точки зрения свойств точечных оценок
-
Рассчитать оценки математического ожидания по строкам оценок, полученных в п.5
M[M1_10], M[M1_50], M[M1_500], M[M1_1000],
M[SD1_10], M[SD1_50], M[SD1_500], M[SD1_1000],
Для этого выделить в таблице блок оценок целиком и использовать Block Stats/Rows->Means.
Рассчитать оценки среднеквадратического отклонения по строкам оценок, полученных в п.5
D[M1_10], D[M1_50], D[M1_500], D[M1_1000],
D[SD1_10], D[SD1_50], D[SD1_500], D[SD1_1000],
Для этого выделить в таблице блок оценок целиком и использовать Block Stats/Rows->SD’s.
Убедиться, что рассчитаны два новых столбца с оценками и результирующая таблица имеет вид
-
1
X1
X2
…
X10
2
…
1000
Mean1_10
…
M[M1_10]
D[M1_10]
Mean1_50
…
M[M1_50]
D[M1_50]
Mean1_100
…
M[M1_100]
D[M1_100]
Mean1_1000
…
M[M1_1000]
D[M1_1000]
SD1_10
…
M[SD1_10]
D[SD1_10]
SD1_50
…
M[SD1_50]
D[SD1_50]
SD1_100
…
M[SD1_100]
D[SD1_100]
SD1_1000
…
M[SD1_1000]
D[SD1_1000]
-
Построить четыре зависимости полученных оценок:
-
Два графика для двух числовых характеристик оценки M[x] и разных объемов выборки―на одном графике (выделены в таблице),
-
Два графика для двух числовых характеристик оценки SD[x] и разных объемов выборки―на втором графике,
В отчете пояснить:
-
какие свойства оценок можно анализировать по этим графикам,
-
поведение графиков с точки зрения свойств точечных оценок.
-
Сгенерировать 10 выборок объема N=500 случайных величин с распределением Коши и параметрами 1=К1, 2=8+К1, где К1 – номер бригады. Рассчитать оценки математического ожидания и медианы по выборкам объемов N1=10 и N2=100. Построить два графика оценок для выборок разного объема и объяснить поведение кривых графика.
-
Выбрать позицию горизонтального меню Analysis-> Descriptive Statistics, в открывшемся окне выбрать More Statistics, отметить и рассчитать по указанию преподавателя дополнительные статистики для X1―X10 по выборкам N=1000.
-
Оформить отчет, содержащий расчеты и графики по всем пунктам задания.
Контрольные вопросы:
1. Что такое точечная оценка? Какие Вы знаете точечные оценки M[x] и D[x]?
2. Какие свойства характеризуют качество точечных оценок ?
3. Какие методы расчета точечных оценок Вы знаете ?
-
Какими свойствами обладает точечная оценка M[x] в виде среднего ?
-
Какие точечные оценки дисперсии вы знаете ?
-
Какими свойствами обладают точечные оценки дисперсии ?
-
Какими свойствами обладают оценки, полученные методом максимального правдоподобия?
-
Какими свойствами обладают оценки, полученные методом наименьших квадратов?
-
Приведите пример оценки математического ожидания, рассчитанной в лабораторной работе, какими свойствами она обладает?
-
Как рассчитать точечную оценку медианы? Какими свойствами она обладает?
Лабораторная работа 4.
Тема: Расчет и анализ свойств интервальных оценок математического ожидания M[x] и дисперсии D[x].
Задание.
-
Начать работу в модуле Basic Statistics и подготовить таблицу с 20 столбцами и 500 строками.
-
Сгенерировать 10 выборок объема N=500 нормально распределенных случайных величин с параметрами из Таблицы 1 аналогично тому, как это сделано на занятии 3. Транспонировать полученную таблицу и сохранить.
-
Рассчитать блочные точечные оценки М[х] и D[x] для всех выборок по N1=10 значениям в каждой строке. Для этого выделить первые 10 столбцов таблицы, вызвать выпадающее меню и выбрать Block Stats/Rows->Means, затем Block Stats/ Rows->SDs. Убедиться в том, что появились два новых столбца, в которых рассчитаны оценки по 10 значениям.
-
Записать в отчет выражения для расчета левой (Lg_M) и правой (Rg_M) границ доверительных интервалов для математического ожидания при заданной доверительной вероятности р=0.95. В двух следующих столбцах рассчитать эти величины. Для расчета использовать спецификацию переменной и окно Long Name… . Следующий свободный столбец обозначить М[х] и заполнить точным значением М[х].
-
Построить на одном графике зависимости значений М[х] , Lg_M и Rg_M от номера выборки. Подсчитать количество случаев К, когда доверительный интервал не включал истинное значение М[х]. Объяснить, что показывает величина К.
-
Повторить п.п. 3-5, рассчитав границы доверительных интервалов по N2=500 значениям. Сравнить результаты, полученные п.п.4 и 5 и объяснить, на что будет влиять объем выборки N.
-
Повторить расчет доверительного интервала для М[х] по выборке объема N2=500 и доверительной вероятности р=0.99. Подсчитать количество случаев К, когда доверительный интервал не включал истинное значение М[х], сравнить с результатом п. 4 и объяснить, на что будет влиять величина доверительной вероятности р.
-
Повторить п.п. 3-7, рассчитывая и анализируя аналогичным образом доверительные интервалы для дисперсии.
Пункт 13 выполняется на зачетном занятии.
-
Оценки M[x], полученные по выборкам объемов N1 и N2 собрать в блок и построить график, вызвав Block Stats/Columns->Graphs->Box Plot/Mean. Повторить построение графика для блока оценок SD[x].
( обозначения на графике Box Plot: Mean – среднее по ряду измерений, SD - среднеквадратическое отклонение случайной величины, SE – среднеквадратическое отклонение среднего ).
Объяснить, что изображено на графике и в чем состоит отличие построенных интервалов от доверительных.
-
Оформить отчет, содержащий расчеты и графики по всем пунктам задания.
Контрольные вопросы:
-
Что такое интервальная оценка? Как определить точность интервальной оценки?
-
Что такое доверительная вероятность?
-
Как рассчитать интервальную оценку для M[x] ?
-
Как рассчитать интервальную оценку для D[x ] ?
-
Какие особенности интервальной оценки M[x] вы можете отметить?
-
Какие особенности интервальной оценки D[x] вы можете отметить?
-
Как проявляется величина доверительной вероятности при интервальном оценивании? Приведите пример из лабораторной работы.
-
Как зависит ширина доверительного интервала от объема выборки ? Приведите пример из лабораторной работы.
-
Как зависит ширина доверительного интервала от доверительной вероятности? Приведите пример из лабораторной работы.
-
Какие стандартные статистики связаны с оценкой математического ожидания ?
-
Какая стандартная статистика связана с оценкой дисперсии?