Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Статистика - Метод_лаб_СМИИ(УиИ).doc
Скачиваний:
4
Добавлен:
31.03.2015
Размер:
159.23 Кб
Скачать

Границы интервалов для заданного к рассчитать, используя Таблицу 2.

  1. Найти квантили, отвечающие уровню вероятности p, для распределений с соответствующими параметрами из Таблицы 1.

Значения вероятностей заданы в Таблице 3.

Для четных функций плотности распределения рассчитать левую и правую границы симметрично расположенного интервала.

  1. Оформить отчет, используя MS WORD. Таблицы переносятся в текстовый файл копированием (Copy Graph из выпадающего меню при нажатии ПКМ на графике) или экспортом в форматах ХХХХХ1.txt или ХХХХХ1.xls (File->Export Data).

Контрольные вопросы:

    1. Как создать таблицу для размещения 100 значений 22 переменных?

    2. Как рассчитать значения переменных, заданных с помощью некоторого аналитического выражения и разместить их в таблице?

    3. Какие стандартные функции вы использовали в работе для расчетов?

    4. Как рассчитать среднее значение по столбцу (строке) ?

    5. Как построить график по значениям в столбце таблицы?

    6. Что такое случайное событие? Приведите пример.

    7. Какими свойствами обладают случайные события? Классификация случайных событий. Что такое случайная величина? Типы случайных величин Приведите пример.

    8. Понятие частоты появления случайного события, ее свойства.

    9. Понятие вероятности случайного события. Свойства вероятности случайного события.

    10. Функция закона распределения случайной величины в интегральной форме, ее свойства. Пример.

    11. Функция закона распределения случайной величины в дифференциальной форме, ее свойства. Пример.

    12. Расчет вероятности попадания случайной величины в заданный интервал с использованием закона распределения в интегральной форме. Пример.

    13. Расчет вероятности попадания случайной величины в заданный интервал с использованием закона распределения в дифференциальной форме. Пример.

    14. Типовые законы распределения: аналитический и графический вид плотности распределения, параметры, типовая ситуация формирования случайной величины.

    15. Понятие квантиля распределения и его расчет.

Таблица 1. Типы распределений и их параметры

Тип распределения

Нормальное

Лапласа

Логнормальное

Экспоненциальное

Параметры ->

варианта

1; 2

1; 2

1; 2

1

K=1..15

K=16..30

-K/10; K/2

K/10; К/20

-K/10; K/10

K/10; K/10

K/10; K/10

1+K/10; K/20

1+K/10

K/10

Таблица 2. Границы интервалов

Тип распределения

Нормальное

1, 2

Лапласа

1, 2

Логнормальное

1, 2

Экспоненциальное

1

варианта

Заданный диапазон

K=1..15

(K/10+1); 

(K/10); K/10+0.5)

-; (K/10-1)

K/10; 

K/10 ; 

K=16..30

(K/20-2); 

(K/10); (K/10+1)

-; (-K/10-1)

(K/10+0.05*K); 

K/50 ; 

Таблица 3. Значения вероятностей

Тип распределения

Нормальное

1, 2

Лапласа

1, 2

Логнормальное

1, 2

Экспоненциальное

1

варианта

Заданная вероятность попадания

в симметричный ( +/-x ) и асимметричный (- ; x) интервалы

Заданная вероятность попадания в асимметричный интервал

(- ; x)

K

0.95; 0.99

К/100

Лабораторная работа 2.

Тема: Оценивание функции плотности и интегрального закона распределения вероятностей по выборке заданного объема.

Задание.

  1. Начать работу с модулем Basic Statistics и подготовить таблицу, содержащую 10 столбцов и 10 строк.

  2. В первом столбце с именем X10 cгенерировать выборку объема N1=10 случайных величин с нормальным распределением и заданными значениями параметров (см. Таблицу 1). Для этого открыть выпадающее меню на заголовке столбца, выбрать

Variable Specs-> Functions->Distributions-> VNormal -> Insert,

а затем ввести в окно Long Names… формулу для расчета в виде

=Vnormal ( rnd(1); m;  ) .

Сохранить таблицу в файле с соответствующим именем.

  1. Перейти к работе с модулем Data Management, открыть таблицу, созданную в предыдущем пункте, скопировать переменную X10 во второй столбец и упорядочить его значения по возрастанию. Для этого выбрать в горизонтальном меню позицию Analysis->Sort.

Упорядоченным данным присвоить имя VX_10, сохранить таблицу. Записать в отчет упорядоченный ряд данных и его название.

  1. Построить гистограмму по значениям X_10. Для этого выбрать Graph->Stats 2D Graphs-> Histograms и установить параметры окна:

  • необходимое количество интервалов (требует предварительного расчета по формуле r=1+3,2*lg N),

  • вывод значений ординат в процентах,

  • тип подгоночной кривой – тип теоретического распределения моделируемой случайной величины.

График сохранить для отчета.

  1. Построить диаграмму накопленных частот по значениям X_10. Для этого выполнить все действия п.4, отметив дополнительно позицию Cumulative Counts.

  2. В таблицу добавить 490 строк и повторить п.п. 2―5 для того же типа распределения, но―объем выборки N2=500. Сгенерированные и упорядоченные данные поместить соответственно в столбцы X_500 и VX_500. Провести расчеты из п.п. 3-5 и сравнить полученные результаты с результатами для X10.

  3. Сгенерировать новые случайные величины:

  • в столбцах Y1 – Y6 -> Yi=Rnd(1), i=1..6;

  • в столбцах Z1 – Z5 Z1=(-1/K)*Ln(1-Y1); Z2=K*Y1, Z3=Y1+K,

Z4=(Yi-1)/(1/6) , i=1, 2; Z5=(Yi-3)/(1/2), i=1,2,…, 6;

где К – номер студента по журналу.

  1. Построить гистограммы для величин Y1 и Z1 – Z6 и сделать выводы относительно изменений вида закона распределения вероятностей при различных преобразованиях исходной случайной величины.

  2. Построить график по значениям переменной Х_10, выбрав Analyses->Descriptive Statistics->Normal Probability Plots. Объяснить назначение используемого метода анализа.

Пункт 10 выполняется на зачетном занятии

  1. Проверить предпосылку о нормальности распределения Z5, используя критерий Пирсона. Для этого выполнить следующие действия:

  • Перейти в модуль Nonparametric/Distrib, в горизонтальном меню окна выбрать Analyses-> Startup Panel. В открытом окне отметить Distribution Fitting, а на панели Continues Distributions выбрать тип распределения – Normal и нажать кнопку ОК,

  • В окне Distribution Fitting выбрать две переменные для исследования Z5 и Z1, отметить «No» для теста Smirnov-Kolmogorov Test, рассчитать и ввести количество интервалов для построения гистограммы (Categories), отметить позиции Frequency Distributions и Row Frequencies, нажать кнопку ОК,

  • Для каждой переменной в окне результатов записать значения Chi-square (выборочное значение статистики хи-квадрат), df (число степеней свободы), p (вероятность, соответствующая Chi-square) и на одном графике построить зависимости значений в столбцах Observed Frequency и Expected Frequency от номера интервала.

  • Проанализировать результаты и принять решение относительно выдвинутой гипотезы.

  1. Оформить отчет, содержащий расчеты и графики по всем пунктам задания.

Контрольные вопросы:

        1. Что такое вариационный ряд измерений ? Как его получить ?

        2. Что такое гистограмма ? Как строится эта функция ?

        3. Как рассчитать оценку вероятности попадания случайной величины в заданный интервал, используя гистограмму ?

        4. Что такое диаграмма накопленных частот? Как строится эта функция?

        5. Как рассчитать оценку вероятности попадания случайной величины в заданный интервал, используя диаграмму накопленных частот ?

        6. Как сгенерировать измерения случайной величины с заданным типовым законом распределения ?

        7. Как будет изменяться вид гистограммы (диаграммы накопленных частот) при увеличении числа измерений ?

        8. Как влияет линейное (нелинейное) преобразование случайной величины на вид ее распределения ?

        9. Как можно практически использовать центральную предельную теорему для формирования случайных величин ?

        10. Пояснить, для какой цели могут быть использованы формулы формирования случайных величин Z4 и Z5.

Лабораторная работа 3.

Тема: Свойства точечных оценок математического ожидания M[x] и дисперсии D[x] (стандартного отклонения SD[x]).

Задание.

  1. Начать работу в модуле Basic Statistics и подготовить таблицу с 10 столбцами и 1000 строками.

  2. Сгенерировать 10 выборок объема N=1000 нормально распределенных случайных величин с заданными параметрами ( см. п.2 в лаб. работе 2). Для этого выбрать позицию горизонтального меню Vars->All Specs и ввести в окне Long Name в первую строку формулу для расчета. В остальные 9 строк формулу перенести копированием. Далее выбрать Vars->Recalculate-> All variables и рассчитать значения всех выборок.. Выборки обозначить Х1―Х10.

  3. Рассчитать оценки М[х] для всех выборок по N1=10 значениям. Для этого выделить блок значений, содержащий 10 строк, вызвать выпадающее меню и выбрать Block Stats/Columns->Means.

Увеличивать объем выборки последовательно до 50, 500 и 1000 и повторять расчет оценки M[x].

  1. По аналогии повторить расчеты для SD[x], выбирая Block Stats/Columns->SDs.

Убедиться, что внизу таблицы появились восемь новых строк, в которых рассчитаны десять оценок М[х] и SD[x] по 10, 50, 500 и 1000 значениям.

  1. Построить зависимости значений оценок от номера выборки:

  • По строкам Mean1_10, Mean1_50, Mean1_100, Mean1_1000―на одном графике;

  • по строкам SD1_10, SD1_50, SD1_500, SD1_1000―на втором графике.

Объяснить поведение графиков с точки зрения свойств точечных оценок

  1. Рассчитать оценки математического ожидания по строкам оценок, полученных в п.5

M[M1_10], M[M1_50], M[M1_500], M[M1_1000],

M[SD1_10], M[SD1_50], M[SD1_500], M[SD1_1000],

Для этого выделить в таблице блок оценок целиком и использовать Block Stats/Rows->Means.

Рассчитать оценки среднеквадратического отклонения по строкам оценок, полученных в п.5

D[M1_10], D[M1_50], D[M1_500], D[M1_1000],

D[SD1_10], D[SD1_50], D[SD1_500], D[SD1_1000],

Для этого выделить в таблице блок оценок целиком и использовать Block Stats/Rows->SD’s.

Убедиться, что рассчитаны два новых столбца с оценками и результирующая таблица имеет вид

1

X1

X2

X10

2

1000

Mean1_10

M[M1_10]

D[M1_10]

Mean1_50

M[M1_50]

D[M1_50]

Mean1_100

M[M1_100]

D[M1_100]

Mean1_1000

M[M1_1000]

D[M1_1000]

SD1_10

M[SD1_10]

D[SD1_10]

SD1_50

M[SD1_50]

D[SD1_50]

SD1_100

M[SD1_100]

D[SD1_100]

SD1_1000

M[SD1_1000]

D[SD1_1000]

  1. Построить четыре зависимости полученных оценок:

  • Два графика для двух числовых характеристик оценки M[x] и разных объемов выборки―на одном графике (выделены в таблице),

  • Два графика для двух числовых характеристик оценки SD[x] и разных объемов выборки―на втором графике,

В отчете пояснить:

  • какие свойства оценок можно анализировать по этим графикам,

  • поведение графиков с точки зрения свойств точечных оценок.

  1. Сгенерировать 10 выборок объема N=500 случайных величин с распределением Коши и параметрами 1=К1, 2=8+К1, где К1 – номер бригады. Рассчитать оценки математического ожидания и медианы по выборкам объемов N1=10 и N2=100. Построить два графика оценок для выборок разного объема и объяснить поведение кривых графика.

  1. Выбрать позицию горизонтального меню Analysis-> Descriptive Statistics, в открывшемся окне выбрать More Statistics, отметить и рассчитать по указанию преподавателя дополнительные статистики для X1―X10 по выборкам N=1000.

  2. Оформить отчет, содержащий расчеты и графики по всем пунктам задания.

Контрольные вопросы:

1. Что такое точечная оценка? Какие Вы знаете точечные оценки M[x] и D[x]?

2. Какие свойства характеризуют качество точечных оценок ?

3. Какие методы расчета точечных оценок Вы знаете ?

  1. Какими свойствами обладает точечная оценка M[x] в виде среднего ?

  2. Какие точечные оценки дисперсии вы знаете ?

  3. Какими свойствами обладают точечные оценки дисперсии ?

  4. Какими свойствами обладают оценки, полученные методом максимального правдоподобия?

  5. Какими свойствами обладают оценки, полученные методом наименьших квадратов?

  6. Приведите пример оценки математического ожидания, рассчитанной в лабораторной работе, какими свойствами она обладает?

  7. Как рассчитать точечную оценку медианы? Какими свойствами она обладает?

Лабораторная работа 4.

Тема: Расчет и анализ свойств интервальных оценок математического ожидания M[x] и дисперсии D[x].

Задание.

  1. Начать работу в модуле Basic Statistics и подготовить таблицу с 20 столбцами и 500 строками.

  2. Сгенерировать 10 выборок объема N=500 нормально распределенных случайных величин с параметрами из Таблицы 1 аналогично тому, как это сделано на занятии 3. Транспонировать полученную таблицу и сохранить.

  3. Рассчитать блочные точечные оценки М[х] и D[x] для всех выборок по N1=10 значениям в каждой строке. Для этого выделить первые 10 столбцов таблицы, вызвать выпадающее меню и выбрать Block Stats/Rows->Means, затем Block Stats/ Rows->SDs. Убедиться в том, что появились два новых столбца, в которых рассчитаны оценки по 10 значениям.

  4. Записать в отчет выражения для расчета левой (Lg_M) и правой (Rg_M) границ доверительных интервалов для математического ожидания при заданной доверительной вероятности р=0.95. В двух следующих столбцах рассчитать эти величины. Для расчета использовать спецификацию переменной и окно Long Name… . Следующий свободный столбец обозначить М[х] и заполнить точным значением М[х].

  5. Построить на одном графике зависимости значений М[х] , Lg_M и Rg_M от номера выборки. Подсчитать количество случаев К, когда доверительный интервал не включал истинное значение М[х]. Объяснить, что показывает величина К.

  6. Повторить п.п. 3-5, рассчитав границы доверительных интервалов по N2=500 значениям. Сравнить результаты, полученные п.п.4 и 5 и объяснить, на что будет влиять объем выборки N.

  1. Повторить расчет доверительного интервала для М[х] по выборке объема N2=500 и доверительной вероятности р=0.99. Подсчитать количество случаев К, когда доверительный интервал не включал истинное значение М[х], сравнить с результатом п. 4 и объяснить, на что будет влиять величина доверительной вероятности р.

  2. Повторить п.п. 3-7, рассчитывая и анализируя аналогичным образом доверительные интервалы для дисперсии.

Пункт 13 выполняется на зачетном занятии.

  1. Оценки M[x], полученные по выборкам объемов N1 и N2 собрать в блок и построить график, вызвав Block Stats/Columns->Graphs->Box Plot/Mean. Повторить построение графика для блока оценок SD[x].

( обозначения на графике Box Plot: Mean – среднее по ряду измерений, SD - среднеквадратическое отклонение случайной величины, SE – среднеквадратическое отклонение среднего ).

Объяснить, что изображено на графике и в чем состоит отличие построенных интервалов от доверительных.

  1. Оформить отчет, содержащий расчеты и графики по всем пунктам задания.

Контрольные вопросы:

    1. Что такое интервальная оценка? Как определить точность интервальной оценки?

    2. Что такое доверительная вероятность?

    3. Как рассчитать интервальную оценку для M[x] ?

    4. Как рассчитать интервальную оценку для D[x ] ?

    5. Какие особенности интервальной оценки M[x] вы можете отметить?

    6. Какие особенности интервальной оценки D[x] вы можете отметить?

    7. Как проявляется величина доверительной вероятности при интервальном оценивании? Приведите пример из лабораторной работы.

    8. Как зависит ширина доверительного интервала от объема выборки ? Приведите пример из лабораторной работы.

    9. Как зависит ширина доверительного интервала от доверительной вероятности? Приведите пример из лабораторной работы.

    10. Какие стандартные статистики связаны с оценкой математического ожидания ?

    11. Какая стандартная статистика связана с оценкой дисперсии?