Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Лекции 20 апреля.doc
Скачиваний:
1
Добавлен:
01.05.2025
Размер:
4.06 Mб
Скачать

2.5. Моделирование законов распределения случайных величин средствами excel

Некоторые законы распределения могут быть смоделированы средствами EXCEL. Программа моделирования включена в состав встроенного в EXCEL специального пакета программ (”Пакет анализа”). Этот пакет устанавливается в меню ”Сервис” – ”Надстройки” (рис. 2.9).

После установки пакета в меню Сервис появляется строчка ”Анализ данных” (рис. 2.10). Выберите в меню строчку ”Анализ данных”. По этой команде раскрывается список программ, входящих в пакет (рис. 2.11).

Рис. 2.9. Установка программ ”Пакет анализа”

Рис. 2.10. Вызов пакета ”Анализ данных”

Рис. 2.11. Список программ пакета ”Анализ данных”

Программы моделирования случайных закономерностей иначе называются генераторами. Выбор программы моделирования осуществляется в диалоговом окне, представленном на рис. 2.1. При запуске программы моделирования выводится диалоговое окно, где определяются параметры моделируемой случайной величины (рис. 2.12). В списке законов распределения выберем нормальное (распределение). Смоделируем нормальное распределение с параметрами и разместим данные в восьмом столбце таблицы данных (рис. 2.12).

Рис. 2.12. Диалоговое окно моделирования нормального закона распределения

3. Предварительный анализ данных одномерных признаков

3.1. Расчет средних значений и дисперсии одномерного признака

Прежде всего, по данным одномерного признака, рассчитываются две статистические характеристики: среднее значение и дисперсия.

Среднее значение является оценкой математического ожидания случайной величины. Запишем формулу расчета среднего значения признака в принятых обозначениях. Форму для расчета среднего первого признака таблицы данных будет иметь вид:

(3.1)

Оценка дисперсии признака первого признака производится по формуле:

(3.2)

В пакете EXCEL расчет среднего значения производится с помощью функции СРЗНАЧ. При вызове функции указывается диапазон ячеек таблицы данных, для которого необходимо рассчитать среднее значение. В нашем случае один из столбцов таблицы данных (рис. 3.1).

В пакете EXCEL расчет оценки дисперсии признака производится с помощью функции ДИСП. При вызове функции указывается диапазон ячеек таблицы данных, для которого необходимо рассчитать оценка. В нашем случае один из столбцов таблицы данных (рис. 3.2). В EXCEL есть еще одна функция расчета дисперсии. Это функция ДИСПР. Отличие этой функции заключается в том, что в формуле 3.2 деление производится не на величину n-1 , а на величину n.

Рис. 3.1. Диалоговое окно функции СРЗНАЧ

Рис. 3.2. Диалоговое окно функции ДИСП

На ряду с дисперсией для характеристики случайных признаков используется такая характеристика как среднеквадратичное отклонение. Среднеквадратичное отклонение связано с дисперсией соотношением:

(3.3)

Для вычисления квадратного корня в EXCEL математическая функция КОРЕНЬ.

3.2. Диапазон значений признака

Диапазон значений признака это интервал возможных значений всех элементов генеральной совокупности. Поскольку при обработке данных мы имеем дело с выборкой из генеральной совокупности, то интервал значений мы можем определить только с определенной степень точности. Мы не можем быть абсолютно уверены, что при увеличении объема выборки мы не получим значение признака, выходящее за пределы выбранного интервала значений. В то же время нельзя выбирать интервал значений слишком большим.

Существует три способа оценки интервала значений признака.

Первый способ. Оценка интервала значений признака исходя из теоретических соображений. Такой способ используется когда известно, что исследуемый признак описывается одним из теоретических законов распределения (нормальный закон, экспоненциальный и другие). В этом случае можно рассчитать интервал значений в который попадают все значения признака с определенной вероятностью (доверительный интервал).

Второй способ. Оценка интервала значений признака исходя из содержательного смысла признака. Исследователи чаще всего имеют дело не с абстрактными признаками, а с признаками смысл которых им хорошо известен. Например, если мы исследуем рост студентов университета. Для этого совершенно не обязательно измерять рост всех студентов (генеральная совокупность), а достаточно судить о росте студентов на основе выборки. Как в этом случае выбрать интервал значений. Маловероятно, что в выборку нам сразу попадется и самый рослый и самый низкорослый студенты. Но мы, исходя из здравого смысла, можем сказать, что самый низкорослый студент будет не меньше 152 сантиметров, а самый рослый студент будет не больше 210 сантиметров. Но мы, из того же здравого смысла, можем точно утверждать, что не будет среди студентов университета студента с ростом 5 сантиметров или 25 метров.

Третий способ. Оценка интервала значений признака эмпирическим путем, то есть на основе опыта наблюдения признака. Этот способ используется в тех случаях, когда исследователю ничего не известно об исследуемом признаке до совершения выборки. Этот способ оценки интервала значений является универсальным.

Рассмотрим методику оценки интервала значений признака эмпирическим способом в среде EXCEL. Оценку произведем для признака расположенного в восьмом столбце таблицы данных, созданной при моделировании данных. Расчет производится в несколько шагов. Результаты расчетов разместим в таблицу (рис. 3.3).

Рис. 3.3. Расчет диапазона значений признака

Первый шаг. Рассчитаем минимальное и максимальное значение признака:

(3.4)

(3.5)

Для расчета минимального и максимального значения признака используются функции EXCEL. Разница между минимальным значением случайного признака и максимальным значением называется размахом вариации.

Второй шаг. Рассчитывается левая граница (нижняя граница) признака и правая граница (верхняя граница) интервала значений признака:

(3.6)

(3.7)

То есть в качестве границ диапазона значений признака мы выбираем такие границы, которые немного меньше минимального значения и максимального значения выборки. Расширение диапазона регулируется множителем . Множитель целесообразно выбирать равным 0,005.

Третий шаг. Рассчитывается ширина диапазона значений признака:

(3.8)

Диапазон значений признака используется для расчета частотного рада. Расчет частотного ряда рассмотрим в следующем параграфе.