
- •9. Использование функций при статистических расчетах
- •Нормальное (Гауссово) распределение
- •Равномерное распределение
- •Биномиальное распределение
- •Другие статистические распределения
- •Построение гистограмм
- •Гистограмма с произвольными сегментами разбиения
- •Гистограмма с разбиением на равные сегменты
- •Расчетно-графическое задание 1
9. Использование функций при статистических расчетах
Многие задачи, использующие аппарат математической статистики, требуют для своей реализации наличия большого числа случайных чисел, которые создаются в результате непосредственных наблюдений, измерений или регистрации фактов.
Такое множество данных образуют так называемую статистическую совокупностьи нуждаются в обработке, включающей систематизацию и классификацию, расчет характеризующих ее параметров, а также иллюстрирующие ее таблицы, графики, гистограммы.
В Mathcad’e имеется ряд встроенных функций для создания статистической совокупности и ее обработки.
Основным этапом обработки экспериментальных данных является группировка, т.е. разделение статистической совокупности на группы, однородные по какому-то признаку.
На практике часто используют ограниченное количество числовых характеристик, которые можно разделить на три группы:
- центр группирования;
- величину рассеяния (степень корреляции);
- форму распределения вероятностей (гистограммы плотности вероятности).
Центр группирования можно найти с помощью функций:
- mean(x) - вычисление среднего значения.
Иногда в статистике помимо арифметического среднего, применяются другие средние значения:
- gmean(x) - геометрическое среднее выборки случайных чисел;
- hmean(x) - гармоническое среднее выборки случайных чисел.
На рис. 8.1 приведены формулы для определения центра группирования статической совокупности:
Рис.9.1 Формулы для встроенных функций центра группирования
Самой элементарной характеристикой величины рассеянияявляется вариационный размах, представляющий собой разность между максимальным и минимальным значениями статистической совокупности:
Вариационный размах учитывает только крайние значения, которые могут очень сильно отличаться от всех других значений. Поэтому более точно рассеяние определяется с помощью показателей, учитывающих отклонение всех значений от среднего арифметического, т.е. среднее линейное и среднее квадратичное отклонения. Среднее линейное определяется по формуле:
Среднее квадратическое отклонение вычисляется по формуле:
Величина под корнем называется дисперсией. Она имеет самостоятельное значение во многих задачах математической статистики и относится к числу важнейших показателей вариации. В MathCAD’eимеются следующие функции для определения величины рассеяния:
- max(x), min(x) - максимальное и минимальное значения совокупности;
- mode(x) - возвращает наиболее часто встречающееся значение совокупности;
- var(x) – общая дисперсия (population variance);
- Var(x) - выборочная дисперсия (sample variance);
- stdev(x) - корень квадратный из общей дисперсии (square root of the population variance);
- Stdev(x) - корень квадратный из выборочной дисперсии (squarerootofthesamplevariance);
- median(х) - выборочная медиана, которая делит гистограмму плотности вероятностей на две равные части;
- х - вектор (или матрица) случайных данных.
На рис.9.2 приведены примеры использования встроенных функций для определения величины рассеяния (корреляции) статистической совокупности.
Форма распределения вероятностей определяется с помощью теоретических кривых распределения.Теоретическая криваяраспределения вероятностей – это зависимость, которая описывается математически, т.е. она может быть выражена уравнением с определенными параметрами. Известно очень много различных распределений, однако на практике используются лишь некоторые из них.
Согласно определению, случайная величина принимает значение, зависящее от случайных обстоятельств опыта, эксперимента, заранее предсказать которое невозможно. Поэтому можно лишь говорить о вероятности P(х) принятия случайной дискретной величиной того или иного значения х, или о вероятности попадания непрерывной случайной величины в тот или иной числовой интервал (х,х+dх). Соотношение Р(х) называют законом распределения случайной величины, а зависимость P(х) между возможными значениями непрерывной случайной величины и вероятностями попадания в их окрестность называется ее плотностью вероятности (probability density).
Рис. 9.2. Расчет величины рассеяния (корреляции) статистической совокупности
В Mathcad’e имеется ряд встроенных функций, задающих используемые в математической статистике законы распределения. Они вычисляют как значение плотности вероятности различных распределений по значению случайной величины х, так и некоторые сопутствующие функции. Все они, по сути, являются либо встроенными аналитическими зависимостями, либо специальными функциями. Большой интерес представляет наличие генераторов случайных чисел, создающих выборку псевдослучайных данных с соответствующим законом распределения. Рассмотрим возможности Mathcad на нескольких наиболее популярных законах распределения, а затем приведем перечень распределений, встроенных в Mathcad.