- •1 Несколько основных понятий математической статистики
- •2 Гистограмма
- •3 Закон (плотность) распределения случайной величины
- •4 Нормальный закон распределения
- •5 Функция Лапласа
- •6 Основные числовые характеристики выборки
- •7 Расчет необходимого объема выборки для получения достоверных суждений о генеральной совокупности
- •8 Оценка различия двух выборок
- •9 Проверка нормальности закона распределения случайной величины
- •10 Выявление грубых ошибок
- •11 Анализ степени взаимовлияния двух случайных величин
- •12 Простая регрессия
- •13 Множественная регрессия
- •14 Выделение наиболее значимых независимых переменных и их комплексов
- •15 Кластеризация множества объектов
- •Литература
3 Закон (плотность) распределения случайной величины
Итак, увеличение количества объектов в выборке практически не меняет вида гистограммы. Однако, если СВ является вещественным числом, то-есть может принимать любые вещественные значения, при увеличении объема выборки желательно более подробно изучить распределение значений СВ путем увеличения количества промежутков, а соответственно, уменьшения ширины каждого из них. При этом, конечно вид гистограммы будет меняться. Например, если при одной и той же выборке вдвое увеличить количество промежутков, высота каждого прямоугольника уменьшится примерно вдвое. Для того, чтобы графическое представление выборки сохраняло стабильность и при изменении количества промежутков, принято строить прямоугольники так, чтобы доле значений СВ, попадающих на промежуток, отвечала не высота, а площадьпрямоугольника. Такое изображение, а также функция, график которой задается верхними основаниями прямоугольников, называется законом (плотностью) распределения СВ. При увеличении числа промежутков и, соответственно, уменьшении их ширины этот ступенчатый график все ближе приближается к некоторой непрерывной линии. Ее называют функцией, или законом, распределения СВ. Заметим, что площадь кривой, ограниченной снизу осью абсцисс, а сверху – графиком функции распределения, всегда равна единице.
Обозначим функцию распределения через . Тогда доля значений СВ на элементах генеральной совокупности, лежащих в пределах между некоторыми значениямии, равна
.
4 Нормальный закон распределения
Удивительно, что для большинства генеральных совокупностей, имеющих совершенно разную природу, закон распределения примерно одинаков и отличается только двумя числовыми величинами. Этот закон распределения называется нормальным (или Гауссовым) и описывается формулой:
.
В ней - значение случайной величины,и- два числовых параметра. На рисунке 2 показан вид этой функции при. При значении, отличном от нуля, график этой функции смещается по оси абсцисс на равную этому параметру величину. Второй параметр -характеризует степень разброса СВ, его большему значению отвечает больший разброс (рисунок 3). При любых значениях обоих параметров площадь под кривой нормального распределения всегда равна единице. Даже призначение функции распределения простремится к бесконечности таким образом, что площадь «бесконечно тонкой» фигуры остается равной единице. На рисунке 2 также показано, какая доля объектов генеральной совокупности имеет значения параметра, укладывающиеся в промежутки,,
.
Рисунок 2 – Вид нормального закона распределения
Почему же совершенно разные явления описываются нормальным законом? Это вызвано тем, что в каждом из них на каждое конкретное значение СВ совместно влияет много случайных факторов, иногда компенсирующихся, иногда суммирующихся. Наглядным примером является «доска Гальтона» (рисунок 3), по которой шарики скатываются сверху вниз и распределяются в зависимости от сочетания случайных факторов.
Рисунок 3 – Разброс нормально распределенной случайной величины
Рисунок 4 – «Доска Гальтона» демонстрирует, что падающие сверху шарики
распределяются на ней в соответствии с нормальным законом