- •1 Несколько основных понятий математической статистики
- •2 Гистограмма
- •3 Закон (плотность) распределения случайной величины
- •4 Нормальный закон распределения
- •5 Функция Лапласа
- •6 Основные числовые характеристики выборки
- •7 Расчет необходимого объема выборки для получения достоверных суждений о генеральной совокупности
- •8 Оценка различия двух выборок
- •9 Проверка нормальности закона распределения случайной величины
- •10 Выявление грубых ошибок
- •11 Анализ степени взаимовлияния двух случайных величин
- •12 Простая регрессия
- •13 Множественная регрессия
- •14 Выделение наиболее значимых независимых переменных и их комплексов
- •15 Кластеризация множества объектов
- •Литература
3 Закон (плотность) распределения случайной величины
Итак, увеличение количества объектов в выборке практически не меняет вида гистограммы. Однако, если СВ является вещественным числом, то-есть может принимать любые вещественные значения, при увеличении объема выборки желательно более подробно изучить распределение значений СВ путем увеличения количества промежутков, а соответственно, уменьшения ширины каждого из них. При этом, конечно вид гистограммы будет меняться. Например, если при одной и той же выборке вдвое увеличить количество промежутков, высота каждого прямоугольника уменьшится примерно вдвое. Для того, чтобы графическое представление выборки сохраняло стабильность и при изменении количества промежутков, принято строить прямоугольники так, чтобы доле значений СВ, попадающих на промежуток, отвечала не высота, а площадьпрямоугольника. Такое изображение, а также функция, график которой задается верхними основаниями прямоугольников, называется законом (плотностью) распределения СВ. При увеличении числа промежутков и, соответственно, уменьшении их ширины этот ступенчатый график все ближе приближается к некоторой непрерывной линии. Ее называют функцией, или законом, распределения СВ. Заметим, что площадь кривой, ограниченной снизу осью абсцисс, а сверху – графиком функции распределения, всегда равна единице.
Обозначим функцию распределения через
.
Тогда доля значений СВ на элементах
генеральной совокупности, лежащих в
пределах между некоторыми значениями
и
, равна
.
4 Нормальный закон распределения
Удивительно, что для большинства генеральных совокупностей, имеющих совершенно разную природу, закон распределения примерно одинаков и отличается только двумя числовыми величинами. Этот закон распределения называется нормальным (или Гауссовым) и описывается формулой:
.
В ней
- значение случайной величины,
и
- два числовых параметра. На рисунке 2
показан вид этой функции при
.
При значении
,
отличном от нуля, график этой функции
смещается по оси абсцисс на равную этому
параметру величину. Второй параметр -
характеризует
степень разброса СВ, его большему
значению отвечает больший разброс
(рисунок 3). При любых значениях обоих
параметров площадь под кривой нормального
распределения всегда равна единице.
Даже при
значение
функции распределения про
стремится к бесконечности таким образом,
что площадь «бесконечно тонкой» фигуры
остается равной единице. На рисунке 2
также показано, какая доля объектов
генеральной совокупности имеет значения
параметра, укладывающиеся в промежутки
,
,
.

Рисунок 2 – Вид нормального закона распределения
Почему же совершенно разные явления описываются нормальным законом? Это вызвано тем, что в каждом из них на каждое конкретное значение СВ совместно влияет много случайных факторов, иногда компенсирующихся, иногда суммирующихся. Наглядным примером является «доска Гальтона» (рисунок 3), по которой шарики скатываются сверху вниз и распределяются в зависимости от сочетания случайных факторов.
Рисунок 3 – Разброс нормально распределенной случайной величины
Рисунок 4 – «Доска Гальтона» демонстрирует, что падающие сверху шарики
распределяются на ней в соответствии с нормальным законом
