
- •17 ТеорВер
- •§ 7. Применение теории вероятности к статистике.
- •1. Основные понятия.
- •2. Определение неизвестной функции распределения.
- •3. Определение неизвестных параметров распределения.
- •4. Доверительный интервал. Доверительная вероятность.
- •5. Применение критерия Стьюдента для сравнения двух генеральных совокупностей.
- •6. Элементы теории корреляции.
- •7. Элементы регрессионного анализа
- •8. Проверка гипотезы о нормальном распределении генеральной совокупности. Критерий согласия Пирсона.
17 ТеорВер
§ 7. Применение теории вероятности к статистике.
Оглавление.
1. Основные понятия.
2. Определение неизвестной функции распределения.
3. Определение неизвестных параметров распределения.
4. Доверительный интервал. Доверительная вероятность.
5. Применение критерия Стьюдента для сравнения генеральных
совокупностей.
6. Элементы теории корреляции.
7. Элементы регрессионного анализа.
8. Проверка гипотезы о нормальном распределении генеральной
совокупности. Критерий согласия Пирсона.
1. Основные понятия.
Математическая статистика - это раздел математики, в котором изучаются методы обработки и анализа экспериментальных данных, полученных в результате наблюдений над массовыми случайными событиями, явлениями.
Наблюдения, проводимые над объектами, могут охватывать всех членов изучаемой совокупности без исключения и могут ограничиваться обследованиями лишь некоторой части членов данной совокупности. Первое наблюдение называется сплошным или полным, второе частичным или выборочным.
Естественно, что наиболее полную информацию дает сплошное наблюдение, однако к нему прибегают далеко не всегда. В подавляющем большинстве случаев прибегают к выборочному исследованию.
Совокупность, из которой некоторым образом отбирается часть ее членов для совместного изучения, называется генеральной совокупностью, а отобранная тем или иным способом часть генеральной совокупности - выборочная совокупность или выборка.
Объем
генеральной совокупности
теоретически ничем неограничен
,
на практике же он всегда ограничен.
Объем
выборки
может быть большим или малым, но он не
может быть меньше двух.
Отбор в выборку можно проводить случайным способом (по способу жеребьевки или лотереи). Либо планово, в зависимости от задачи и организации обследования. Для того чтобы выборка была представительной, необходимо обращать внимание на размах варьирования признака и согласовывать с ним объем выборки.
2. Определение неизвестной функции распределения.
Итак,
мы сделали выборку. Разобьем диапазон
наблюдаемых значений
на интервалы
,
,
….
одинаковой длины
.
Для оценки необходимого числа интервалов
можно использовать следующие формулы:
.
(5.1)
Далее
пусть mi
-
число наблюдаемых значений
,
попавших вi-ый
интервал. Разделив mi
на
общее число наблюдений n,
получим частоту
,
соответствующуюi-ому
интервалу:
,
причем
. Составим следующую таблицу:
Номер интервала |
Интервал |
mi |
|
1 |
|
m1 |
|
2 |
|
m2 |
|
... |
... |
... |
... |
k |
|
mk |
|
которая
называется статистическим
рядом.
Эмпирической
(или статистической)
функцией
распределения
случайной величины
называется
частота события Р*,
заключающегося в том, что величина
в результате опыта примет значение,
меньшееx:
На
практике достаточно найти значения
статистической функции распределения
F*(x)
в точках
,
которые являются границами интервалов
статистического ряда:
(5.2)
Отметим,
что
при
и
при
.
Построив
точки
и соединив их плавной кривой, получим
приближенный график эмпирической
функции распределения (рис. 5.1).
Используя закон
больших чисел Бернулли, можно доказать,
что при достаточно большом числе
испытаний
с вероятностью, близкой к единице,
эмпирическая функция распределения
отличается сколь угодно мало от
неизвестной нам функции распределения
случайной величины
.
Часто
вместо построения графика эмпирической
функции распределения поступают
следующим образом. На оси абсцисс
откладывают интервалы
,
,
….
.
На каждом интервале строят прямоугольник,
площадь которого равна частоте
,
соответствующей данному интервалу.
Тогда высота hi
этого
прямоугольника равна
,
где
- длинна каждого из интервалов. Ясно,
что сумма площадей всех построенных
прямоугольников равна единице. График
рис. 5.2 называетсягистограммой.
Он представляет собой ступенчатую линию
(рис. 5.2).
С помощью закона
больших чисел Бернулли можно доказать,
что при малых
и больших
с практической достоверностью
как угодно мало отличается от плотности
распределения
непрерывной случайной величины
.
Таким образом, на практике определяется вид неизвестной функции распределения случайной величины.