Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Tema_7_Osnovnye_ponyatia_matematicheskoy_statis...doc
Скачиваний:
5
Добавлен:
30.08.2019
Размер:
421.38 Кб
Скачать

§3. Числовые характеристики выборочной совокупности

Статистическое распределение выборки содержит всю информацию о выборке. В ряде случаев нет необходимости в такой полной информации, кроме того, обилие числовых данных затрудняет их восприятие. Вычисление числовых характеристик позволяет максимально сжать информацию о выборке.

  • Выборочная средняя – это средняя арифметическая всех вариант в выборке, обозначается и вычисляется по формуле: (для группированной выборки) или (для негруппированной выборки).

Выборочная средняя характеризует среднюю варианту признака.

  • Выборочная дисперсия – это средняя арифметическая квадратов отклонений вариант от выборочной средней, обозначается и вычисляется по формуле: (для группированной выборки) или (для негруппированной выборки).

Выборочная дисперсия описывает разброс вариант относительно выборочной средней и характеризует точность измерений. Чем сильнее разброс значений относительно выборочной средней, тем больше выборочная дисперсия. Выборочная дисперсия всегда неотрицательна.

На практике более удобна формула , где .

Недостатком дисперсии является то, что ее размерность не равна размерности изучаемой величины, а является квадратом ее размерности. Например, если величина измеряется в метрах, то дисперсия – в м2. Для устранения этого недостатка используется следующая числовая характеристика.

  • Выборочное среднеквадратическое отклонение – это квадратный корень из выборочной дисперсии, обозначается и вычисляется по формуле . Оно характеризует то же самое, что и выборочная дисперсия, но его размерность равна размерности самой изучаемой величины.

  • Исправленная выборочная дисперсия:

  • Стандартное отклонение:

  • Стандартная ошибка (или ошибка средней):

Замечание: В большинстве случаев результаты исследований представляются в виде

§4. Точечные оценки числовых характеристик генеральной совокупности

В генеральной совокупности можно вычислить аналогичные числовые характеристики: генеральную среднюю, генеральную дисперсию и генеральное среднеквадратическое отклонение.

В силу указанных выше причин генеральная совокупность недоступна для исследования, поэтому вычислить данные характеристики невозможно, можно лишь оценить их по выборке. Можно дать оценки двух видов: точечные и интервальные. Точечная оценка дается одним числом, этим объясняется ее название (число отмечается на числовой оси точкой). Причем оценка будет тем точнее, чем больше объем выборки. Интервальная оценка дается в виде интервала.

Точечной оценкой генеральной средней является выборочная средняя.

Точечной оценкой генеральной дисперсии является исправленная выборочная дисперсия .

Точечной оценкой генерального среднеквадратического отклонения является стандартное отклонение .

Таким образом,

§5. Интервальные оценки числовых характеристик генеральной совокупности. Доверительный интервал

Если на основании выборочных данных дается оценка того или иного параметра генеральной совокупности, то при этом необходимо иметь в виду, что данная оценка является лишь приближенным значением неизвестного параметра. При малом объеме выборки значение точечной оценки может очень сильно отклоняться от истинного значения параметра. Вопрос состоит в том, как велико это отклонение.

Чтобы решить этот вопрос, используются интервальные оценки, которые даются в виде доверительного интервала.

Доверительный интервал – это интервал со случайными границами, в котором с заданной вероятностью находится значение параметра генеральной совокупности.

называется доверительной вероятностью, она характеризует надежность результатов. Чем выше , тем выше надежность, но при этом снижается точность. В медицинских и биологических исследованиях в качестве берут 0,9; 0,95 или 0,99.

Доверительный интервал может быть построен для различных числовых характеристик генеральной совокупности. Мы рассмотрим построение доверительного интервала для генеральной средней в том случае, когда исследуемая величина распределена по нормальному закону, выборка малого объема ( ), генеральное среднеквадратическое отклонение неизвестно.

В этом случае доверительный интервал строится по формуле: , где - вычисленная по выборке выборочная средняя, - квадратный корень из исправленной выборочной дисперсии (стандартное отклонение), - объем выборки, - коэффициент Стьюдента, вычисляемый по таблице. Он зависит от доверительной вероятности и числа степеней свободы .

Критические значения коэффициента Стьюдента для различной доверительной вероятности и числа степеней свободы f

Число степеней свободы f

Доверительная вероятность

Число степеней свободы f

Доверительная вероятность

0,95

0,99

0,999

0,95

0,99

0,999

5

2,571

4,032

6,859

20

2,086

2,845

3,85

6

2,447

3,707

5,959

21

2,08

2,831

3,819

7

2,365

3,499

5,405

22

2,074

2,819

3,792

8

2,306

3,355

5,041

23

2,069

2,807

3,767

9

2,262

3,250

4,781

24

2,064

2,797

3,745

10

2,228

3,169

4,587

25

2,06

2,787

3,725

11

2,201

3,106

4,437

26

2,056

2,779

3,707

12

2,179

3,055

4,318

27

2,052

2,771

3,69

13

2,160

3,012

4,221

28

2,048

2,763

3,674

14

2,145

2,977

4,140

29

2,045

2,756

3,659

15

2,131

2,947

4,073

30

2,042

2,750

3,646

16

2,120

2,921

4,015

40

2,021

2,704

3,551

17

2,110

2,898

3,965

60

2,001

2,66

3,46

18

2,101

2,878

3,922

120

1,980

2,617

3,373

19

2,093

2,861

3,883

1,960

2,576

3,291

Доверительная вероятность характеризует надежность оценки генеральной средней, полученной с помощью доверительного интервала. Из таблицы значений коэффициента Стьюдента видно, что чем больше доверительная вероятность , тем больше коэффициент и, следовательно, больше длина доверительного интервала. Но увеличение длины доверительного интервала ведет к потере точности оценки . Таким образом, требование большей надежности оценки числовой характеристики ведет к потере точности этой оценки. При одной и той же надежности более точную оценку можно получить, если увеличить объем выборки n.

Величина , равная половине длины доверительного интервала, представляет собой наибольшее отклонение выборочной средней от генеральной средней , которое возможно при заданной доверительной вероятности . Она называется абсолютной погрешностью оценки генеральной средней по выборочной средней (или предельной ошибкой выборки).

Относительной погрешностью называют отношение абсолютной погрешности к величине выборочной средней, выраженное в процентах:

Задача. Из большой партии таблеток некоторого лекарственного препарата случайным образом были извлечены 8 таблеток. При измерении массы таблеток были получены следующие результаты (в мг): 151, 147, 152, 152, 151, 148, 151, 148.

  1. Построить ряд распределения данной выборки.

  2. Построить полигон частот.

  3. Найти числовые характеристики выборки.

  4. Дать точечные оценки числовым характеристикам генеральной совокупности.

  5. Оценить истинную массу таблетки с помощью доверительного интервала с доверительной вероятностью .

  6. Найти абсолютную и относительную погрешности.

Решение.

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]