Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
UP_Stat_meto_na_GRIF_1-1.docx
Скачиваний:
0
Добавлен:
01.07.2025
Размер:
3.21 Mб
Скачать

1.2. Графическое представление статистических данных

В статистике принято изображать статистическое распределение графически с помощью полигона и гистограммы.

Полигоном частот называется ломаную, отрезками которой соединяются точки с координатами (рис. 1.1); а полигоном частостей – ломаную с координатами , где , [1] (рис. 1.2).

Рис. 1.1. Полигон частот

Рис. 1.2. Полигон частностей

Полигон предназначен для графического изображения дискретного статистического ряда. Полигон частостей в теории вероятностей является аналогом многоугольника распределения дискретной случайной величины.

Графическим изображением интервального ряда является гистограмма.

Гистограмма частот (частостей) - это ступенчатая фигура, состоящая из прямоугольников, основания которых расположены на оси и длины равны длинам частичных интервалов , а высоты отношению - для гистограммы частот (рис. 1.3) и – для гистограммы частостей.

Площадь гистограммы частот равна , а гистограммы частостей всегда равна единице.

Рис. 1.3. Гистограмма частот

Полигон для интервального ряда можно построить в том случае, если преобразовать его в дискретный ряд. Тогда интервалы заменяются их серединными значениями и ставятся в соответствие интервальные частоты и частости. Полигон получается соединением отрезками середины верхних оснований прямоугольников гистограммы.

Вариационные ряды графически можно изобразить в виде кумулятивной кривой (кривой сумм кумуляты). При построении кумуляты дискретного вариационного ряда по оси абсцисс откладываются варианты , а по оси ординат - соответствующие им накопленные частоты .

Соединяя точки ( ; ) отрезками, получаем ломаную, которую называют кумулятой (рис. 1.4). Для получения накопленных частот и дальнейшего построения точек ( ; ) составляется расчетная табл. 1.5.

Таблица 1.5

Варианты,xi

x1

x2

. . .

xk

Относительные частоты,

wi= ni/ n

n1

n2

. . .

nk

Накопленные относительные

частоты, Wi = Wi1 + wi

n1 / n

n2 / n

. . .

nk/ n

При построении кумуляты интервального вариационного ряда левому концу первого интервала сопоставляется частота, равная нулю, а правому – частота этого интервала. Правому концу второго интервала соответствует накопленная частота первых двух интервалов, то есть сумма частот этих интервалов и т. д. Правая граница последнего интервала равна сумме всех частот, то есть объему nвыборки.

Рис. 1.4. Кумулята и эмпирическая функция распределения

1.3. Расчет выборочных характеристик статистического распределения

Для характеристики важнейших свойств статистического распределения используют средние показатели, называемые выборочными числовыми характеристиками. К числу данных показателей относятся:

- выборочная средняя;

- выборочная дисперсия;

- выборочное среднее квадратическое отклонение;

- выборочные структурные средние;

- выборочные начальные и центральные моменты;

- асимметрия, эксцесс.

Выборочной средней называют среднее арифметическое всех значений изучаемой выборки:

- если результаты наблюдений не сгруппированы:

(1.10)

- если результаты сгруппированы в дискретный вариационный ряд:

. (1.11)

Выборочную среднюю можно записать как:

, (1.12)

где – частость.

В случае интервального статистического ряда в качестве следует брать середины интервалов, а – соответствующие им частоты.

Выборочной дисперсией принято называть среднее арифметическое квадратов отклонений значений выборки от выборочной средней :

- если результаты наблюдений не сгруппированы:

(1.13)

- если результаты наблюдений сгруппированы в дискретный вариационный ряд:

(1.14)

или

. (1.15)

Выборочное среднее квадратическое отклонение выборки определяется на основании формулы:

. (1.16)

Особенность выборочного среднего квадратического отклонения заключается в том, что оно измеряется в тех же единицах, что и данные выборки.

В случае, когда объем выборки достаточно невелик ( ) пользуются исправленной выборочной дисперсией, которая определяется на основании формулы:

. (1.17)

Соответственно, величину называют исправленным средним квадратическим отклонением.

Для анализа вариационных рядов вычисляют такие статистики, как моду и медиану.

Модой называют варианту, которая имеет наибольшую частоту. Например, для вариационного ряда:

xi

6

14

21

27

ni

12

29

21

9


мода равна .

Медианой – значение случайной величины, приходящееся на середину ряда.

Если , где – объем выборки, то есть ряд имеет четное число членов, то медиана находится на основании формулы:

. (1.18)

Например, для следующего вариационного ряда:

xi

10

13

18

23

25

31

ni

4

8

3

5

4

2


медиана равна .

Если ряд имеет нечетное число членов, то есть , то медиана равна серединному члену вариационного ряда:

. (1.19)

Например, для вариационного ряда

xi

6

14

18

21

27

ni

12

29

25

21

9


медиана равна .

Показатели средней выборочной и выборочной дисперсии являются частным случаем более общего понятия - момента статистического ряда.

Начальный выборочный момент порядка l - это среднее арифметическое l- ых степеней всех значений исследуемой выборки:

(1.20)

или

. (1.21)

Из представленного определения следует, что начальным выборочным моментом первого порядка является:

. (1.22)

Центральным выборочным моментом порядка называют среднее арифметическое l- ыхстепеней отклонений наблюдаемых значений выборки от выборочной средней :

(1.23)

или

. (1.24)

Таким образом, центральным выборочным моментом второго порядка является:

. (1.25)

Выборочным коэффициентом асимметрииназывают число , которое определяется на основании формулы:

. (1.26)

Выборочный коэффициент асимметрии является характеристикой асимметрии полигона вариационного ряда – в случае если полигон асимметричен, то одна из ветвей его, начиная с вершины, имеет более пологий «спуск», чем вторая.

Если , то более пологий «спуск» полигона наблюдается слева от центра и асимметрию называют левосторонней; в противном случае - справа от цента и асимметрию называют правосторонней.

Выборочный коэффициент эксцесса (коэффициент крутости) позволяет сравнить на «крутость» выборочное распределение с нормальным распределением. Выборочным коэффициентом эксцесса или коэффициентом крутости называется число , которое определяется на основании формулы:

. (1.27)

Важно заметить, что коэффициент эксцесса для случайной величины, распределенной по нормальному закону, равен нулю. В связи с чем, за стандартное значение выборочного коэффициента эксцесса принимается . В случае, когда полигон имеет более «пологую» вершину в сравнении с нормальной кривой; когда - полигон более «крутой» в сравнении с нормальной кривой.

При больших количествах значений вариантов ( ) и соответствующих им частот, расчет выборочной средней, дисперсии и выборочных моментов по приведенным формулам приводит к громоздким вычислениям. Поэтому для их вычисления используются условные варианты , определяемые на основании формулы:

, (1.28)

где C = MoX, h — шаг (длина интервала).

Для вычисления числовых характеристик выборки составляется расчетная табл. 1.6.

Таблица 1.6

контрольный

столбец

строка

сумм:

 =

 =

 =

 =

 =

 =

 =

Контроль вычислений осуществляется на основании выражения:

.

С помощью сумм, полученных в нижней строке таблицы 6.1, вычисляют условные моменты на основании формул:

, (1.29)

, (1.30)

, (1.31)

. (1.32)

Числовые характеристики выборки вычисляют на основании ниже представленных формул:

; (1.33)

; (1.34)

; (1.35)

; (1.36)

, (1.37)

где и находим по формулам:

- условного центрального момента третьего порядка:

, (1.38)

- условного центрального момента четвертого порядка:

. (1.39)

Для характеристики колеблемости признака Х используют относительный показатель - коэффициент вариации V, который вычисляют по формуле:

. (1.40)

Величина коэффициента вариации показывает степень сгруппированности значений около центра рассеяния – чем ближе значение показателя к нулевому значению, тем теснее сгруппированы значения признака около центра рассеяния.

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]