Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Математика (Ходоровский Леонард Абрамович).docx
Скачиваний:
4
Добавлен:
25.11.2019
Размер:
432.09 Кб
Скачать

15.Меры изменчивости. Вариационный размах, среднее линейное отклонение.

В качестве наиболее часто используемых мер изменчивости следует назвать размах, дисперсию, стандартное отклонение.  Размах – это разница между максимальным и минимальным значениями.  Р = Хmax – Xmin Для определения размаха выборку необходимо сначала уорядочить. Например, в массиве данных {8, 9, 11, 12, 12, 13, 14, 17, 19, 19, 20, 20} размах будет равен разности между наибольшим и наименьшим значениями, то есть 20 – 8 = 12. но если бы выборка была неупорядочена и имеет большой объем, было бы трудно найти минимальное и максимальное значения.  Дисперсия – это мера разброса данных относительно среднего значения.  Если вычисление дисперсии производится вручную, то рекомендуется пользоваться специальной таблицей. Например, необходимо вычислить дисперсию для следующего массива данных {5, 2, 5, 3, 4, 3, 4, 3, 3, 1, 2, 1}. Упорядоченные данные заносятся в таблицу.

Хi

Мx

Хi - Мx

i – Мx)2

1

3

-2

4

1

3

-2

4

2

3

-1

1

2

3

-1

1

3

3

0

0

3

3

0

0

3

3

0

0

3

3

0

0

4

3

1

1

4

3

1

1

5

3

2

4

5

3

2

4

n = 12, Мx = 3

Σ(Хi – Мx)2 = 20

В соответствии с формулой D = 20 / (12 – 1) = 1,818 Стандартное отклонение представляет собой квадратный корень из дисперсии: По ряду причин этот показатель является более удобным чем дисперсия. 

Размах вариации

Размах вариации определяется как абсолютная величина разности между максимальными и минимальными значениями (вариантами) признака:

Размах вариации показывает только крайние отклонения признака и не отражает отдельных отклонений всех вариантов в ряду. Он характеризует пределы изменения варьирующего признака и зависим от колебаний двух крайних вариантов и абсолютно не связан с частотами в вариационном ряду, т. е. с характером распределения, что придает этой величине, случайный характер. Для анализа вариации нужен показатель, который отражает все колебания вариационного признака и даёт общую характеристику. Простейший показатель такого вида - среднее линейное отклонение.

среднее линейное отклонение. Этот показатель характеризует меру разброса значений совокупности данных вокруг их среднего значения. В чем суть? Для того, чтобы показать меру разброса данных нужно вначале определиться, относительно чего этот самый разброс будет считаться. Обычно это средняя величина. Дальше нужно посчитать, насколько значения анализируемой совокупности данных находятся далеко от средней. Понятное дело, что каждому значению соответствует некоторая величина отклонения, но нас же интересует общая оценка, охватывающая всю совокупность. Поэтому рассчитывают среднее отклонение по формуле обычной средней арифметической. Но! Но для того, чтобы рассчитать среднее из отклонений, их нужно вначале сложить. И если мы сложим положительные и отрицательные числа, то они взаимоуничтожатся и их сумма будет стремиться к нулю. Чтобы этого избежать, все отклонения берутся по модулю, то есть все отрицательные числа становятся положительными. Вот теперь среднее отклонение будет показывать обобщенную меру разброса значений. В итоге, средне линейное отклонение будет рассчитываться по формуле:

 

 

где

a – среднее линейное отклонение,

x – анализируемый показатель, с черточкой сверху – среднее значение показателя,

n – количество значений в анализируемой совокупности данных,

оператор суммирования, надеюсь, никого не пугает.

 

Рассчитанное по указанной формуле среднее линейное отклонение отражает среднее абсолютное отклонение от средней величины по данной совокупности. Если прочитать медленно и вдумчиво, то все становится понятно. Формулы, как обычно, могут сбить с толку и потребовать чрезмерного умственного напряжения. Картинки же более наглядны и понятны.

 

 

На картинке красная линия - это среднее значение. Отклонения каждого наблюдения от среднего указаны маленькими стрелочками. Именно они берутся по модулю и суммируются. Потом все делится на количество значений.