Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Теория к экзамену по Анализу данных.docx
Скачиваний:
29
Добавлен:
31.03.2020
Размер:
993.01 Кб
Скачать

2. Вариационные ряды и их графическое отображение.

Вариационный ряд-это таблица из 2-х строк, в первой из которых указывается в порядке возрастания различные значения исследуемого признака (варианта признака), а во 2-ой-частота появления этого признака.

хi

Х1

Х2

хn

ni

n1

n2

nk

Условие nk=n, где n-объем статистических данных.

Вариационный ряд можно представить в виде гистограммы, полигона распределения и кумулятивной прямой.

Полигон распределения-это ломанная, вершина которой соот-ет точкам с координатами (xi,ni), где xi-варианты признака, ni-частота признака.

Гистограмма распределения – ступенчатая фигура, состоящая из прямоугольников с основаниями, равными h(шаг гистограммы) и высотой ni (частота) или ni/n (относительная частота). Гистограмма распределения используется для графического изображения интервального вариационного ряда.

Для построения гистограммы распределения дискретного вариационного ряда необходимо:

  1. Определить число интервалов гистограммы

m=1+3,322lg(n) – формула Стреджеса.

  1. Определить частоту признаков в каждом интервале

m– число элементов, оказавшихся в i-том интервале гистограмме

  1. Определить высоту каждого интервала гистограммы mi(mi/n)

По гистограмме распределения можно получить первое представление о виде ЗР исследуемого признака (СВ).

Кумулятивная прямая- это кривая накопленных частот. Накопленная частота niнак показывает сколько наблюдалось возможных значений признака меньших некоторого х

Wiнак=niнак/n

Для дискретного вариационного ряда кумулятивная прямая представляет собой ломанную, соединяющую Для интервального вариационного ряда кумулятивная прямая начинается с точки (х0;0), где х0-наименьшие возможные значения признака. Последующие точки соответствуют координатам конца интервалов.

  1. Выборочное среднее и выборочная дисперсия. Мода и медиана.

Мода (Мо) – это такое значение варианты, что предшествующее и следующее за ним значения имеют меньшие частоты встречаемости.

Для одномодальных распределений мода – это наиболее часто встречающаяся варианта в данной совокупности.

Для определения моды интервальных рядов служит формула:

M0=xниж+i*((n2-n1)/(2n2-n1+n3)),

где хниж – нижняя граница модального класса, т.е. класса с наибольшей частотой встречаемости n2; n2– частота модального класса; n1 – частота класса, предшествующего модальному; n3 – частота класса, следующего за модальным; i – ширина классового интервала.

Медиана (Ме)- это значение признака. Относительно которого ряд распределения делится на 2 равные по объему части.

Выборочная средняя – это среднее арифметическое значение вариант статистического ряда

Выборочная дисперсия – среднее арифметическое квадратов отклонения вариант от их среднего значения:

  1. Показатели вариации.

Вариация — это различия индивидуальных значений признака у единиц изучаемой совокупности. Исследование вариации имеет большое практическое значение и является необходимым звеном в экономическом анализе. Необходимость изучения вариации связана с тем, что средняя, являясь равнодействующей, выполняет свою основную задачу с разной степенью точности: чем меньше различия индивидуальных значений признака, подлежащих осреднению, тем однороднее совокупность, а, следовательно, точнее и надежнее средняя, и наоборот. Следовательно по степени вариации можно судить о границах вариации признака, однородности совокупности по данному признаку, типичности средней, взаимосвязи факторов, определяющих вариацию.

Изменение вариации признака в совокупности осуществляется с помощью абсолютных и относительных показателей.

Абсолютные показатели вариации включают:

  • размах вариации 

  • среднее линейное отклонение 

  • дисперсию 

  • среднее квадратическое отклонение 

Размах вариации — это разность между максимальным и минимальным значениями признака

Среднее линейное отклонение  — это средняя арифметическая из абсолютных отклонений отдельных значений признака от средней.

Соседние файлы в предмете Анализ данных