Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
ргр анализ данных. Зыкова.doc
Скачиваний:
65
Добавлен:
03.05.2015
Размер:
1.46 Mб
Скачать

1.2 Решение:

1) Построение интервального ряда распределения

Для построения интервального ряда находим максимальный и минимальный элементы исходных данных (функции f(x), где находим макс и мин), количество интервалов с помощью формулы (1):

(1)

Находим размер интервала с помощью формулы (2):

(2)

Получаем следующие данные, представленные в Таблице 1 (округлив, получаем, что количество интервалов приблизительно равно 8):

Таблица 2- Расчет интервалов

max

min

кол-во инт-ов (n)

размер инт-ла(d)

13,92

12,54

7,6

0,2

Находим границы интервалов (a-нижняя граница интервалов; b-верхняя граница интервалов) с помощью формул (3) и (4):

(3)

(4)

И с помощью функции частота находим частоты интервалов mi,накопленные частоты mhi и среднее значение интервала xi.

Находим среднее значение интервала по формуле (5):

(5)

Результаты представлены в Таблице 3.

Таблица 3 – Расчет интервалов и частот

a (нижняя граница интер-а)

b (верх. граница интер-а)

частоты m(i)

накопленные частоты m(hi)

ср. значение интер-а x(i)

12,44

12,64

5

5

12,54

12,64

12,84

12

17

12,74

12,84

13,04

23

40

12,94

13,04

13,24

27

67

13,14

13,24

13,44

19

86

13,34

13,44

13,64

6

92

13,54

13,64

13,84

6

98

13,74

13,84

14,04

2

100

13,94

2) Вычисление выборочных характеристик по вариационному ряду

а) Для нахождения среднего значения выборки интервального ряда необходимо найти сумму произведений mi*xi и сумму mi, а затем их поделить. ∑mi = 100, ∑mi*xi = 10361,5,= 103,515 с помощью формулы (6):

(6)

Получаем Таблицу 4:

Таблица 4 – Расчета средних значений интервалов

a (нижняя граница интер-а)

b (верх. граница интер-а)

частоты m(i)

накопленные частоты m(hi)

ср. значение интер-а x(i)

m(i)*x(i)

12,44

12,64

5

5

12,54

62,7

12,64

12,84

12

17

12,74

152,88

12,84

13,04

23

40

12,94

297,62

13,04

13,24

27

67

13,14

354,78

13,24

13,44

19

86

13,34

253,46

13,44

13,64

6

92

13,54

81,24

13,64

13,84

6

98

13,74

82,44

13,84

14,04

2

100

13,94

27,88

Вычислив среднее арифметическое значение, можно заметить, чтотемпа роста курса акций 100 фирм равен 13,13 %.

Для нахождения центральных моментов необходимо найти

Δi=xi-xср. (7)

Для k=1, = == 0;

Для k=2, = = 0,0979;

Для k=3, = ==0,011178;

Для k=4, = == 0,028116.

Получаем Таблицу 5.

Таблица 5 – Расчет отклонений

Отклонение дельта(i)

дельта(i)*m(i)

дельта(i)^2*m(i)

дельта(i)^3*m(i)

дельта(i)^4*m(i)

-0,59

-2,95

1,7405

-1,02689

0,605868

-0,39

-4,68

1,8252

-0,71183

0,277613

-0,19

-4,37

0,8303

-0,15776

0,029974

0,01

0,27

0,0027

2,7E-05

2,7E-07

0,21

3,99

0,8379

0,175959

0,036951

0,41

2,46

1,0086

0,413526

0,169546

0,61

3,66

2,2326

1,361886

0,83075

0,81

1,62

1,3122

1,062882

0,860934

Сумма

0

9,79

1,1178

2,811637

в) Дисперсия (отклонение от среднего значения) вычисляется по формуле:

(8)

Среднее квадратическое отклонение равно квадратному корню из дисперсии

S= (9)

Оно показывает, насколько сильно результат наблюдений отличается от среднего значения.

Получаем Таблицу 6:

Таблица 6 – Дисперсия и стандартное отклонение

дисперсия

0,0979

ст. отклонение

0,312889757

г) Коэффициент ассиметрии вычисляется по формуле:

= (10)

Он показывает степень скошенности кривой по сравнению с нормальным распределением.

Коэффициент эксцесса вычисляется по формуле:

= (11)

Он служит для характеристики крутости, островершинности, плосковершинности кривой.

Получаем Таблицу 7:

Таблица 7 – Коэффициенты асимметрии и эксцесса

Коэф. ассиметрии

0,364913615

Коэф. эксцесса

-0,066447491

Коэффициент асимметрии равен 0,364913615.. Это свидетельствует о правосторонней асимметрии данного распределения, т.е. более пологий спуск справа.

Коэффициент эксцесса равен -0,066447491. Это значит, что кривая, изображающая ряд распределения, по сравнению с нормальной, имеет незначительную плосковершинность, то есть, имеет более пологую вершину, чем нормальная кривая.

Медиану находим по формуле:

Me=xme+hme* (12)

нижняя граница медианного интервала;

величина медианного интервала;

сумма частот ряда;

сумма накопленных частот в интервалах предшествующих медианному;

частота медианного интервала.

Медианным интервалом является [13.24-13.04]. = 0,2.

Моду находим по значениям максимальной частоты. Максимальная частота 27, интервал [13,24-13,04], мода находится как среднее арифметическое между ними. =.13,14

Получаем Таблицу 8:

Таблица 8 – Значение медианы и моды

Медиана

13,08444

Мода

13,14

Коэффициент вариации показывает, насколько сильно отличается результат конкретного наблюдения от среднего значения в % - ом отношении к среднему. Он находится как отношение среднеквадратического отклонения к среднему арифметическому.

Ѵ=S/X*100% (13)

= 2,4%.

Коэффициент вариации равный 2,4% свидетельствует о небольшом уровне колебаний затрачиваемого времени на аудиторскую проверку 100 предприятий отрасли. Так как коэффициент вариации меньше 33%, следовательно, можно сделать вывод о том, что совокупность является однородной.

3) Построение графиков гистограммы, полигона и кумуляты

Чтобы построить гистограмму, надо по горизонтальной оси отложить значения интервалов, а по вертикальной оси частоту встречаемости этих значений. Высоты прямоугольников соответствуют частотам значений, построенных на соответствующих интервалах. Самый высокий столбик показывает наиболее часто встречающиеся значения, самый низкий – реже всех встречающиеся значения.

Гистограмма показывает типичные значения, особые значения, концентрацию значения и характер данных, наличие данных в определенных группах.

Рисунок 1 - Гистограмма затрачиваемого времени на аудиторскую проверку 100 предприятий отрасли

Чтобы построить кумуляту, надо по оси OX отложить варианты ряда, по оси OY - накопленные частоты. Это представится в виде перпендикуляров к оси OX, изображаемых ломаной линией и будет характеризовать процесс концентрации изучаемого явления.

Рисунок 2 - Кумулята затрачиваемого времени на аудиторскую проверку 100 предприятий отрасли

Полигон используется при изображении дискретных вариационных рядов или интервальных по серединным значениям.

Рисунок 3 - Полигон затрачиваемого времени на аудиторскую проверку 100 предприятий отрасли