Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
5361.pdf
Скачиваний:
3
Добавлен:
13.11.2022
Размер:
1.29 Mб
Скачать

Рис. 6. Описательные статистики и гистограмма для примера

Итак, средний срок оборота наличных средств для этих 39 фирм равен 20 дням, хотя медиана, равная 14, показывает, что у половины фирм (у 18-ти) срок оборота не превышает 14 дней, а наиболее часто встречается величина, равная 10, на что указывает мода.

Данный пример показывает, что использование средней арифметической для характеристики несимметричных распределений может привести к смещенным результатам. Известно, что средняя арифметическая и стандартное отклонение могут эффективно использоваться только для нормально распределенных совокупностей, а в нашем случае распределение далеко от нормального.

Нижний квартиль (Q1 = 10) указывает, что у 25 % фирм срок оборота наличных средств не превышает 10 дней, а для 75 % фирм этот срок не превышает 28 дней

(Q3=28).

Положительная асимметрия (Sk=1,56) указывает на более тяжелый правый хвост распределения, а положительный эксцесс (К = 2,006) – на распределение, с более острой вершиной, чем у нормального, однако за счет значительного скоса

распределения стандартное отклонение для него сравнимо со средним значением ( х = 20,13, S = 15,77), что свидетельствует о неоднородности выборки. Этот же вывод можно сделать и на основе значения коэффициента вариации (V = 78,36 %). Неоднородность наблюдений скорее всего можно объяснить наличием в ней трех фирм со сроком оборота, превышающим 50 дней (находящихся в правом хвосте распределения) (см. рис. 6).

Отметим здесь еще один метод визуального отражения информации, позволяющий облегчить предварительный анализ исходной информации. В последнее время при компьютерных расчетах он стал чаще использоваться в практических приложениях в силу своей простоты. Речь идет о так называемых ящичковых диаграммах или о процедуре “ящик-с-усами”. Приведем ее для нашего примера.

Рис. 7 Диаграмма “ящик-с-усами”

Структура такой диаграммы зависит от конкретных статистических ППП и от установок в них. Наиболее часто, как и на рис. 7, высота “ящика” равна межквартильному размаху, нижняя точка внутри “ящика” соответствует медиане, а крестик – среднему значению. “Усы” соответствуют крайним значениям, если эти значения не выходят за пределы допустимых, в противном случае крайние значения признаются “грубыми ошибками” или “выбросами” и отмечаются точками за пределами “усов”. В нашем случае два крайних значения признаны выбросами и отмечены отдельно в верхней части диаграммы. Более длинный верхний “ус” и

смещение медианы вниз от центра “ящика” свидетельствуют о более длинном правом хвосте распределения (мысленно разверните рис 7., чтобы выбросы и длинный хвост оказались справа).

Иногда предварительным анализом исследование исходной информации и заканчивается, потому здесь ему и уделено столько внимания. В заключении рассмотрения описательной статистики остановимся еще раз на том что, вычисление среднего, дисперсии и стандартного отклонения предполагает нормальный закон распределения, в противном случае использование этих характеристик не совсем оправдано.

Однако зачастую преобразование исходной информации позволяет исправить ее так, что после этого отпадают сомнения в правомерности использования положений нормального закона распределения. Известно, например, что скошенные вправо распределения могут стать симметричными после их логарифмирования.

Процедуры преобразования данных предусмотрены во всех статистических ППП. Например, в ППП Statgraphics это можно сделать следующим образом. В процедуре анализа, например, одной переменной (см. рис. 8) в диалоговом окне перед указанием имени анализируемой переменной необходимо щелкнуть по клавише “transform - преобразовать”.

Рис. 8. Диалоговое окно анализа одной переменной

и в появившемся диалоговом окне генерации (создания) данных, в правом поле “операторы”, необходимо выбрать тип преобразования (на рис. 9 выбран оператор логарифмирования) и двойным щелчком перенести этот оператор в поле для выражения “Expression”, затем, поместив курсор в скобки оператора и предварительно убрав знак вопроса, двойным щелчком по выбранной переменной переместить ее имя в скобки оператора. Получим как на рис. 9

Рис. 9. Диалоговое окно создания новой переменной

Щелкнув по кнопке “OK”, помещаем созданную переменную в поле ввода требуемой процедуры. Выполнив анализ новой переменной, получим:

Рис. 10. Описательные статистики и гистограмма для преобразованной переменной

Как видно, данные стали более симметричными: среднее, медиана и мода выравнялись. Коэффициенты асимметрии и эксцесса указывают на меньшее отклонение от нормального закона распределения. Данные стали более однородными (V =26 %), и с ними можно работать в предположении нормального закона распределения.

Контрольные вопросы и упражнения

1.Как определяются число интервалов и их длина при построении ряда распределения?

2.В чем различие данных с симметричным распределением и с более длинным правым «хвостом»?

3.В чем различие данных с симметричным распределением и с более длинным левым «хвостом»?

4.В каком случае рекомендуется пользоваться иной характеристикой центра распределения, чем средняя арифметическая и почему?

5.В чем сходство и различие стандартного отклонения и коэффициента вариации?

6.Каков смысл межквартильного размаха?

7.С какой целью преобразуются данные перед их статистическим анализом?

Выполнить следующие задания

Пример 1. Пусть имеются данные опроса 50 человек, работающих на трех разных предприятиях. Приведем ответы на три вопроса: о степени удовлетво-ренности работой, зарплатой и продвижением по служебе(карьерой) в баллах от нуля до 100 (чем больше степень удовлетворенности, тем больше балл). Кроме того, укажем тип предприятия. Данные следующие.

работа зарпл. карьера тип

работа

зарпл.

карьера

тип

71

49

58

1

72

76

37

1

84

53

63

2

71

25

74

3

84

74

37

1

69

47

16

2

87

66

49

2

90

56

23

2

72

59

79

2

84

28

62

3

72

37

86

1

86

37

59

1

72

57

40

3

70

38

54

3

63

48

78

1

86

72

72

1

84

60

29

1

87

51

57

3

90

62

66

3

77

90

51

2

73

56

55

1

71

36

55

2

94

60

52

1

75

53

92

2

84

42

66

3

74

59

82

3

85

56

64

3

76

51

54

2

88

55

52

2

95

66

52

1

74

70

51

2

89

66

62

3

71

45

68

3

85

57

67

3

88

49

42

3

65

42

68

1

90

27

67

1

82

37

54

1

85

89

46

2

82

60

56

1

79

59

41

2

89

80

64

2

72

60

45

3

74

47

63

3

88

36

47

3

82

49

91

3

77

60

75

3

90

76

70

1

64

43

61

3

78

52

72

1

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]