Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Лабораторная работа_1_2.doc
Скачиваний:
6
Добавлен:
25.04.2019
Размер:
1.87 Mб
Скачать

Расчет описательных статистик с использованием электронных таблиц ms Excel

Цель работы: Получить навыки расчета статистических параметров в среде электронных таблиц MS Excel.

Задачи работы: Изучить основные статистики и модели их расчета. Изучить основные статистические функции, позволяющие рассчитывать параметры статистического распределения с помощью электронных таблиц Excel. По данным выборочной совокупности рассчитать параметры выборки с использованием Excel.

Теоретические сведения

Оперирование с полным набором значений признаков, как правило, является затруднительным. Графическое представление распределения частот еще не дает полную картину об исследуемом процессе. Поэтому вводятся другие величины, которые отражают среднее значение признака, его размах, отклонение от среднего и т.д. Такими основными описательными статистиками являются следующие параметры.

  1. Среднее

Средняя не может заменить полностью ряд, но может дать информацию о типичном значении признака в данных условиях. Средняя характеризует уровень ряда, его центральную тенденцию, т.е. показывает «центральное» положение признака (переменной).

Для того, чтобы средняя величина действительно была обобщающей характеристикой, показывающей общую закономерность, она должна применяться к достаточно однородной совокупности (например, понятие средней температуры больных по всем больницам не дает полное представление об их состоянии здоровья: средняя температура может быть и 37,6, что соответствует норме, хотя часть людей могут иметь температуру по 40, а часть ниже 36). Поэтому, вычислению средних должно предшествовать обоснованное выделение в изучаемой совокупности достаточно однородных групп.

Средняя бывает генеральной и выборочной, т.е. оценена на основе всей генеральной совокупности или выборочной соответственно.

Генеральной средней называют среднее арифметическое значений признака генеральной совокупности. Если все значения признака генеральной совокупности объема различны, то

,

Если же значения признака имеют соответственно частоты , при чем , то

где - количество выделенных интервалов.

Если значение признака рассматривать как случайную величину, то среднее генеральной совокупности будет равно математическому ожиданию признака, т.е. .

Выборочной средней называют среднее арифметическое значение признака выборочной совокупности.

Если все значения признака выборки объема различны, то

.

Если же значения признака имеют соответственно частоты , при чем , то

Выборочное среднее является случайной величиной и можно говорить о математическом ожидании и дисперсии выборочной средней. Выборочная средняя будет меняться от выборки к выборки и не будет в общем случае равна генеральной средней.

В MS Excel существуют следующие функции для расчета средней:

СРЗНАЧ - Возвращает среднее (арифметическое) своих аргументов.

Синтаксис

СРЗНАЧ(число1; число2; ...)

Число1, число2, ...    — это от 1 до 30 аргументов, для которых вычисляется среднее.

СРЗНАЧА - Вычисляет среднее арифметическое значений, заданных в списке аргументов. Помимо чисел в расчете могут участвовать текст и логические значения, такие как ИСТИНА и ЛОЖЬ. Аргументы, содержащие значение ИСТИНА, интерпретируются как 1. Аргументы, содержащие значение ЛОЖЬ, интерпретируются как 0 (ноль).

Синтаксис

СРЗНАЧА(значение1; значение2;...)

Значение1, значение2,...     — это от 1 до 30 ячеек, интервалов ячеек или значений, для которых вычисляется среднее.

  1. Мода

Модой называют варианту (значение признака), которая имеет наибольшую частоту, т.е. признак является наиболее часто встречающимся.

Например, для ряда:

Варианта (значение признака),

1

2

8

10

Частота,

6

3

21

15

мода =8.

Свойства моды:

1. В случае, когда все значения признака ряда встречаются одинаково (т.е. имеют одинаковую частоту), то в ряде оценок нет моды. Например, для ряда:

Варианта (значение признака),

1

2

8

10

Частота,

5

5

5

5

мода не определена.

2. Когда два соседних признака имеют одинаковую частоту и они больше частоты любого другого значения, то мода есть среднее этих двух значений. Например, для ряда:

Варианта (значение признака),

1

2

4

6

8

10

Частота,

6

3

9

9

7

8

мода будет равна 5.

3. Если два несмежных значения ряда имеют равные частоты и они больше частот любого значения, то существует две моды (бимодальное распределение). Например, ряд:

Варианта (значение признака),

1

2

4

6

8

9

10

Частота,

6

10

7

5

10

8

3

имеет две моды: и .

В ряде может быть и более двух мод.

Если ряд является интервальным, то интервал с наибольшей частотой при равных интервалах (или с наибольшей плотностью при неравных) и есть модельным. Для вычисления моды интервального ряда можно воспользоваться следующей формулой:

,

где - значение признака начала -го интервала (модального); - ширина (разряд) -го интервала; - частота наблюдений -го интервала ( ).

В MS Excel мода рассчитывается с помощью следующей функции:

МОДА - Возвращает наиболее часто встречающееся или повторяющееся значение в массиве или интервале данных. Если множество данных не содержит одинаковых данных, то функция МОДА возвращает значение ошибки #Н/Д.

Синтаксис

МОДА(число1;число2; ...)

Число1, число2,...     — от 1 до 30 аргументов, для которых вычисляется мода. Можно использовать один массив или одну ссылку на массив вместо аргументов, разделяемых точкой с запятой.