
- •Использование электронных таблиц Excel для вычисления выборочных характеристик данных
- •1 Характеристика пакета Excel
- •2 Использование специальных функций
- •3. Использование инструмента Пакет анализа
- •Построение гистограмм
- •По правилам таблицы Excel правое значение интервала (кармана) входит в данный интервал (карман).
- •N.B!!! Если в вашей таблице значений, введенных в Excel, нет заголовка у переменной, то Метки ставить не нужно!
- •Задачи для самостоятельной работы
Использование электронных таблиц Excel для вычисления выборочных характеристик данных
1 Характеристика пакета Excel
Пакет Excel оснащен средствами статистической обработки данных. И хотя Excel существенно уступает специализированным статистическим пакетам обработки данных, тем не менее, этот раздел математики представлен в Excel наиболее полно. В него включены основные, наиболее часто используемые статистические процедуры: средства описательной статистики, критерии различия, корреляционные и другие методы, позволяющие проводить необходимый статистический анализ экономических, психологических, педагогических и медико-биологических типов данных.
При рассмотрении применения методов обработки статистических данных в данной лабораторной работе ограничимся только простейшими и наиболее часто описательными статистиками, реализованными в мастере функций Excel.
2 Использование специальных функций
В мастере функций Excel имеется ряд специальных функций, предназначенных для вычисления выборочных характеристик.
Функция СРЗНАЧ вычисляет среднее арифметическое из нескольких массивов (аргументов) чисел. Аргументы число1, число2, ... — это от 1 до 30 массивов для которых вычисляется среднее.
Функция МЕДИАНА позволяет получать медиану заданной выборки. Медиана - это элемент выборки, число элементов выборки со значениями больше которого и меньше которого равно.
Функция МОДА вычисляет наиболее часто встречающееся значение в выборке.
Функция ДИСП позволяет оценить дисперсию по выборочным данным.
Функция СТАНДОТКЛОН вычисляет стандартное отклонение.
Функция ЭКСЦЕСС вычисляет оценку эксцесса по выборочным данным.
Функция СКОС позволяет оценить асимметрию выборочного распределения.
Функция КВАРТИЛЬ вычисляет квартили распределения. Функция имеет формат КВАРТИЛЬ(массив, значение), где массив – интервал ячеек, содержащих значения СВ; значение определяет какая квартиль должна быть найдена (0 – минимальное значение, 1 – нижняя квартиль, 2 – медиана, 3 – верхняя квартиль, 4 – максимальное значение распределения).
3. Использование инструмента Пакет анализа
В пакете Excel помимо мастера функций имеется набор более мощных инструментов для работы с несколькими выборками и углубленного анализа данных, называемый Пакет анализа, который может быть использован для решения задач статистической обработки выборочных данных.
Для установки пакета Анализ данных в Excel сделайте следующее:
- в меню Сервис выберите команду Надстройки;
- в появившемся списке установите флажок Пакет анализа.
Пример
Дан ряд значений содержания гормона в крови обезьян 2,5; 2,4; 2,5; 2,6; 2,5; 2,7; 2,5; 2,4; 2,4; 2,5; 2,6; 2,6; 2,6; 2,5; 2,7; 2,5; 2,5; 2,5; 2,6; 2,4; 2,3; 2,4; 2,6; 2,7; 2,4; 2,3; 2,6; 2,5; 2,4; 2,6. Необходимо найти выборочные характеристики (среднее значение, медиану, стандартное отклонение, стандартную ошибку, моду и квартили), оценить нормальность распределения и построить гистограмму по этим данным с помощью пакета анализа.
Для выполнения элементарной статистической обработки в Операционном меню выберите Сервис-Анализ данных; в появившемся списке Инструменты анализа нажмите на строку Описательная статистика и нажмите кнопку ОК;
В появившемся диалоговом окне (Рис. 1) укажите входной диапазон, т. е. введите ссылку на ячейки, содержащие анализируемые данные А1:A30;
Укажите выходной диапазон, т. е. ссылку на ячейку С1, в которую будут выведены результаты анализа ячейку. Для этого следует поставить переключатель в положение Выходной диапазон;
В разделе Группировка переключатель установите в положение по столбцам;
Установите флажок в поле Итоговая статистика;
В поле Уровень надежности, укажите вероятность 95% (данный флажок позволит нам определить полуширину доверительного интервала для заданной доверительной вероятности) и нажмите кнопку ОК;
N.B!!! Если в вашей таблице значений, введенных в Excel, есть заголовки у переменной, то нужно поставить метки!
Рис.1
Из таблицы видно, что параметры Эксцесс и Асимметричность оба отрицательны, но близки к нулю. Это означает, что распределение близко к нормальному, но немного полого в вершине и слева. Далее постройте гистограмму, используя некоторые параметры Описательной статистики. Для этого необходимо весь ряд значений разбить на интервалы (или карманы, данный термин используется в таблице Excel).
Квартили найдите с помощью функции КВАРТИЛЬ. Функция имеет формат КВАРТИЛЬ(массив, значение), где массив – интервал ячеек, содержащих значения СВ; значение определяет какая квартиль должна быть найдена (0 – минимальное значение, 1 – нижняя квартиль, 2 – медиана, 3 – верхняя квартиль, 4 – максимальное значение распределения
Столбец1 |
|
|
|
Среднее |
2,516667 |
Стандартная ошибка |
0,020389 |
Медиана |
2,5 |
Мода |
2,6 |
Стандартное отклонение |
0,111675 |
Дисперсия выборки |
0,012471 |
Эксцесс |
-0,72548 |
Асимметричность |
-0,19159 |
Интервал |
0,4 |
Минимум |
2,3 |
Максимум |
2,7 |
Сумма |
75,5 |
Счет |
30 |
1 квартиль |
2,4 |
2 квартиль |
2,5 |
3 квартиль |
2,6 |
|
|
Для построения полигона постройте дискретный вариационный ряд. Для этого нажмите на инструмент Сортировка по возрастанию и сосчитайте, сколько раз встречается та или иная величина.
-
Содержание
2,3
2,4
2,5
2,6
2,7
mi
2
7
10
8
3
Введите данные в Excel и с помощью мастера диаграмм постройте полигон частот.