Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

Статистические функции Excel

.doc
Скачиваний:
71
Добавлен:
26.02.2016
Размер:
38.91 Кб
Скачать

Статистика в Excel

1. Общие сведения

Microsoft Excel предоставляет широкие возможности для анализа статистических данных. В статистике совокупность результатов измерений называют распределением. Microsoft Excel дает возможность анализировать распределения, используя встроенные статистические функции, функции анализа выборки и генеральной совокупности и другие инструменты.

2. Основные встроенные статистические функции

Функция СРЗНАЧ() вычисляет среднее арифметическое или просто среднее для последовательности чисел: суммируются числовые значения в интервале ячеек и результат делится на количество этих значений. Эта функция игнорирует пустые, логические и текстовые ячейки.

Функция МЕДИАНА() вычисляет медиану множества чисел. Медиана – это число, являющееся серединой множества: количества чисел, меньшие и большие медианы, равны. Если количество чисел или ячеек четное, то результатом будет среднее двух чисел в середине множества.

Функция МОДА() вычисляет наиболее часто встречающееся значение во множестве чисел.

Функция МАКС() вычисляет наибольшее значение среди заданных чисел.

Функция МИН() вычисляет минимальное значение среди заданных чисел.

Функция СУММПРОИЗВ() вычисляет сумму произведений соответствующих членов двух и более массивов-аргументов (но не более 30 аргументов). Встречающиеся в аргументах нечисловые значения интерпретируются нулями.

Функция СУММКВ() вычисляет сумму квадратов аргументов.

3. Анализ выборки и генеральной совокупности

Дисперсия и стандартное отклонение – это статистические характеристики распределения наборов или генеральной совокупности данных. Стандартное отклонение определяется как квадратный корень из дисперсии. Как правило, около 68% данных генеральной совокупности с нормальным распределением находится в пределах одного стандартного отклонения и около 95% – в пределах двух стандартных отклонений. При большой величине стандартного отклонения данные широко разбросаны относительно среднего значения, а при маленькой – они группируются близко к среднему значению.

Четыре статистические функции ДИСП(), ДИСПР(), СТАНДОТКЛОН() и СТАНДОТКЛОНП() – предназначены для вычисления дисперсии и стандартного отклонения чисел в интервале ячеек. Перед тем как вычислять дисперсию и стандартное отклонение набора данных, нужно определить, представляют ли эти данные генеральную совокупность или выборку из генеральной совокупности. В случае выборки из генеральной совокупности следует использовать функции ДИСП() и СТАНДОТКЛОН(), а в случае генеральной совокупности – функции ДИСПР() и СТАНДОТЛОНП().

Функция СУММСУММКВ() вычисляет сумму сумм квадратов соответствующих элементов в массивах.

Функция СУММКВРАЗН() вычисляет сумму квадратов разности соответствующих элементов в массивах.

4. Использование статистических функций при решении задач

1) В задачах с дискретными таблицами частот можно использовать следующие математические функции:

СУММ(диапазон ni) – для нахождения объёма выборки n как суммы частот ni (или объёма генеральной совокупности N как суммы частот Ni);

СУММПРОИЗВ(диапазон xi;диапазон ni) – для нахождения выборочной средней xв (или аналогично генеральной средней xГ);

СУММПРОИЗВ((диапазон xi - xв)^2; диапазон ni) – для нахождения выборочной дисперсии Dв (или аналогично генеральной дисперсии DГ).

2) В задачах, где все значения вариант xi находятся в отдельных ячейках, можно использовать статистические функции:

СЧЁТ(диапазон данных) – для нахождения объёма выборки n (или объёма генеральной совокупности N) как подсчёта всех непустых ячеек;

СЧЁТЕСЛИ(диапазон данных;варианта xi) – для нахождения частоты ni данной варианты в исходном диапазоне при построении дискретной таблицы частот;

СЧЁТЕСЛИМН(диапазон данных;условие 1; диапазон данных;условие 2) – для нахождения суммы частот вариант, попавших в заданный интервал, при построении интервальной таблицы частот; например, для подсчёта числа вариант, попавших в интервал (5,5 – 6], функция будет выглядеть так: =СЧЁТЕСЛИМН(диапазон данных;">5,5"; диапазон данных;"<=6");

СРЗНАЧ(диапазон данных) – для нахождения выборочной или генеральной средней (xв или xГ);

ДИСП(диапазон данных) – для нахождения выборочной дисперсии Dв;

ДИСПР(диапазон данных) – для нахождения генеральной дисперсии DГ;

СТАНДОТКЛОН(диапазон данных) – для нахождения выборочного среднего квадратического отклонения (выборочного стандарта) σв;

СТАНДОТКЛОНП(диапазон данных) – для нахождения генерального среднего квадратического отклонения (генерального стандарта) σГ;

МАКС(диапазон данных)-МИН(диапазон данных) – для нахождения размаха совокупности R;

МЕДИАНА(диапазон данных) – для нахождения медианы;

МОДА(диапазон данных) – для нахождения моды (при этом в случае, когда все данные совокупности различны, то в результате будет выдана ошибка #Н/Д, которая в данном случае означает, что совокупность не имеет моды; а если совокупность мультимодальна, т.е. имеет несколько значений, встречающихся одинаковое максимальное число раз, то ответом данной функции будет первое из таких значений).