Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Вычисление статистических характеристик.doc
Скачиваний:
1
Добавлен:
01.07.2025
Размер:
310.78 Кб
Скачать

Вычисление статистических характеристик в программе Microsoft Excel

В состав Microsoft Excel входит пакет анализа данных, предназначенный для решения сложных статистических и инженерных задач. В пакете представлено большое число статистических функций, обозначение и назначение которых приведено ниже:

СРОТКЛ

Вычисляет среднее абсолютных значений отклонений точек данных от среднего.

СРЗНАЧ

Вычисляет среднее (арифметическое) своих аргументов.

СРЗНАЧА

Вычисляет среднее (арифметическое) своих аргументов, включая числа, текст и логические значения.

ДОВЕРИТ

Вычисляет доверительный интервал для среднего генеральной совокупности.

КОРРЕЛ

Вычисляет коэффициент корреляции между двумя множествами данных.

СЧЁТ

Подсчитывает количество чисел в списке аргументов.

СЧЁТЗ

Подсчитывает количество значений в списке аргументов.

КОВАР

Вычисляет ковариацию, среднее попарных произведений отклонений.

КВАДРОТКЛ

Вычисляет сумму квадратов отклонений.

ЭКСПРАСП

Вычисляет экспоненциальное распределение.

ПРЕДСКАЗ

Вычисляет значение линейного тренда.

ЧАСТОТА

Вычисляет распределение частот в виде вертикального массива.

ФТЕСТ

Вычисляет результат F-теста.

СРГЕОМ

Вычисляет среднее геометрическое.

ОТРЕЗОК

Вычисляет отрезок, отсекаемый на оси линией линейной регрессии.

ЭКСЦЕСС

Вычисляет эксцесс множества данных.

НАИБОЛЬШИЙ

Вычисляет k-ое наибольшее значение из множества данных.

ЛИНЕЙН

Вычисляет параметры линейного тренда.

МАКС

Вычисляет максимальное значение из списка аргументов.

МАКСА

Вычисляет максимальное значение из списка аргументов, включая числа, текст и логические значения.

МЕДИАНА

Вычисляет медиану заданных чисел.

МИН

Вычисляет минимальное значение из списка аргументов.

МИНА

Вычисляет минимальное значение из списка аргументов, включая числа, текст и логические значения.

МОДА

Вычисляет значение моды множества данных.

НОРМРАСП

Вычисляет нормальную функцию распределения.

НОРМОБР

Вычисляет обратное нормальное распределение.

НОРМСТРАСП

Вычисляет стандартное нормальное интегральное распределение.

НОРМСТОБР

Вычисляет обратное значение стандартного нормального распределения.

ПИРСОН

Вычисляет коэффициент корреляции Пирсона.

ПЕРСЕНТИЛЬ

Вычисляет k-ую персентиль для значений из интервала.

ПРОЦЕНТРАНГ

Вычисляет процентную норму значения в множестве данных.

ВЕРОЯТНОСТЬ

Вычисляет вероятность того, что значение из интервала находится внутри заданных пределов.

КВАРТИЛЬ

Вычисляет квартиль множества данных.

СКОС

Вычисляет асимметрию распределения.

НАКЛОН

Вычисляет наклон линии линейной регрессии.

НАИМЕНЬШИЙ

Вычисляет k-ое наименьшее значение в множестве данных.

НОРМАЛИЗАЦИЯ

Вычисляет нормализованное значение.

СТАНДОТКЛОН

Оценивает стандартное отклонение по выборке.

СТАНДОТКЛОНА

Оценивает стандартное отклонение по выборке, включая числа, текст и логические значения.

СТАНДОТКЛОНП

Вычисляет стандартное отклонение по генеральной совокупности.

СТАНДОТКЛОНПА

Вычисляет стандартное отклонение по генеральной совокупности, включая числа, текст и логические значения.

СТОШYX

Вычисляет стандартную ошибку предсказанных значений y для каждого значения x в регрессии.

СТЬЮДРАСП

Вычисляет t-распределение Стьюдента.

СТЬЮДРАСПОБР

Вычисляет обратное t-распределение Стьюдента.

ТТЕСТ

Вычисляет вероятность, связанную с t-условием Стьюдента.

ДИСП

Оценивает дисперсию по выборке.

ДИСПА

Оценивает дисперсию по выборке, включая числа, текст и логические значения.

ДИСПР

Вычисляет дисперсию для генеральной совокупности.

ДИСПРА

Вычисляет дисперсию для генеральной совокупности, включая числа, текст и логические значения.

Некоторые из указанных функций являются встроенными, другие доступны только после установки пакета анализа. Для установки пакета анализа (если нет строки Анализ данных в меню Сервис) необходимо в меню Сервис загрузить Надстройки и напротив Пакет анализа поставить флажок.

Для анализа данных с помощью статистических функций следует выбрать пустую ячейку для записи результата расчета (например, нижнюю ячейку анализируемого столбца в электронной таблице), в командной строке набрать знак “=”, далее написать заглавными буквами наименование функции, в скобках после наименования функции указать аргументы функции (числа, ссылки на ячейки, имена, текст) и нажать клавишу Enter. Анализ будет выполнен с помощью подходящей статистической или инженерной макрофункции, а результат будет помещен в выбранную пустую ячейку. Статистические функции наиболее удобно вычислять для больших массивов, сведенных в таблицы. Для распространения результатов расчета функции на анализируемые столбцы или строки таблицы полученный результат в выделенной ячейке тянут мышкой вдоль строки или столбца электронной таблицы.

Примеры написания функций (синтаксис):

=КВАДРОТКЛ (4;5;8;7;11;4;3);

=КВАДРОТКЛ (А1:А7).

При написании формул придерживаются следующих правил. В формулах приводят только парное количество скобок, каждая скобка является частью пары открывающей и закрывающей скобок.   При указании ссылки на диапазон ячеек используют двоеточие (:) в качестве разделителя между первой и последней ячейками диапазона. Допускается вложение в строку формул не более семи функций.  Если формула содержит ссылки на значения ячеек других листов или книг, а имя другой книги или листа содержит небуквенные знаки, это имя необходимо заключить в апострофы ('). Не задают формат для чисел, вводимых в формулы. Функции анализа данных можно применять только на одном листе. Если анализ данных проводится в группе, состоящей из нескольких листов, то результаты будут выведены на первом листе, на остальных листах будут выведены пустые диапазоны, содержащие только форматы. Чтобы провести анализ данных на всех листах, повторяют процедуру для каждого листа в отдельности.

Ниже приведены примеры написания и расчета наиболее часто используемых статистических функций.

Среднеарифметическое значение

Расчетная формула:

Пример написания формулы (синтаксис): =СРЗНАЧ (число 1;, число 2;…). В качестве аргумента функции могут быть числа, ссылки на ячейки, имена, текст.

Пример 1: Для таблицы экспериментальных данных, приведенной ниже и занимающей ячейки в электронной таблице в диапазоне А2:F9, вычислить среднеарифметические значения для каждого из столбцов.

Обозначение ячеек

A

B

C

D

E

F

1

Температура оС

Концентрация, %

Соотношение реагентов

Расход газа, м3

Давление газа, Мпа

Степень превращения, доли

2

350

10

1

1000

25

0,82

3

349

8

1,2

1100

24

0,81

4

360

14

1,1

1050

24,5

0,87

5

355

11,5

0,9

980

25,6

0,85

6

357

11,6

0,85

990

23,5

0,86

7

358

11,7

1,05

1020

25,1

0,865

8

351

10,2

1,21

1010

25,4

0,815

9

356

11,6

0,99

1070

24,6

0,855

10

В соответствии с правилами, изложенными выше, выберем ниже первого столбца пустую ячейку А10 и запишем в строку формулу:

= СРЗНАЧ(А2:А9).

После нажатия Enter, в ячейке А10 появится результат расчета. Щелкнем мышью на ячейке А10 и при нажатой левой клавише за правый нижний уголок ячейки (квадратик) протащим по строке А10-F10 мышь. В 10-й строке таблицы (ячейках А10-F10) появятся вычисленные средние значения, приведенные ниже.

Обозначение ячеек

A

B

C

D

E

F

10

354,5

11,075

1,0375

1027,5

24,7125

0,843125

Среднеквадратичное отклонение (стандартное отклонение)

Расчетная формула:

Синтаксис:=СТАНДОТКЛОН (число 1; число2; …)

В качестве аргументов можно использовать массив или ссылку на массив.

Пример 2: для таблицы экспериментальных данных, приведенной в примере 1 (выше), и занимающей ячейки в электронной таблице в диапазоне А2:F9, вычислить среднеквадратичные отклонения для каждого из столбцов.

Для этого в выберем ниже первого столбца пустую ячейку А11 и запишем в строку формулу: :=СТАНДОТКЛОН (А2:А9).

После нажатия Enter, в ячейке А11 появится результат расчета. Щелкнем мышью на ячейке А10 и при нажатой левой клавише за правый нижний уголок ячейки (квадратик) протащим по строке А11-F11 мышь. В 11-й строке таблицы (ячейках А11-F11) появятся вычисленные среднеквадратичные отклонения от среднего, приведенные ниже.

Обозначение ячеек

A

B

C

D

E

F

11

4,035556

1,734317

0,129808

42,0034

0,710005

0,024192

Дисперсия выборки

Расчетная формула:

Sy2

Синтаксис: =ДИСП(число1; число 2; ..)

Пример 3: для таблицы экспериментальных данных, приведенной в примере 1 (выше), и занимающей ячейки в электронной таблице в диапазоне А2:F9, вычислить дисперсии для каждого из столбцов.

Для этого произведем операции аналогичные в примере 1, с тем отличием, что в ячейку А12 формул запишем: =ДИСП(А2:А9). Результаты расчета дисперсий приведены в 12-й строке ниже.

Обозначение ячеек

A

B

C

D

E

F

12

16,28571

3,007857

0,01685

1764,286

0,504107

0,000585

Сумма квадратов отклонений от среднего

Расчетная формула:

Синтаксис: =КВАДРОТКЛ (число 1; число2; ..)

Пример 4: Для выборки чисел {4;5;8;7;11;4;3} вычислить сумму квадратов отклонений от среднего.

В пустой ячейке электронной таблицы напишем: =КВАДРОТКЛ (4;5;8;7;11;4;3). После введения Enter получим в этой ячейке результат: 48.

Медиана – среднее значение в распределении, соответствующее У на половинном значении площади под кривой распределения. Если построен вариационный ряд, то медианное значение соответствует середине множества чисел. Т.е. половина чисел имеют значения большие, чем медиана, а половина – меньшие, чем медиана.

Синтаксис: =МЕДИАНА (число 1; число2; ….)

Аргументами этой функции должны быть числа или имена, массивы или ссылки, содержащие числа. Пустые ячейки – игнорируются, ячейки с нулем – учитываются.

Пример 5: Для вариационного ряда, содержащего нечетное количество чисел (1;2;3;4;5) вычислить медианное значение. В пустой ячейке электронной таблицы напишем: = МЕДИАНА (1;2;3;4;5). После введения Enter получим в этой ячейке результат: 3.

Пример 6: Для вариационного ряда, содержащего нечетное количество чисел (1;2;3;4;5;6) вычислить медианное значение. = МЕДИАНА (1;2;3;4;5;6)

Результат: 3.5 (среднее между 3 и 4).

Модавычисляет наиболее часто встречающееся значение в массиве или интервале данных.

Синтаксис:= МОДА (число 1; число 2; …).

Можно использовать один массив или одну ссылку на массив, вместо аргументов, разделяемых точкой с запятой. Если множество данных не содержит одинаковых значений, то функция не вычисляется.

Пример 7: Для выборки чисел {5,6;4;4;3;2;4} вычислить моду. В пустой ячейке электронной таблицы напишем: = МОДА (5,6;4;4;3;2;4). После введения Enter получим в этой ячейке результат: 4.

Пример 8. Вычислить величину моды для столбца анализируемых данных (5,6;4;4;3;2;4), размещенных в столбце таблицы Microsoft Excel, в ячейках А1-А6. Для этого в пустой ячейке А7 напишем: = МОДА (А1-А6). После введения Enter получим в этой ячейке результат: 4.

Асимметрия кривой распределения

Расчетная формула:

Синтаксис: =СКОС(число 1; число 2; ..). В качестве аргументов функции могут быть указаны числа, массивы или ссылки на массивы.

Пример 9: Для таблицы экспериментальных данных, приведенной в примере 1 и занимающей ячейки в электронной таблице в диапазоне А2:F9, вычислить асимметрию кривой распределения для каждого из столбцов. Для этого произведем операции аналогичные в примере 1, с тем отличием, что в ячейку А13 формул запишем: =СКОС(А2:А9). Результаты расчета асимметрии кривой распределения запишем в таблице в строке 13.

Обозначение ячеек

A

B

C

D

E

F

13

-0,20867

-0,19545

0,027758

0,726758

-0,55844

-0,46112

Эксцесс кривой распределения

Расчетная формула:

Синтаксис: =ЭКСЦЕСС(число 1; число 2; .. ).

В качестве аргументов функции могут быть также массивы или ссылки на массивы.

Пример 10: Для таблицы экспериментальных данных, приведенной в примере 1 и занимающей ячейки в электронной таблице в диапазоне А2:F9, вычислить эксцесс кривой распределения для каждого из столбцов. Для этого произведем операции аналогичные в примере 1, с тем отличием, что в ячейку А14 запишем: =ЭКСЦЕСС(А2:А9). Результаты расчета эксцесса кривой распределения запишем в таблице в строке 14.

Обозначение ячеек

A

B

C

D

E

F

14

-1,559

1,347854

-1,0376

-0,61701

-0,45521

-1,92771

Доверительный интервал (уровень надежности)

Доверительный интервал в программе Microsoft Excel называют уровнем надежности.

Расчетная формула:

Как следует из приведенной формулы доверительный интервал - это интервал отклонений с обеих сторон от среднего выборки, имеет знаки .

Синтаксис: =ДОВЕРИТ(альфа; станд_откл; размер).

В скобках функции указаны аргументы функции:

  • Альфа (=1-P) - это уровень значимости, используемый для вычисления доверительного интервала (уровня надежности). Для альфа, равного 0,05, и размере выборки более 30 доверительный интервал в программе Microsoft Excel определяется по формуле:

=1,96Sy/n

  • Станд_откл - это стандартное (среднеквадратичное) отклонение генеральной совокупности для интервала данных, предполагается известным.

  • Размер - это размер выборки.

Замечания:

· Если какой-либо из аргументов не является числом, то функция ДОВЕРИТ вычисляет значение ошибки #ЗНАЧ!.

· Если альфа = 0 или альфа = 1, то функция ДОВЕРИТ вычисляет значение ошибки #ЧИСЛО!.

· Если станд_откл = 0, то функция ДОВЕРИТ вычисляет значение ошибки #ЧИСЛО!.

· Если размер не целое число, то оно усекается до целого.

· Если размер < 1, то функция ДОВЕРИТ вычисляет значение ошибки #ЧИСЛО!.

·

Пример 11: Вычислить доверительный интервал для =0.05, величины стандартного отклонения 0,4857 и размера выборки 32. В соответствии с формулой функции в пустой ячейке запишем: =ДОВЕРИТ(0,05;0,4857;32). Результат расчета: 0,16828.

t-Распределение Стьюдента

Вычисляет величину уровня значимости (в долях) =1-Р для известного значения t-распределения Стьюдента.

Синтаксис: =СТЬЮДРАСП(x;степени_свободы;хвосты)

x    — численное значение величины t-распределения Стьюдента.

Степени_свободы    — (f=n-1) целое, указывающее число степеней свободы.

Хвосты    — число вычисляемых хвостов распределения. Если хвосты = 1, то функция СТЬЮДРАСП вычисляет одностороннее распределение. Если хвосты = 2, то функция СТЬЮДРАСП вычисляет двухстороннее распределение.

Замечания:

  • Если какой-либо из аргументов не является числом, то функция СТЬЮДРАСП вычисляет значение ошибки #ЗНАЧ!.

  • Если степени_свободы < 1, то функция СТЬЮДРАСП вычисляет значение ошибки #ЧИСЛО!.

  • Аргументы степени_свободы и хвосты усекаются до целых.

  • Если хвосты — любое значение, отличное от 1 и 2, то функция СТЬЮДРАСП вычисляет значение ошибки #ЧИСЛО!.

  • Если x < 0, то функция СТЬЮДРАСП вычисляет значение ошибки #ЧИСЛО!.

Пример 1: Найти величину уровня значимости  и доверительной вероятности для критерия Стьюдента t=2.306 (двухстороннего распределения) и числа измерений 9 (число степеней свободы 8). В пустую ячейку электронной таблицы внесем запись =СТЬЮДРАСП(2,306;8;2), получим результат 0,0500. Из анализа величины =0,05 следует, что доверительная вероятность измерений составляет 0,95.

Пример 2: Найти величину уровня значимости  и доверительной вероятности для критерия Стьюдента t=1,397 (двухстороннего распределения) и числа измерений 9 (число степеней свободы 8). В ячейку электронной таблицы запишем =СТЬЮДРАСП(1,397;8;2), получим результат 0,200. Из анализа величины =0,20 следует, что доверительная вероятность измерений составляет 0,80.