Исходные данные (массив х)
7,83 |
9,67 |
11,17 |
9,92 |
9,25 |
9,67 |
9,67 |
10,42 |
8,17 |
8,17 |
8,92 |
11,17 |
10,00 |
11,17 |
7,50 |
9,92 |
9,67 |
8,50 |
8,83 |
9,50 |
9,25 |
9,00 |
9,25 |
10,42 |
9,25 |
9,25 |
8,83 |
10,83 |
12,00 |
10,00 |
10,42 |
8,17 |
12,00 |
9,83 |
10,42 |
9,25 |
7,50 |
8,17 |
10,83 |
8,17 |
10,42 |
9,67 |
7,50 |
9,25 |
9,50 |
10,00 |
10,00 |
11,00 |
9,25 |
Отметим, что формат вывода чисел с двумя знаками после запятой не означает их фактического округления до таких значений – это всего-лишь форма представления чисел на экране и в отчете. Иными словами, выбор конкретного формата не влияет на точность последующих расчетов.
При статистической обработки данных одной выборки пытаются разрешить две основные проблемы:
А) Какие выводы можно сделать о совокупности в целом, располагая сведениями только о небольшой части этой совокупности (имеющиеся наблюдения представляют собой малую случайную выборку)?
Б) Что можно сказать о законе распределения данных?
При этом предполагается, что выборка наблюдений – представительная (репрезентативная), поэтому она (по идее) правильно отображает всю гипотетическую совокупность данных.
А. Рассмотрим первую проблему об оценках, справедливых для всей совокупности.
Прежде всего, вычисляем характеристики выборки (статистики) – среднее, дисперсию, стандартное отклонение (среднее квадратичное отклонение), ошибку среднего (стандартную ошибку) и некоторые другие. Для этого в Excel имеются встроенные функции, некоторые из которых перечислены ниже (через Х обозначен диапазон исходных данных):
Статистика |
Обозначение |
Функция |
Объем выборки (число наблюдений) |
N |
СЧЕТ(Х) |
Минимальное значение |
Xmin |
МИН(Х) |
Максимальное значение |
Xmax |
МАКС(Х) |
Среднее |
Xcp |
СРЗНАЧ(Х) |
Дисперсия |
Sxx |
ДИСПР(Х) |
Несмещенная оценка дисперсии |
Sxx |
ДИСП(Х) |
Стандартное отклонение |
Sx |
СТАНДОТКЛ(Х) |
Блок характеристик на листе Excel предлагается оформить в виде двух столбцов ячеек. В левом столбце записываем обозначение характеристики и знак равенства; эти тексты затем следует выровнять по правому краю. В соседнем правом столбце набираем знак равенства и имя функции. Напоминаем, что любые тексты, которые начинаются знаком равенства, интерпретируются Excel как формулы. Эти формулы затем следует выровнять по левому краю. Мы набираем формулы, а видим результаты расчета:
Набираем |
Видим |
||
N = |
=СЧЕТ(Х) |
N = |
49 |
Xmin = |
=МИН(Х) |
Xmin = |
7,5 |
Xmax= |
=МАКС(Х) |
Xmax= |
12 |
Xcp = |
=СРЗНАЧ(Х) |
Xcp = |
9,5612 |
Sxx = |
=ДИСП(Х) |
Sxx = |
1,2271 |
Sx = |
=СТАНДОТКЛ(Х) |
Sx = |
1,1077 |
Не обязательно набирать самому имя функции. При наборе в ячейке знака равенства активизируется Мастер функций и на панели формул появляется раскрывающийся список 10 недавно использовавшихся функций. Можно также вместо ввода знака равенства щелкнуть мышкой по кнопке fx на панели формул и тогда сразу появляется панель Мастера функций, где следует найти нужную функцию. Диапазон данных Х указываем мышкой. (Образец панели Мастера функций прив еден ниже).
При замене таблицы данных на блок такого же или меньшего размера все характеристики пересчитываются автоматически (пустые ячейки в таблице данных игнорируются). В нашем примере таблица данных имеет размер 77. Для возможности обработки блоков данных большего размера можно в диапазон Х включить с запасом несколько пустых строк и столбцов.
Для вычисления оценок дисперсии в Excel имеются две функции:
Sxx=ДИСПР(Х)=SSX/N и Sxx=ДИСП(Х)=SSX/(N–1).
Вторая функция возвращает несколько большие значения – это, так называемая, несмещенные оценка дисперсии (исправленные на число степеней свободы). Функция Sx=СТАНДОТКЛОН(Х) предполагает использование именно несмещенной оценки дисперсии, иначе надо использовать Sx=КОРЕНЬ(Sxx).
Вычисленные характеристики относятся только к принятой выборке наблюдений. Эта выборка больше никогда не повторится (будут другие данные, может быть, похожие, но все же другие). На основе выборочных характеристик можно сделать выводы, относящиеся для совокупности в целом.