Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Обработка данных на компьютере.doc
Скачиваний:
4
Добавлен:
01.05.2019
Размер:
216.58 Кб
Скачать

Исходные данные (массив х)

7,83

9,67

11,17

9,92

9,25

9,67

9,67

10,42

8,17

8,17

8,92

11,17

10,00

11,17

7,50

9,92

9,67

8,50

8,83

9,50

9,25

9,00

9,25

10,42

9,25

9,25

8,83

10,83

12,00

10,00

10,42

8,17

12,00

9,83

10,42

9,25

7,50

8,17

10,83

8,17

10,42

9,67

7,50

9,25

9,50

10,00

10,00

11,00

9,25

Отметим, что формат вывода чисел с двумя знаками после запятой не означает их фактического округления до таких значений – это всего-лишь форма представления чисел на экране и в отчете. Иными словами, выбор конкретного формата не влияет на точность последующих расчетов.

При статистической обработки данных одной выборки пытаются разрешить две основные проблемы:

А) Какие выводы можно сделать о совокупности в целом, располагая сведениями только о небольшой части этой совокупности (имеющиеся наблюдения представляют собой малую случайную выборку)?

Б) Что можно сказать о законе распределения данных?

При этом предполагается, что выборка наблюдений – представительная (репрезентативная), поэтому она (по идее) правильно отображает всю гипотетическую совокупность данных.

А. Рассмотрим первую проблему об оценках, справедливых для всей совокупности.

Прежде всего, вычисляем характеристики выборки (статистики) – среднее, дисперсию, стандартное отклонение (среднее квадратичное отклонение), ошибку среднего (стандартную ошибку) и некоторые другие. Для этого в Excel имеются встроенные функции, некоторые из которых перечислены ниже (через Х обозначен диапазон исходных данных):

Статистика

Обозначение

Функция

Объем выборки (число наблюдений)

N

СЧЕТ(Х)

Минимальное значение

Xmin

МИН(Х)

Максимальное значение

Xmax

МАКС(Х)

Среднее

Xcp

СРЗНАЧ(Х)

Дисперсия

Sxx

ДИСПР(Х)

Несмещенная оценка дисперсии

Sxx

ДИСП(Х)

Стандартное отклонение

Sx

СТАНДОТКЛ(Х)

Блок характеристик на листе Excel предлагается оформить в виде двух столбцов ячеек. В левом столбце записываем обозначение характеристики и знак равенства; эти тексты затем следует выровнять по правому краю. В соседнем правом столбце набираем знак равенства и имя функции. Напоминаем, что любые тексты, которые начинаются знаком равенства, интерпретируются Excel как формулы. Эти формулы затем следует выровнять по левому краю. Мы набираем формулы, а видим результаты расчета:

Набираем

Видим

N =

=СЧЕТ(Х)

N =

49

Xmin =

=МИН(Х)

Xmin =

7,5

Xmax=

=МАКС(Х)

Xmax=

12

Xcp =

=СРЗНАЧ(Х)

Xcp =

9,5612

Sxx =

=ДИСП(Х)

Sxx =

1,2271

Sx =

=СТАНДОТКЛ(Х)

Sx =

1,1077

Не обязательно набирать самому имя функции. При наборе в ячейке знака равенства активизируется Мастер функций и на панели формул появляется раскрывающийся список 10 недавно использовавшихся функций. Можно также вместо ввода знака равенства щелкнуть мышкой по кнопке  fx  на панели формул и тогда сразу появляется панель Мастера функций, где следует найти нужную функцию. Диапазон данных Х указываем мышкой. (Образец панели Мастера функций прив еден ниже).

При замене таблицы данных на блок такого же или меньшего размера все характеристики пересчитываются автоматически (пустые ячейки в таблице данных игнорируются). В нашем примере таблица данных имеет размер 77. Для возможности обработки блоков данных большего размера можно в диапазон Х включить с запасом несколько пустых строк и столбцов.

Для вычисления оценок дисперсии в Excel имеются две функции:

Sxx=ДИСПР(Х)=SSX/N и Sxx=ДИСП(Х)=SSX/(N–1).

Вторая функция возвращает несколько большие значения – это, так называемая, несмещенные оценка дисперсии (исправленные на число степеней свободы). Функция Sx=СТАНДОТКЛОН(Х) предполагает использование именно несмещенной оценки дисперсии, иначе надо использовать Sx=КОРЕНЬ(Sxx).

Вычисленные характеристики относятся только к принятой выборке наблюдений. Эта выборка больше никогда не повторится (будут другие данные, может быть, похожие, но все же другие). На основе выборочных характеристик можно сделать выводы, относящиеся для совокупности в целом.

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]