- •Основы статистических вычислений в среде Excel
- •Тверь, 2015
- •§ 1 Установка надстройки Пакет анализа
- •§ 2 Установка настройки Создать диаграмму
- •§3 Применение процедуры Описательная статистика
- •§ 4 Применение процедуры Корреляция
- •§ 5 Регрессионный анализ в Excel
- •§ 6 Проверка гипотезы о значимости выборочного коэффициента корреляции Пирсона
- •§7 Проверка гипотезы о равенстве дисперсий двух независимых нормальных величин (f-критерий). Процедура Двухвыборочный f-тест для дисперсии
- •§ 10 Проверка гипотезы о равенстве математических ожиданий (средних значений) двух коррелированных нормальных величин с неизвестными дисперсиями. Процедура Парный двухвыборочный t-тест для средних
- •§11 Однофакторный дисперсионный анализ
- •Список рекомендуемой литературы
§ 4 Применение процедуры Корреляция
Процедура пакета анализа Корреляция предназначена для вычисления выборочного коэффициента корреляции Пирсона между двумя метрическими переменными. Пример: вычислим выборочный коэффициент корреляции Пирсона между вербальным (Х) и невербальным (У) индексами IQ дошкольников [2. стр. 68]. Объем данной выборки равен 20.
Экспериментальные данные представим в Excel в следующем виде:
Применение процедуры пакета анализа Корреляция подразумевает выполнение следующих шагов:
- вводим числовые данные по столбцам с метками переменных;
- выбираем Данные /Анализ данных /Корреляция; нажимаем клавишу «ОК». Открывается окно Корреляция:
- с помощью кнопки минимизации вводим входной интервал с метками:
- ставим флажок Метки в первой строке;
- нажимаем клавишу «ОК».
Получаем результаты в окне вывода:
.
Выборочный коэффициент корреляции Пирсона между вербальным (Х) и невербальным (У) индексами IQ дошкольников равен 0,517392425: между этими индексами существует достаточно сильная положительная корреляционная связь.
§ 5 Регрессионный анализ в Excel
При выполнении регрессионного анализа в Excel применяются следующие статистические процедуры:
- Добавить линию тренда;
- Регрессия.
В данной работе будем рассматривать только парную линейную регрессию переменной У от независимой переменной х. Выполним регрессионный анализ для данных последнего примера.
Сначала мы построим корреляционное поле (простую диаграмму рассеивания):
- выделяем мышью числовые данные с метками;
- в строке быстрого доступа выбираем команду Создать диаграмму;
-
в левом столбике выбираем тип диаграммы
Точечная;
- нажимаем «ОК».
Получаем диаграмму рассеивания
Для построения прямой линии регрессии (линии тренда) выполняем следующие шаги:
- выделяем с помощью мыши данную диаграмму;
- выбираем Макет/ Линия тренда/ Дополнительные параметры линии тренда (операционная система Windows 7) или Макет / Анализ /Линия тренда/ Дополнительные параметры линии (операционная система Windows XP).
При этом открывается окно Формат линии тренда:
- в этом окне можно задать прогноз на несколько периодов (единиц) вперед (вправо) и назад (влево). Зададим прогноз на 2 единицы вперед и назад.
- поставим флажок в окне показывать уравнение на диаграмме;
- нажимаем клавишу Закрыть.
Получаем диаграмму с прямой линией регрессии (линией тренда) и ее уравнением. Уравнение с помощью мыши можно выделить и передвинуть на диаграмме в удобное место.
Для более глубокого проведения регрессионного анализа следует использовать процедуру Анализа данных Регрессия. Применим данную процедуру для последнего примера. Выполняем следующие шаги:
- открываем лист Excel с исходными данными;
- выбираем Данные /Анализ данных / Регрессия;
- нажимаем «ОК».
Открывается
окно
Регрессия:
- с помощью кнопок минимизации вводим входные интервалы переменных У и Х;
- ставим флажки в окнах Метки, Остатки:
- нажимаем клавишу «ОК».
Получаем следующие результаты в виде нескольких таблиц:
Из этой таблицы следует, что множественный коэффициент корреляции приближенно равен 0,517, коэффициент детерминации R-квадрат приближенно равен 0,268.
В таблице содержатся данные о качестве регрессионной модели: значимость F-критерия равна 0,019473144, что говорит о хорошем качестве регрессионной модели; малые P-значения коэффициентов регрессии показывают, что оба коэффициента значимо отличаются от нуля.
В таблице остатков указаны разности между фактическими и предсказанными значениями переменной Y для каждого наблюдения:
