 
        
        Министерство образования и науки РФ
Государственное образовательное учреждение высшего профессионального образования
«Санкт-Петербургский государственный инженерно-экономический университет»
Лабораторная работа №2
«Статистический анализ парной связи»
Выполнила студентка гр. 1003
Свитина Дарья
Санкт-Петербург
2012
Содержание:
Исходные данные
1. Теоретическое обоснование связи между признаками с выделением признака-результата и признака-фактора.
2. Аналитическая равнонаполненная группировка.
3. Комбинационная группировка.
4. Построение графиков: корреляционного поля и эмпирической линии регрессии.
5. Проведение дисперсионного анализа по данным аналитической группировки.
6. Расчет показателей тесноты связи:
- эмпирического коэффициента детерминации и эмпирического корреляционного отношения;
- линейного парного коэффициента корреляции.
7. Построение линейной парной регрессии
8. Построение нелинейной регрессии – параболы
9. Построение нелинейной регрессии – равносторонней гиперболы.
10. Выбор лучшего уравнение регрессии.
Исходные данные:
Сведения об обслуживании клиентов
| № Клиента | Удовлетворенность обслуживанием Y | Количество посещений X | 
| 1 | 5 | 3 | 
| 2 | 1 | 1 | 
| 3 | 3 | 1 | 
| 4 | 3 | 2 | 
| 5 | 6 | 5 | 
| 6 | 9 | 7 | 
| 7 | 2 | 2 | 
| 8 | 4 | 3 | 
| 9 | 3 | 1 | 
| 10 | 7 | 4 | 
| 11 | 5 | 2 | 
| 12 | 4 | 3 | 
| 13 | 5 | 1 | 
| 14 | 4 | 2 | 
| 15 | 3 | 2 | 
| 16 | 7 | 4 | 
| 17 | 7 | 5 | 
| 18 | 5 | 3 | 
| 19 | 1 | 1 | 
| 20 | 4 | 3 | 
Теоретическое обоснование связи между признаками с выделением признака-результата и признака-фактора
Так как конкретному набору значений результата соответствует некоторое множество (распределение) величин результата и рост фактора меняет распределение результата, то это говорит о наличии статистической связи.
Аналитическая равнонаполненная группировка
| Отчет | |||
| Удовлетворенность обслуживанием | |||
| № группы | Средний балл удовлетворенности | N | Стд.Отклонение | 
| 1,00 | 2,6000 | 5 | 1,67332 | 
| 2,00 | 3,4000 | 5 | 1,14018 | 
| 3,00 | 4,4000 | 5 | ,54772 | 
| 4,00 | 7,2000 | 5 | 1,09545 | 
| Итого | 4,4000 | 20 | 2,08756 | 
Вывод: так как с увеличением количества посещений удовлетворенность обслуживанием растет, то между количеством посещений и удовлетворенностью обслуживанием прямая(возрастающая) зависимость.
Комбинационная группировка
| 
 | Группы по удовлетворенности обслуживанием | Итого | ||||
| 1,00 | 2,00 | 3,00 | ||||
| Группы по количеству посещений | 1,00 | 4 | 1 | 0 | 5 | |
| 2,00 | 3 | 2 | 0 | 5 | ||
| 3,00 | 0 | 5 | 0 | 5 | ||
| 4,00 | 0 | 0 | 5 | 5 | ||
| Итого | 7 | 8 | 5 | 20 | ||
Вывод: Зависимость между количеством посещений и удовлетворенностью обслуживанием прямая, т.к. значения располагаются ближе к главной диагонали
Построение графиков: корреляционного поля и эмпирической линии регрессии
| Нижн. гр. | Верх. гр | Число ед. | Сумма | Среднее | Дисперсия | 
| 1 | 2 | 5 | 13 | 2,6 | 2,8 | 
| 2 | 3 | 5 | 17 | 3,4 | 1,3 | 
| 3 | 5 | 5 | 22 | 4,4 | 0,3 | 
| 5 | 7 | 5 | 36 | 7,2 | 1,2 | 
 
Вывод: с увеличением количества посещений удовлетворенность обслуживанием растет
Проведение дисперсионного анализа по данным аналитической группировки
| Дисперсионный анализ | 
 | 
 | 
 | 
 | 
 | 
 | 
| Источник вариации | SS | df | MS | F | P-Значение | F критическое | 
| Между группами | 60,4 | 3 | 20,13333 | 14,38095 | 8,35E-05 | 3,238872 | 
| Внутри групп | 22,4 | 16 | 1,4 | 
 | 
 | 
 | 
| 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
| Итого | 82,8 | 19 | 
 | 
 | 
 | 
 | 
Вывод: так как Fнабл>Fкрит, то связь статистически значимая.
Расчет показателей тесноты связи
- эмпирического коэффициента детерминации и эмпирического корреляционного отношения
| Эмпирический коэффициент детерминации | Эмпирическое корреляционное отношение | 
| 0,729469 | 0,854089 | 
Вывод: так как величина эмпирического корреляционного отношения равна 0,854089, то связь между количеством посещений и удовлетворенностью обслуживанием тесная.
- линейного парного коэффициента корреляции
| Линейный парный коэффициент корреляции | 
| 0,856941 | 
Вывод: так как величина линейного парного коэффициента корреляции>0, то связь прямая.
Построение линейной парной регрессии
| Регрессионная статистика | 
 | 
| Множественный R | 0,856941112 | 
| R-квадрат | 0,734348069 | 
| Нормированный R-квадрат | 0,719589628 | 
| Стандартная ошибка | 1,105440583 | 
| Наблюдения | 20 | 
| Дисперсионный анализ | 
 | 
 | 
 | 
 | 
 | 
| 
 | df | SS | MS | F | Значимость F | 
| Регрессия | 1 | 60,8040201 | 60,8040201 | 49,75784 | 1,40146E-06 | 
| Остаток | 18 | 21,9959799 | 1,221998883 | 
 | 
 | 
| Итого | 19 | 82,8 | 
 | 
 | 
 | 
| 
 | Коэффициенты | Стандартная ошибка | t-статистика | P-Значение | Нижние 95% | Верхние 95% | Нижние 95,0% | Верхние 95,0% | 
| Y-пересечение | 1,359798995 | 0,496846109 | 2,736861517 | 0,013547 | 0,315964056 | 2,403634 | 0,315964 | 2,403634 | 
| Переменная X 1 | 1,105527638 | 0,156725211 | 7,053923451 | 1,4E-06 | 0,77626019 | 1,434795 | 0,77626 | 1,434795 | 
Уравнение парной регрессии f(x)=1,35978995+1,105527638*x
 
