
- •Министерство образования и науки российской федерации
- •Тема № 1. Расчет абсолютных и относительных статистических величин
- •Методические указания
- •Контрольный пример
- •Тема № 2. Расчет средних величин
- •Методические указания
- •3.Дисперсия (д или 2) и среднее квадратическое отклонение
- •Контрольный пример
- •Тема № 3. Определение характеристик генеральной совокупности по выборочным характеристикам
- •Методические указания
- •Контрольный пример
- •Индивидуальные задания
- •Тема № 4. Определение показателей динамического ряда
- •Методические указания
- •Контрольный пример
- •Индивидуальные задания
- •Тема 5. Определение основной тенденции
- •Выполнение задания в среде Microsoft Exсel
- •Контрольный пример
- •Индивидуальные задания
- •Тема №6. Индексный анализ
- •Методические указания
- •Контрольный пример
- •1 Вариант.
- •2 Вариант
- •Индивидуальные задания
- •Тема №7. Статистическое изучение взаимосвязей. Кореляционно-регрессионный анализ Методические указания
- •1. Выбор уравнения регрессии.
- •2. Оценка параметров (a,b,c..) в выбранной модели.
- •Показатели тесноты связи:
- •Выполнение задания в среде Microsoft Exсel с использованием встроенных функций
- •Контрольный пример
- •Расчетная часть
- •Аналитическая записка
- •Индивидуальные задания
- •Литература
Контрольный пример
Имеются данные о среднем возрасте оборудования предприятия и средних затратах на его ремонт.
Номер предприятия |
Возраст оборудования (лет) |
Затраты на ремонт (тыс. руб.) |
1 |
4 |
1,5 |
2 |
5 |
2,0 |
3 |
5 |
1,4 |
4 |
6 |
2,3 |
5 |
8 |
2,7 |
6 |
10 |
4,0 |
7 |
8 |
2,3 |
8 |
11 |
6,6 |
9 |
6 |
1,7 |
В целях нормирования расхода средств на ремонт оборудования произвести анализ тесноты связи между возрастом оборудование и затратами на его ремонт. Рассчитать уравнение регрессии между ними.
Расчетная часть
Решение задачи выполним в следующей последовательности.
Определение степени тесноты связи и адекватности модели путем построения линий тренда на графике в среде MS Excel.
Проведение расчетов с использованием стандартных статистических функций MS Excel (ЛИНЕЙН и другие).
Построение линий тренда на графике в среде MS Excel.
При построении линий тренда в использованием MS Excel предварительно необходимо выявить результирующий и факторный признаки. Результативным признаком Y модели являются затраты на ремонт, а факторным - возраст оборудования X. Для исключения ошибок следующим шагом является ранжирование исходных данных по факторному признаку (Меню Данные, Сортировка, По возрастанию).
Номер предприятия |
Возраст оборудования (лет) |
Затраты на ремонт (тыс. руб.) |
1 |
4 |
1,5 |
2 |
5 |
2 |
3 |
5 |
1,4 |
4 |
6 |
2,3 |
9 |
6 |
1,7 |
5 |
8 |
2,7 |
7 |
8 |
2,3 |
6 |
10 |
4 |
8 |
11 |
6,6 |
2. Построение корреляционного поля.
Анализ корреляционного поля позволяет предположить о наличии прямой связи между возрастом оборудования и затратами на ремонт.
Построение линий тренда на графике (диаграмме).
В результате построения трендов получены следующие модели:
А) прямолинейная функция: Y1 = 0,4767x + 0,3389, характеризующаяся коэффициентом детерминации r2 = 0,6243. При этом коэффициент корреляции, рассчитанный по функции КОРРЕЛ, равен r = 0,886636;
В) полиномиальная функция Y2 = 0,1301x2 - 0,8242x + 2,7238 с коэффициентом детерминации r2 = 0,863.
Анализ модели, представленный в виде прямолинейной функции, приводит к следующим выводам.
Параметр, характеризующий угол наклона линейной модели, равен 0,4767. Это означает, что в среднем по совокупности наблюдений отклонение возраста оборудования от его среднего значения на 1 год приводит к возрастанию затрат на ремонт на 0,4767 тыс. руб.
Линейный коэффициент корреляции равен 0,886636, что по шкале Чеддока подтверждает наличие высокой тесноты связи между возрастом оборудования и затратами на ремонт.
Коэффициент детерминации R2, полученный при построении тренда, равен 0,62433. Это означает, что 62% затрат на ремонт связаны именно с изменением возраста оборудования, а оставшиеся 38% определяются другими, не учтенными в данной постановке, факторами.
Т.к. изучаемая совокупность меньше 30, то целесообразно провести проверку значимости коэффициента корреляции и параметров линейной модели.
Т-критерий Стьюдента, рассчитанный по формуле (7.4), t r= 5,072387.
Критическое (табличное) значение в результате расчетов с использованием функции Excel СТЬЮДРАСПОБР(0,05;7) равно tкрит=2,364624.
Так как tr > tкрит , то коэффициент корреляции может быть признан значимым и связь между Y и Х является реальной.
Для подтверждения гипотезы воспользуемся оценкой значимости коэффициентов линейной регрессии, что является необходимым применительно к совокупностям, число наблюдений в которых не превышает 30. Расчетные (фактические) значения t-критерия Стьюдента определяются для каждого из параметров модели.
Для параметра а0
:
Для параметра а1
:
где
- значение затрат,
вычисленное по модели (выравненных
значений),
-
среднее квадратическое отклонение
результативного признака от выравненных
значений,
- среднее
квадратическое отклонение факторного
признака х
от общей средней.
Расчеты представим в виде таблицы.
Исходные данные |
Расчетные данные | |||
Номер предприятия |
Возраст оборудования (лет) |
Затраты на ремонт (тыс. руб.) |
YЛинейная = = 0,4767x + 0,3389 |
Yполиномиальная = = 0,1301x2 - 0,8242x + 2,7238 |
1 |
4 |
1,5 |
0,8 |
2,0 |
2 |
5 |
2,0 |
1,3 |
1,6 |
3 |
5 |
1,4 |
1,8 |
1,4 |
4 |
6 |
2,3 |
2,2 |
1,5 |
5 |
6 |
1,7 |
4,6 |
5,8 |
6 |
8 |
2,7 |
2,7 |
1,9 |
7 |
8 |
2,3 |
3,7 |
3,3 |
8 |
10 |
4,0 |
3,2 |
2,5 |
9 |
11 |
6,6 |
4,2 |
4,5 |
|
Всего затрат |
24,5 |
24,5 |
24,5 |
Значения t-критерия Стьюдента представим в таблице.
ta0= |
0,630295 |
ta1= |
2,289138 |
tкрит= |
2,364624 |
Анализ представленных результатов показывает, что для линейной модели расчетные (фактические). Таким образом, можно предположить, что полученная модель не в полной мере адекватна фактическим (экспериментальным) данным и зависимость между возрастом оборудования и затратами на ремонт определяется неучтенными случайными факторами. Проверка значимости параметров полиномиальной модели проводится аналогично.
При использовании функции ЛИНЕЙН получены следующие результаты.
а1= |
0,61087 |
а0= |
-1,55386 |
SE1= |
0,12043 |
SE0= |
0,88589 |
r2= |
0,78612 |
Sey= |
0,8168 |
F= |
25,7291 |
df= |
7 |
Ssreg= |
17,1654 |
Ssresid= |
4,67012 |
Полученные результаты свидетельствуют о соответствии числового значения коэффициента детерминации по функциям ЛИНЕЙН и КОРРЕЛ. Рассчитанные значения t-критерия Стьюдента для параметров модели имеют значения:
ta0= |
1,75401 |
ta1= |
5,07241 |
tкрит= |
2,36462 |
Их сравнение с критическим (табличным) значением t-критерия Стьюдента позволяют утверждать о значимости только коэффициента a1, характеризующего угол наклона прямой линии. Для уточнения выводов воспользуемся распределением Фишера.
Критическое значение рассчитаем с использованием функции FРАСПОБР, которое имеет значение 5,3176. В нашем случае расчетное F-значение по данным функции ЛИНЕЙН равно 35,509, что заметно больше чем F-критическое значение, равное 5,3176. Таким образом, полученное уравнение регрессии в виде Y =0,61086 X -1,55386 может быть использовано для оценки затрат, необходимых для ремонта оборудования в связи с его амортизацией.