
ДОП / ДОП_СметанниковДЕ_7331
.pdf
для каждой выборки(0.0298, 0.1162 и 0.264 соответственно). Были посчитаны
Sj2факт =(Yj_cр*Y_ср)2*10 = 0.114204844, 0.004188844, 0.162137778
соответственно. SSфакт= S12факт+ S22факт+ S32факт = 0.280531467 Была составлена новая таблица из 3 выборок по принципу (Yj- Yjср)2. Посчитана SSост через сумму всех значений в новой таблице из выборок и равной 0.0036352 большая2
= SSфакт/k = 0.280531467/3 = 0.140265733 меньшая2 = SSост /(n-k) = 0.0036352/(30- 3) = 0.000134637
Далее проверим статистическую гипотезу о значимости влияния фактора по критерию Фишера.
Вычислим расчетное значение критерия Фишера по формуле
большая2
набл = меньшая2 = 1041,806.
Определим критическое значение критерия Фишера при уровне значимости = 0,05 по формуле
кр = ( ; − 1; ( − 1)) = (0,05; 3 − 1; 3 (10 − 1)) =
= (0,05; 2; 27) = 3,354.
На рисунке 2.2 представлены подробности промежуточных вычислений.
Рисунок 2.2 – Расчеты для критерия Фишера
11
Так как набл > кр, то H0, говорящее что фактор не значим, отрицаем. Сравнивая результаты ручного вычисления и вычисления с помощью
надстройки можно увидеть, что они одинаковые.
12

3 КОРРЕЛЯЦИОННЫЙ И РЕГРЕССИОННЫЙ АНАЛИЗ
Далее исследуем силу и форму зависимости времени сортировки
массива убывающих чисел от его размера. Для этого с помощью исследуемой
программы сформируем выборку при = 50 фиксированных значениях
входного параметра (размер массива = 10000 + 500 ( − 1)) без повторений ( = 1 раз). Фрагмент с результатами работы программы представлен на рисунке 3.1.
Рисунок 3.1 – Фрагмент с результатами работы программы
Для начала были вычислены суммы всех значений X, Y, X2, X3, X4, Y2, X*Y и X2*Y = 1112500, 4.915, 27356250000, 7.24516E+14, 2.02304E+19, 0.656357, 130314.5, 3641626250.
13

Вычислим значение выборочного коэффициента линейной корреляции
по формуле:
|
|
|
(∑ ) − (∑ ) (∑ |
) |
|
||
|
= |
|
|
|
|
|
= 0,987. |
|
|
|
|
|
|||
|
|
√( (∑ 2) − (∑ )2) ( (∑ 2) − (∑ )2) |
|
||||
|
|
|
|||||
|
|
|
|
|
|
|
|
Вывод: Очень высокая степень линейной взаимосвязи Результат, полученный методом использования надстройки идентичен
ручному вычислению.
На рисунке 3.2 представлен график корреляционного поля для полученной выборки.
0,25 |
|
|
|
|
|
|
|
|
0,2 |
|
y = 0,00000805x - 0,08081758 |
|
|
|
|
||
0,15 |
|
|
|
|
|
|
|
|
0,1 |
|
|
|
|
|
|
|
|
0,05 |
|
|
|
|
|
|
|
|
0 |
|
|
|
|
|
|
|
|
0 |
5000 |
10000 |
15000 |
20000 |
25000 |
30000 |
35000 |
40000 |
-0,05 |
|
|
|
|
|
|
|
|
|
|
Рисунок 3.2 – График корреляционного поля |
|
|
Форма возможной взаимосвязи — нелинейная возрастающая.
С увеличением размера массива время сортировки также растёт, но не пропорционально, а с ускорением.
Вычислим коэффициенты выборочного уравнения регрессии вида
= 1 + 0,
где, основываясь на результатах применения метода наименьших квадратов,
14
|
(∑ ) − (∑ ) |
(∑ ) |
|
|||||
= |
|
|
|
|
|
|
|
, |
|
(∑ 2) − (∑ )2 |
|||||||
1 |
|
|
||||||
|
|
|
|
|
|
|
|
|
|
|
|
(∑ ) − (∑ ) |
|
||||
|
= |
|
|
|
. |
|
||
|
|
|
|
|||||
0 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Врезультате получаем
= 0,00000805 − 0,08081758.
На рисунке 3.3 представлены подробности промежуточных вычислений.
15

Рисунок 3.3 – Расчеты для уравнения регрессии вида = 1 + 0
Вычислим коэффициенты выборочного уравнения регрессии вида
= 2 2 + 1 + 0
путем решения следующей системы линейных уравнений:
16

2 (∑ 4) + 1 (∑ 3) + 0 (∑ 2) = ∑ 2
2 (∑ 3) + 1 (∑ 2) + 0 (∑ ) = ∑
{2 (∑ 2) + 1 (∑ ) + 0 = ∑
Врезультате получаем
= 0,000000000184 2 − 0,00000015858 + 0,000901586481.
На рисунке 3.5 – 3.7 представлены подробности промежуточных вычислений.
Рисунок 3.5 – Расчеты для уравнения регрессии вида = 2 2 + 1 + 0
Рисунок 3.6 - Расчеты для уравнения регрессии вида = 2 2 + 1 + 0
17

Рисунок 3.7 - Расчеты для уравнения регрессии вида = 2 2 + 1 + 0
Добавим полученные линии регрессии на график корреляционного поля.
На рисунке 3.8 представлен график корреляционного поля и полученные уравнения регрессии. С увеличением размера массива время сортировки также растёт, но не пропорционально, а с ускорением.
18

Рисунок 3.8 – График корреляционного поля и линии регрессии
Значения |
b2,b1,b0 для |
= |
2 + + |
и b1,b0 для |
||
|
|
|
2 |
1 |
0 |
|
= 2 |
+ + , полученные |
путем |
ручного |
вычисления, оказались |
||
2 |
1 |
0 |
|
|
|
|
идентичными тем, что были вычислены путем использования «Добавить линию тренда»
19
Заключение
В ходе выполнения лабораторной работы были проведены статистические исследования временных характеристик алгоритма сортировки массива.
Основные выводы по каждому этапу анализа:
1. Проверка статистических гипотез На основе выборки из не менее чем 200 измерений времени сортировки
массива при фиксированном размере массива (k = 1), была построена гистограмма частот. Визуальный анализ показал асимметричное распределение
С помощью критерия согласия Пирсона при уровне значимости α=0.05
была проверена гипотеза о соответствии эмпирического распределения нормальному и равномерному законам. На основе расчетных значений критерия и параметров, оцененных методом максимального правдоподобия,
гипотеза о нормальном распределении была отвергнута, как и гипотеза о равномерном распределении.
2. Однофакторный дисперсионный анализ
Для оценки влияния размера массива (фактора X) на время сортировки
(переменная Y), был проведен однофакторный дисперсионный анализ.
Расчётное значение критерия Фишера значительно превысило критическое при α=0.05, что позволило отвергнуть нулевую гипотезу о незначимости влияния размера массива. Это означает, что размер массива статистически значимо влияет на время сортировки.
3. Корреляционный и регрессионный анализ Для оценки связи между размером массива и временем сортировки была
сформирована выборка из не менее 50 наблюдений. Выборочный коэффициент линейной корреляции оказался близким к 1, что свидетельствует о сильной положительной линейной зависимости между переменными.
Точечный график корреляционного поля подтвердил линейный характер
20