
- •Введение
- •1. Построение вариационного ряда и его графическое изображение
- •2. Вычисление показателей вариационного ряда при большой выборке
- •2.1. Получение статистических показателей способом непосредственных вычислений по исходным формулам
- •Ошибка основного отклонения:
- •Ошибка меры изменчивости:
- •2.2. Точность вычислительных работ
- •2.3. Вычисление моментов статистических величин. Понятие о моментах распределения
- •2.3.1. Начальные моменты
- •2.3.1.1. Вычисление начальных моментов по способу произведений
- •Вычисление начальных моментов по способу произведений
- •2.3.1.2. Вычисление начальных моментов по способу сумм
- •2.3.2. Центральные моменты
- •2.3.3. Основные моменты
- •2.4. Вычисление статистических показателей с использованием значений моментов
- •3 Корреляционный анализ. Общие понятия и задачи
- •3.1 Исходные данные, построение корреляционной таблицы
- •3.2. Установление корреляционной связи, ее формы и направленности
- •3.3. Вычисление показателей тесноты связи и их оценка при большой выборке.
- •3.3.1. Вспомогательные расчеты
- •3.3.2. Вычисление коэффициента корреляции и его оценка
- •3.3.3. Вычисление корреляционного отношения и его оценка
- •3.4. Оценка меры линейности корреляционной связи
- •3.5.Линейное корреляционное уравнение
- •4. Регрессионный анализ
- •4.1. Техника и способы регрессионного анализа
- •4.2 Выравнивание по уравнению прямой линии
- •4.3. Оценка точности выравнивания.
- •5. Дисперсионный анализ
- •5.1 Условия метода
- •5.2. Сущность метода и его задачи
- •5.3. Дисперсионный анализ однофакторного комплекса
- •5.4 Расчет оптимальной величины действующего фактора путем сравнения групповых средних (Мr)
- •Результаты дисперсионного анализа
- •Стандартные значения критерия для уровня вергоятности 0,95 (критерий фишера)
- •Библиографический список Основная литература
- •Дополнительная литература
3.5.Линейное корреляционное уравнение
После установления характера и тесноты корреляционной связи необходимо получить математическую модель исследуемой зависимости в виде уравнения связи. Если связь нелинейная, то необходимо подобрать функцию, график которой будет максимально приближен ко всем исходным точкам, а если линейная – то получить конкретное уравнение прямой.
В данной работе, независимо от того какой характер связи получится фактически, будем рассчитывать уравнение прямой, условно принимая, что связь между исследуемыми признаками линейная. Для этого необходимо преобразовать исходное уравнение прямой:
Подставив в приведенное выше уравнение все известные значения (My, r, σy, σx, Mx) неизвестными останутся только х и у:
В результате преобразований: у=3,1+0,1112x–2,798
получим конкретное уравнение прямой:
уx = 0,1112х + 0,3
Далее заполняется таблица (табл. 3.7) для построения графика. При этом значения yx рассчитываются по найденному выше конкретному уравнению прямой.
Таблица 3.7
Х (Wx) |
12 |
16 |
20 |
24 |
28 |
32 |
36 |
yср |
1,625 |
1,94 |
2,48 |
3,05 |
3,44 |
3,76 |
4,28 |
yx |
1,63 |
2,08 |
2,52 |
2,97 |
3,41 |
3,86 |
4,3 |
yср–yx |
-0,005 |
-0,14 |
-0,04 |
0,08 |
0,03 |
-0,1 |
-0,02 |
На графике изображаются исходные данные (yср) в виде отдельных точек и вероятные (yx – найденные по рассчитанному уравнению) – в виде прямой (рис. 3.3).
Рис. 3.3 Графическое изображение корреляционной связи.
4. Регрессионный анализ
4.1. Техника и способы регрессионного анализа
В качестве примера для аналитического выравнивания используются данные взаимосвязи двух сопряженных признаков: диаметров (Д), принимаемых за X, и высот деревьев (H), принимаемых за Y.
Таблица 4.1
Взаимосвязь диаметров и высот (невыравненные данные)
№ классов |
1 |
2 |
3 |
4 |
5 |
6 |
7 |
8 |
9 |
Д (X), см |
12 |
16 |
20 |
24 |
28 |
32 |
36 |
40 |
44 |
H (Y) м |
16,00 |
18,00 |
20,15 |
22,14 |
23,48 |
23,65 |
24,62 |
26,00 |
27,00 |
4.2 Выравнивание по уравнению прямой линии
Аналитическое выравнивание имеет своей конечной целью получение конкретного уравнения связи между двумя сопряженными признаками. В первую очередь исходные данные наносят на систему координат и по характеру расположения точек определяют функцию для выравнивания. Её график должен проходить максимально близко по отношению ко всем исходным точкам. В данном примере характер расположения точек линейный следовательно выравнивание осуществляем по уравнению прямой.
Как известно, уравнение линейной зависимости общего вида будет иметь вид: y = а x+b.
Вычисление конкретного уравнения сводится к определению числовых значений коэффициентов а, b, для получения которых существует несколько способов. Рассмотрим два, наиболее широко применяемых способа, характеризующихся различной точностью и трудоемкостью:
а) способ координат двух избранных точек, обеспечивающий получение менее точных результатов, но гораздо более простым путем;
б) способ наименьших квадратов, позволяющий получить достаточно точные результаты путем использования координат всех выравниваемых точек (наблюдений).
Остановимся на технике работ при вычислении конкретного уравнения методом координат избранных точек. В этом случае исходные данные изображаются на графике, и производится предварительное выравнивание. Результирующая линия проводится между точками с таким расчетом, чтобы разделить их общее количество на две приблизительно равные части. При этом необходимо стремиться к такому положению, чтобы расстояние между линией и исходными точками было кратчайшим. Для облегчения техники выравнивания и увеличения его точности можно рекомендовать следующий прием. Соединить все выравниваемые точки и постараться провести плановую выравнивающую линию по возможности ближе к этим серединам. При этом желательно провести прямую таким образом, чтобы хотя бы две исходные точки попали на неё. С полученной прямой линии снимаем координаты двух любых точек исходных данных (лежащих на проведенной прямой). Если число наблюдений в классах известно, то следует отдать предпочтение точкам, обеспеченным наибольшим числом наблюдений. В нашем примере в качестве избранных использованы координаты точек классов № 2 и № 6.
X2=16; Y2=18,00; X6=32; Y6=23,65.
Система двух конкретных уравнений приобретет вид
После подстановки координат избранных точек:
После решения системы относительно а и b, получим
а=0,35 b=12,4
Следовательно, полученное конкретное уравнение связи Y/Х (Д/Н) будет иметь вид
у=0,35x+12,4
Для краткости изложения в последующем тексте полученным уравнениям присвоены определенные номера: уравнение, вычисленное методом координат точек, получает номер I, а уравнение, полученное методом наименьших квадратов – номер II.
Пределы «работы» полученного уравнения по диаметру от 10 см до 46 см.
Рассмотрим технику вычислений при использовании способа наименьших квадратов. Для получения конкретного уравнения в этом случае используются координаты всех точек. Это учитывается при выведении системы уравнений для этого метода. Так, если записать уравнения прямой для каждой точки, а потом просуммировать левые и правые части всех уравнений, то получим следующее:
y1= ax1 + b
y2= ax2 + b
y3= ax3 + b
……………
……………
∑y=a∑x+bn.
Так как нам необходимо найти два неизвестных значения (a и b), то в системе должно быть два уравнения. Для получения второго уравнения системы умножим обе части каждого уравнения на соответствующий «х» и просуммируем левые и правые части уравнений. Получим:
x1y1= ax12 + bх1
x2y2= ax22 + bx2
x3y3= ax32 + bx3
….……………
….……………
∑хy=a∑x2+b∑х.
Таким образом, мы вывели оба уравнения системы:
Для удобства вычислений числовых значений указанной системы составляется вспомогательная таблица (табл.4.2).
Таблица 4.2
Вспомогательные расчеты для вычисления конкретного уравнения
прямой линии
Исходные данные |
ХY |
Х2 | |
Х |
Y | ||
12 |
16,00 |
192,00 |
144 |
16 |
18,00 |
288,00 |
256 |
20 |
20,15 |
403,00 |
400 |
24 |
22,14 |
531,36 |
576 |
28 |
23,48 |
657,64 |
784 |
32 |
23,65 |
756,80 |
1024 |
36 |
24,62 |
886,32 |
1296 |
40 |
26,00 |
1040,00 |
1600 |
44 |
27,00 |
1188,00 |
1936 |
|
|
|
|
Подставим итоговые данные в систему уравнений и вычислим коэффициенты а, b, имея в виду, что значение «n» соответствует числу классов по X:
Следовательно, конкретное уравнение будет иметь вид
Y=0,33Х+13,1
С целью последующего анализа результатов применения полученных уравнений вычисляются вероятные (теоретические) значения зависимого признака по первому уравнению (yв1) и второму уравнению (yв2). Последние (yв2) сравниваются с исходными (опытными) данными (у). Указанные сравнения (a = y–yв2) производятся по всем классам X, а их результат для прямой линии показан в табл. 4.3.
Таблица 4.3
Сравнение исходных и вероятных высот деревьев, полученных по уравнению прямой линии
Исходные данные |
Вероятные высоты |
Отклонения, м | ||
диаметр, см |
высота, м |
Ув1 |
Ув2 |
a = y–yв2 |
X |
Y | |||
12 |
16,00 |
16,60 |
17,06 |
-1,06 |
16 |
18,00 |
18,00 |
18,38 |
-0,38 |
20 |
20,15 |
19,40 |
19,70 |
+0,45 |
24 |
22,14 |
20,80 |
21,02 |
+1,12 |
28 |
23,48 |
22,20 |
22,34 |
+1,14 |
32 |
23,65 |
23,60 |
23,66 |
-0,01 |
36 |
24,62 |
25,00 |
24,98 |
-0,36 |
40 |
26,00 |
26,40 |
26,40 |
-0,40 |
44 |
27,00 |
27,80 |
27,62 |
-0,62 |
|
|
|
|
∑-0,12 |
Приведенные данные позволяют, прежде всего, проверить правильность вычислений, выполненных при получении конкретных уравнений, на предмет обнаружения грубых арифметических ошибок.
Правильность
вычисления уравнений связи проверяется
путем сравнения исходных значений Y
с вероятными (ув),
полученными по уравнению I
(ув1)
и уравнению II
(ув2)
Критерием правильности вычислений
уравнения I
будет совпадение вероятных значений
ув1
с
исходными значениями Y
для тех классов, в которых использованы
координаты точек в качестве исходных
для получения конкретного уравнения
I.
В нашем примере для уравнения прямой
линии значение ув1
равно
18,0, соответствует исходным данным Y
во втором классе, то есть также 18,0.
Аналогичное положение и в следующем,
шестом классе: ув1
=23,6
практически не отличается от Y
=23,65. Совпадение Y
и
в остальных классах не обязательно и
может наступить только случайно.
Некоторый контроль правильности уравнения II можно получить путем сопоставления Y и ув2 – во всех классах. В этом случае должно наблюдаться такое сочетание знаков (плюс и минус), которое отражает «срединное» положение выравнивающей прямой между выравниваемыми исходными значениями Y.
О явной неправильности полученного уравнения будет свидетельствовать наличие во всех классах только +, равно как и знаков -, а также, если в нескольких начальных классах будут наблюдаться отклонения с одним и тем же знаком ( + или -), а во всех последующих классах с противоположным, а именно:
+++++++
- - - - - - -
++++- - -
- - - -+++
Заметим, что описанные критерии правильности и вычислений I и II уравнений распространяются и на выравнивание по всем другим линиям связи.