
2.1 Попередній аналіз даних на придатність до моделювання.
Статистичне спостереження – початкова стадія статистичного дослідження. Це планомірний, науково організований процес збирання даних щодо масових явищ і процесів, які відбуваються в різних сферах життя, через їх реєстрацію за спеціальною програмою, розробленою на основі статистичної методології.
Мета статистичного спостереження – отримання статистичних даних, які є підставою для узагальнення характеристики стану та розвитку явища або процесу з визначенням відповідної закономірності.
Для початку необхідно зробити невеликий аналіз на придатність до моделювання. Для цього визначаються так звані числові характеристики досліджуваної виборки даних:
Основним рівнем досліджуваної величини зветься середнє арифметичне значення даної величини, що дорівнює математичному очікуванню виборки даних.
Дисперсія – середнє з квадратичних відхилень даної величини від основного рівня. Характеризує ступінь розкиду даних.
Стандартне відхилення – це лінійна характеристика розкиду даних навколо основного рівня.
Коефіцієнт варіації (f) чисельно дорівнює відношенню стандартного відхилення до основного рівня і береться у %.
Коефіцієнт варіації оцінює ступінь однорідності виборки даних.
Градації коефіцієнта варіації:
f 0 – 10% - сильна однорідність виборки;
f 10 – 20% - середня однорідність;
f 20 – 30% - слабка однорідність;
f 33% - гранична допустима неоднорідності.
Коефіцієнт кореляції (K) – визначає щільність зв’язку між фактором і показником досліджуваного процесу.
Коефіцієнт кореляції змінюється від -1 до +1, проходячи через 0.
Якщо К від’ємний, то досліджуваний процес є зворотнім (збільшення фактора викликає зменшення показника і навпаки).
Якщо К є додатнім – досліджуваний процес називають прямим (збільшення фактора викликає збільшення показника і навпаки).
Градації до коефіцієнта кореляції:
К = 1 – між фактором і показником існує функціональний зв’язок (однозначний);
якщо К від 0 до ± 0,35 , то це вказує на слабкий зв’язок між фактором і показником;
якщо К від ± 0,35 до ± 0,65, то зв’язок буде помітний;
якщо К від ± 0,65 до ± 0,99 – зв’язок сильний (чим ближче до 1, тим сильніший зв’язок);
коли К = 0 – зв’язку немає.
№ |
Рік |
Кількість овочевих культур, у яких спостерігалось пригнічення росту на 1 тис. рослин |
Cu, мг/кг |
Pb, мг/кг |
Zn, мг/кг |
|
|
Y |
X1 |
X2 |
X3 |
1 |
1984 |
30 |
1,25 |
4,9 |
0,2 |
2 |
1985 |
33 |
1,5 |
5 |
0,3 |
3 |
1986 |
35 |
1,5 |
5 |
0,3 |
4 |
1987 |
38 |
1,5 |
5,1 |
0,3 |
5 |
1988 |
41 |
1,6 |
5,2 |
0,3 |
6 |
1989 |
41 |
1,9 |
5,3 |
0,4 |
7 |
1990 |
43 |
1,9 |
5,4 |
0,4 |
8 |
1991 |
45 |
2 |
5,4 |
0,4 |
9 |
1992 |
47 |
2 |
5,5 |
0,5 |
10 |
1993 |
49 |
2,1 |
5,6 |
0,5 |
11 |
1994 |
50 |
2,2 |
5,7 |
0,5 |
12 |
1995 |
54 |
2,3 |
5,8 |
0,6 |
13 |
1996 |
50 |
2,6 |
5,9 |
0,6 |
14 |
1997 |
55 |
2,7 |
6,1 |
0,7 |
15 |
1998 |
57 |
2,8 |
6,2 |
0,7 |
16 |
1999 |
65 |
2,8 |
6,3 |
0,8 |
17 |
2000 |
66 |
2,9 |
6,5 |
0,9 |
18 |
2001 |
68 |
3,1 |
6,7 |
0,9 |
19 |
2002 |
69 |
3,3 |
6,9 |
1 |
20 |
2003 |
73 |
3,7 |
7,1 |
1,1 |
21 |
2004 |
74 |
3,9 |
7,3 |
1,2 |
22 |
2005 |
78 |
4 |
7,6 |
1,3 |
23 |
2006 |
80 |
4,2 |
8 |
1,4 |
Основний рівеннь |
|
53,96 |
2,51 |
6,02 |
0,67 |
Дисперсія |
|
226,77 |
0,76 |
0,80 |
0,12 |
Станд. відхилення |
|
15,06 |
0,87 |
0,89 |
0,35 |
Коеф. варіації |
|
27,91% |
34,81% |
14,84% |
52,78% |
Коеф. кореляції |
|
|
0,979 |
0,980 |
0,981 |
|
|
|
досить сильний зв`язок |
досить сильний зв`язок |
досить сильний зв`язок |
Провівши попередній аналіз даних на придатність до моделювання, за визначенням коефіцієнта кореляції бачимо, що між показником досліджуваного процесу і такими факторами, які впливають на нього, як свинець, мідь і цинк існують досить сильні прямі зв’язки.
Оскільки зв’язки між показником і факторами є досить сильними і мають суттєву однорідність і тому дозволяють побудувати модель, тобто дані придатні до моделювання.