Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Лаб3_Корр_анал_данных.docx
Скачиваний:
1
Добавлен:
17.09.2019
Размер:
382.87 Кб
Скачать
  • Записать выводы о возможности использования полученных уравнений для прогноза температур будущих периодов.

    2. Основные понятия

    Балансовая связь — характеризует зависимость между источниками формирования ресурсов (средств) и их использованием.

    — остаток товаров на начало отчетного периода;

    — поступление товаров за период;

    — выбытие товаров в изучаемом периоде;

    — остаток товаров на конец отчетного периода.

    Левая часть формулы характеризует предложение товаров

    , а правая часть — использование товарных ресурсов .

    Компонентные связи показателей коммерческой деятельности характеризуются тем, что изменение статистического показателя определяется изменением компонентов, входящих в этот показатель, как множители:

    Факторные связи характеризуются тем, что они проявляются в согласованной вариации изучаемых показателей. При этом одни показатели выступают как факторные, а другие — как результативные.

    Факторные связи могут рассматриваться как функциональные и корреляционные.

    При функциональной связи изменение результативного признака всецело зависит от изменения факторного признака :

    При корреляционной связи изменение результативного признака не всецело зависит от факторного признака , а лишь частично, так как возможно влияние прочих факторов :

    .

    Для того, чтобы установить, есть ли зависимость между величинами, используются многообразные статистические методы, позволяющие определить, во-первых — какие связи; во-вторых — тесноту связи (в одном случае она сильная, устойчивая, в другом — слабая); в-третьих — форму связи (т.е. формулу, связывающую величину и ).

    Для определения тесноты корреляционной связи применяется коэффициент корреляции.

    Коэффициент корреляции изменяется от -1 до +1 и показывает тесноту и направление корреляционной связи.

    Если отклонения по и по от среднего совпадают и по знаку, и по величине, то это полная прямая связь, то =+1.

    Если полная обратная связь, то =-1.

    Если связь отсутствует, то =0.

    Вычисление коэффициента корреляции.

    Важной характеристикой наличия взаимосвязи между параметрами является ко­эффициент корреляции. Для вычисления его значения необходимо ввести 2 массива дан­ных (ячейки Ai , Bi) по N => 20 значений. Этот коэффициент может принимать значения от 0 до 1. Чем выше значение коэффициента, тем больше взаимосвязь и тем больше она приближается к функциональной связи. Например, можно установить зависимость ме­жду средней температурой в помещении и использованием кондиционера. Коэффициент корреляции находится по стандартной функции:

    КОРРЕЛ(массив1;массив2)

    Если он превышает 0.65, то можно определять регрес­сионные зависимости по взятым данным. Если нет, то исходные данные надо изме­нить.

    Построение уравнений регрессии

    2.1. Линейная регрессия

    В регрессионном анализе изучается связь и определяется количественная зависимость между зависимой переменной и одной или несколькими независимыми переменными. Пусть переменная Y зависит от одной переменной X. При этом предполагается, что переменная X принимает заданные фиксированные значения, а зависимая переменная Y имеет случайный разброс из-за ошибок измерения, влияния неучтенных факторов и т.д. Каждому значению X соответствует некоторый закон распределения вероятностей случайной величины Y. Предположим, что Y в «среднем» линейно зависит от значений переменной X. Это означает, что условное математическое ожидание случайной величины Y при заданном значении X имеет вид

    . (1)

    Данная функция называется линейной теоретической функцией регрессии Y на X, а параметры a0 и a1 – параметрами линейной регрессии (коэффициенты регрессии). На практике параметры регрессии определяются по результатам наблюдений переменных Y и X, связь, между которыми, можно записать в виде

    ,

    где   случайная ошибка наблюдений. В регрессионном анализе полагают, что случайные ошибки наблюдений имеют нормальный закон распределения, то есть

    .

    Также считают, что отсутствует автокорреляция между ошибками, т.е. последовательные значения ошибок в каждом опыте i не зависят друг от друга

    Точность аппроксимации с помощью прямой (y = m^x + b), вычисленной по функции ЛИНЕЙН, зависит от степени разброса данных. Чем ближе данные к прямой, тем более точной является модель (уравнение), полученная по функции. Функция ЛИНЕЙН использует метод наименьших квад­ратов для определения наилучшей аппроксимации данных. Когда имеется только одна неза­висимая переменная x, то m и b вычисляются по следующим формулам:

    Формат функции: ЛИНЕЙН(известные_значения_y;известные_значения_x;конст;статистика)

    Конст - это логическое значение, которое указывает, требуется ли, чтобы кон­станта b была равна 0. Если конст. имеет значение ИСТИНА или опущено, то b вычисляется обыч­ным образом. Если конст имеет значение ЛОЖЬ, то b полагается равным 0 и значения m подбираются так, чтобы выполнялось соотношение y = mx.

    Статистика - это логическое значение, которое указывает, требуется ли рассчитать дополнительную статистику по регрессии. Если статистика имеет значение ИСТИНА, то функция ЛИНЕЙН расчитывает дополнительную регрессионную статистику, так что возвращаемый массив бу­дет иметь вид: {mn;mn-1;...;m1;b:sen; sen- b*...; se1; seb:r2;sey:F; df:ssreg;ssresid}. Если статистика имеет значение ЛОЖЬ или опущена, то функция ЛИНЕЙН расчитывает только коэффициенты m и постоянную b.

    На рис1. показано определение уравнения регрессии по двум переменным Xi и Yi.

    Рис.1

    Для расчета и вывода значений m и b зависимостей выделяются 2 ячейки, вызывают функцию, вводят исходные данные X и Y, указывают КОНСТ- истина и СТАТИС – истина, нажимают Ctrl + Shift +Enter, и с полученными коэффициентами m и b записывают уравнение.

    На рисунке 2 показан расчет линейной регрессии при задании одной (определяемой) пере­менной Yi. Независимые переменные Хi при этом берутся в виде натурального ряда чисел.

    Рис. 2.

    2.2. Уравнение нелинейной регрессии

    y = b*m^x , (2)

    Функция (2) устанавливает зависимость значений Y от независимых значений Х (аргументов). Значения m являются основанием для возведения в степень x, а значения b постоянны. Значения y, x и m могут быть векторами.

    Функция ЛГРФПРИБЛ расчитывает массив {mn;mn-1;...;m1;b}.

    Формат фукции (синтаксис):

    ЛГРФПРИБЛ(известные_значения_y;известные_значения_x;конст;статистика)

    Известные_значения_y - это множество значений y, которые уже известны для соотношения y = b*m^x. На рисунке 3 дан пример расчета исходных данных по экспоненте.

    Рис.3.

    2.3. Множественная Линейная Регрессия

    y = m1*x1 + m2*x2 + m3*x3 + m4*x4 + b

    Синтаксис

    ЛИНЕЙН (известные_значения_y;известные_значения_x;конст;статистика)

    возвращает параметры уравнения множественной регрессии:

    y = m1*x1 + m2*x2 + m3*x3 + m4*x4 + b

    Перед расчетом коэффициентов необходимо сформировать (построить) последовательный массив из переменных Х-ов. Переменные Х1 2 … должны быть в столцах А,В,С… .

    На рисунке 4 представлена задача нахождения уравнения множественной регрессии по четырем независимым переменным. Для вывода данных результата расчета, т.е. расчета дополнительной регрессии необходимо выделить нужное количество столбцов и строк для данных расчета (5х10 для рассматриваемого примера). Расчет производится Нажатием Ctrl + Shift +Enter. Данные выбираются в обратной

    Рис. 4.

    последовательности соответствий переменных и ячеек: X4 – A, , Х3 – B X2 – C, Х1 – D, Y – E. Полученное уравнение y = 25,6*x1 + 12618,4*x2 + 2709,2*x3- 231,8*x4 + 56587 дает возможность вычислять значения Yi по всему массиву значений Х-ов. Более подробное описание использования функций Ехcеl смотри в Справке программы.

    Март

    Апрель

    Май

    Июнь

    Июль

    Август

    Сентябрь

    Октябрь

    Ноябрь

    Т

    Д

    В

    Т

    Д

    В

    Т

    Д

    В

    Т

    Д

    В

    Т

    Д

    В

    Т

    Д

    В

    Т

    Д

    В

    Т

    Д

    В

    Т

    Д

    В

    1

    2

    749

    81

    14

    755

    27

    13

    756

    58

    32

    757

    31

    23

    747

    58

    24

    746

    91

    22

    745

    35

    19

    760

    55

    9

    754

    79

    2

    1

    747

    83

    11

    755

    36

    6

    741

    54

    20

    748

    67

    26

    746

    45

    29

    743

    48

    23

    746

    39

    18

    759

    52

    6

    742

    86

    3

    3

    747

    78

    15

    747

    29

    9

    745

    46

    20

    754

    41

    26

    746

    37

    18

    744

    94

    25

    746

    32

    17

    758

    44

    3

    744

    80

    4

    1

    745

    89

    14

    744

    46

    7

    744

    60

    21

    756

    31

    31

    744

    37

    18

    746

    76

    27

    740

    32

    12

    754

    82

    2

    738

    100

    5

    2

    752

    98

    12

    744

    59

    10

    746

    70

    24

    750

    38

    33

    742

    25

    25

    745

    54

    22

    736

    32

    15

    754

    60

    -1

    753

    90

    6

    3

    757

    89

    11

    738

    57

    9

    756

    41

    18

    754

    40

    36

    741

    20

    24

    746

    62

    13

    740

    63

    14

    752

    64

    -2

    754

    87

    7

    4

    757

    57

    9

    742

    30

    12

    754

    39

    22

    759

    34

    36

    746

    22

    26

    747

    50

    17

    742

    63

    11

    750

    87

    0

    748

    90

    8

    3

    757

    63

    6

    743

    29

    13

    744

    58

    19

    748

    46

    23

    746

    66

    31

    747

    46

    13

    746

    50

    12

    747

    98

    1

    746

    96

    9

    4

    758

    60

    4

    745

    40

    12

    739

    94

    23

    750

    34

    25

    746

    71

    22

    750

    52

    21

    749

    93

    11

    750

    77

    10

    5

    757

    62

    3

    745

    88

    14

    738

    59

    22

    749

    42

    22

    742

    65

    32

    755

    37

    16

    751

    66

    10

    753

    53

    11

    5

    756

    73

    9

    750

    81

    16

    744

    41

    21

    744

    59

    31

    742

    27

    27

    753

    32

    15

    753

    66

    9

    756

    84

    12

    4

    751

    78

    6

    745

    85

    20

    742

    49

    19

    743

    55

    34

    740

    22

    30

    749

    30

    18

    755

    54

    9

    759

    72

    13

    4

    759

    57

    8

    746

    47

    15

    745

    59

    23

    745

    69

    31

    738

    37

    31

    746

    24

    19

    753

    60

    13

    758

    54

    14

    7

    754

    55

    6

    747

    44

    17

    749

    38

    27

    747

    43

    29

    740

    31

    30

    744

    32

    19

    754

    64

    12

    760

    49

    15

    5

    746

    66

    7

    752

    53

    20

    751

    32

    27

    746

    46

    22

    747

    50

    29

    745

    30

    14

    758

    69

    12

    761

    61

    16

    5

    747

    62

    7

    752

    58

    26

    761

    35

    30

    745

    44

    22

    747

    50

    29

    745

    35

    13

    759

    58

    11

    762

    53

    17

    3

    741

    91

    9

    752

    40

    24

    748

    34

    32

    744

    40

    24

    745

    41

    30

    748

    36

    17

    760

    50

    10

    762

    46

    18

    5

    733

    92

    11

    749

    41

    22

    748

    38

    26

    741

    61

    27

    749

    32

    32

    749

    30

    18

    753

    44

    10

    763

    46

    19

    8

    742

    43

    13

    747

    44

    25

    750

    50

    24

    742

    55

    29

    749

    48

    34

    749

    24

    20

    751

    37

    10

    761

    50

    20

    10

    749

    45

    15

    743

    34

    27

    752

    37

    25

    740

    55

    26

    748

    39

    33

    750

    29

    21

    751

    35

    11

    761

    55

    21

    11

    755

    55

    8

    742

    40

    28

    753

    24

    19

    744

    58

    24

    749

    43

    34

    752

    26

    22

    751

    40

    13

    750

    48

    22

    10

    758

    43

    6

    744

    53

    29

    750

    27

    22

    745

    36

    24

    747

    50

    34

    752

    28

    18

    753

    58

    14

    749

    67

    23

    8

    761

    38

    7

    749

    67

    31

    748

    29

    15

    742

    79

    21

    747

    41

    33

    751

    21

    23

    755

    39

    16

    749

    72

    24

    9

    757

    45

    9

    750

    40

    31

    745

    24

    18

    739

    66

    25

    745

    42

    34

    753

    29

    22

    753

    48

    14

    754

    64

    25

    6

    754

    42

    11

    756

    25

    750

    41

    22

    740

    36

    28

    741

    45

    35

    751

    30

    14

    758

    44

    16

    752

    68

    Проверка полученных уравнений регрессии

    Проверка уравнений и получения значений погрешностей определяется обратным пересчетом:

    • в полученное уравнение подставляются исходные значения массива Х-ов (например давления, влажности) и получаются расчетные значения массива определяемого параметра Y (например температуры),

    • по массиву Y - ов определяют средние значение Yср. рас.

    • определяется абсолютное значение разности (отклонения) расчетных и текущих (действительных) значений Yоткл. = │ Yср. рас. – Yср. дейс.│,

    • определяется относительна (действительному значению) погрешность

    Yотн. =( Yоткл./ Yср. дейс.) * 100%,

    Допустимой считается погрешность 4… 6 %. При большем значении изменяют модель (уравнение) или количество переменных Х.

  • Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]