Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Geostatiscics-Part2(new).DOC
Скачиваний:
0
Добавлен:
01.04.2025
Размер:
1.43 Mб
Скачать

Міністерство освіти і науки України

Львівський національний університет імені Івана Франка

Микола Хом’як

Курс лекцій

Частина 2 Вступ до дисперсійного, кореляційного та регресійного аналізу

Львів

Видавничий центр ЛНУ імені Івана Франка

2004

ББК Д3/5 к 95 я 73

Х-76

УДК 55:311(075.8)

Рецензенти:

канд. геол.-мін. наук,

доц. Л.З. Скакун (Львівський національний університет імені Івана Франка)

канд. фіз.-мат. наук,

доц. П.С. Венгерський (Львівський націо­нальний університет імені Івана Франка)

Рекомендовано до друку Вченою радою геологічного факультету. Протокол № 11/5 від 19 травня 2004 р.

Х-76 Хом’як М.М. Геостатистика. Курс лекцій. Ч. 2: Вступ до дисперсійного, кореляційного та регресійного аналізу. – Львів: Видавничий центр ЛНУ імені Івана Франка, 2004. – 47 с.

Розглянуто основи класичних методів статистики: дисперсій­ного, кореляційного та регресійного аналізу. Описано статистичні методи оцінки тренда, поліноміальний тренд і метод найменших квадратів для оцінки його параметрів.

Для студентів геологічного факультету.

© Хом’як М.М., 2004

1. Виділення аномальних об’єктів і однорідних груп серед сукупності Два типи задач

Перший тип задач полягає у виділенні суттєво відмінних за середнім вмістом (аномальних) об’єктів на загальному фоні пере­важно більшої групи об’єктів. Таку задачу називатимемо задачею класифікації набору об’єктів на фонову групу та аномальні об’єкти.

Другий тип задач полягає в обґрунтованому виділенні серед набору об’єктів груп однорідності (за середнім вмістом деякого параметра).

Між цими задачами нема різкої межі. Виділення аномальних об’єктів потребує менше затрат часу, а розбиття на статистично однорідні групи більш затратне.

Для розв’язування задач першого типу можна використову­вати узагальнений критерій Стьюдента для k об’єктів або ранго­вий критерій Краскала–Волліса (див. далі непараметричний однофакторний дисперсійний аналіз), а для задач другого типу – критерій хі-квадрат, побудований на статистиці Велча або Вілкоксона.

Обом типам задач відповідає одна і та ж нульова гіпотеза:

(1.1)

за альтернативи

(1.2)

хоча б для однієї пари індексів .

Однофакторний непараметричний дисперсійний аналіз Краскала–Волліса

Дисперсійний аналіз використовують для виявлення суттєвих чинників (факторів), що зумовлюють мінливість даних. Далі його розглянемо детальніше. Для однофакторного аналізу вва­жають суттєвою дію тільки одного фактора, що має декілька рівнів. Тому дані розбивають на декілька груп, що відповідають рівням наявності (дії) цього фактора. Якщо дія фактора суттєва, то логічно припустити, що середній вміст даних на кожному з рівнів буде різним (тобто фактор зумовлює мінливість даних). Навпаки, якщо справджується гіпотеза про рівність середніх на всіх рівнях (1.1), то дія фактора несуттєва.

Непараметричний дисперсійний аналіз Краскала–Волліса формально передбачає таке:

  • побудову варіаційного ряду і присвоєння рангів елементам об’єднаної вибірки для всіх рівнів факторів, – обсяг усієї вибірки;

  • знаходження суми рангів елементів для кожного з рівнів фактора;

  • обчислення статистики критерію Краскала–Волліса

; (1.3)

  • відшукання критичного зна­чення для заданого рівня значущості : якщо кількість даних на кожному з рівнів перевищує 5, то статистика має -розподіл з ступенями вільності;

  • відкидання гіпотези (1.1), якщо (вплив фактора суттєвий).

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]