
- •1 Предмет курсу. Основні задачі
- •1.1 Математична модель. Види моделей
- •1.2 Типи розв'язуваних задач
- •3 Виявлення закономірностей (досліджуємо залежність одних змінних від інших):
- •4 Класифікація, тобто одержання відповіді на одне з питань:
- •1.3 Шкали вимірювання
- •1.4 Види шкал
- •1.5 Зв'язок шкал вимірювань і застосовуваних методів
- •Питання і завдання до розділу 1
- •2 Випадкові величини
- •2.1 Закон розподілу
- •2.1.1 Закон розподілу дискретної випадкової величини
- •2.1.2 Закон розподілу неперервної випадкової величини
- •2.2. Числові характеристики випадкових величин
- •2.2.1 Математичне сподівання
- •2.2.2 Дисперсія випадкової величини
- •2.2.3 Середнє квадратичне відхилення випадкових величин
- •2.2.4 Мода і медіана
- •Графік функції розподілу
- •Питання і завдання до розділу 2
- •Лабораторна робота Тема. Основні характеристики дискретної випадкової величини.
- •3 Нормальний розподіл і основні розподіли, пов'язані з ним
- •Нормальний розподіл
- •3.1.1 Обчислення ймовірності заданого відхилення від математичного сподівання
- •3.1.2 Правило трьох сигм (3σ)
- •3.1.3 Моменти
- •3.1.4 Оцінка відхилення теоретичного розподілу від нормального. Асиметрія та ексцес
- •3.2 Розподіл χ2 (розподіл Пірсона)
- •Функції Excel
- •3.3 Розподіл Стьюдента (t – розподіл)
- •Питання і завдання до розділу 3
- •Лабораторна робота Тема. Нормальний закон розподілу
- •4 Вибірковий метод
- •4.1 Теорема Чебишева
- •4.2 Основні поняття вибіркового методу
- •4.3 Емпіричний закон розподілу
- •4.3.1 Статистичний розподіл у вигляді таблиці
- •4.3.2 Графічне зображення статистичного розподілу
- •4.3.3 Побудова гістограми
- •4.4 Статистичні оцінки параметрів розподілу
- •4.4.1 Міри положення
- •4.4.2 Міри розсіювання
- •4.4.3 Міри форми
- •4.5 Визначення параметрів з використанням ms Excel
- •4.6 Довірчий інтервал
- •4.6.1 Довірчий інтервал для оцінки математичного сподівання нормального розподілу при невідомому
- •4.6.2 Довірчий інтервал для середнього квадратичного відхилення (нормальний розподіл)
- •Питання і завдання до розділу 4
- •Лабораторна робота Тема. Обчислення основних статистичних характеристик вибірки
- •5 Статистична перевірка статистичних гіпотез
- •Помилки першого і другого роду
- •5.1 Перевірка гіпотези про закон розподілу
- •5.1.1 Емпіричні та теоретичні частоти. Безперервний розподіл
- •5.1.2 Критерій згоди Пірсона
- •5.2 Поняття про параметричну, непараметричну і робастну статистику
- •5.3 Порівняння двох дисперсій нормальної генеральної сукупності
- •5.3.1 Критерій Фішера
- •5.4 Порівняння виправленої вибіркової дисперсії з гіпотетичною генеральною дисперсією
- •5.5 Перевірка гіпотез про середні для нормальної генеральної сукупності
- •5.5.2 Перевірка гіпотези про рівність середніх при нерівних дисперсіях (малі вибірки)
- •5.5.4 Перевірка гіпотези про рівність середніх при зв'язаних вибірках
- •5.5.5 Порівняння вибіркової середньої (з генеральної нормальної сукупності) із заданим а
- •Питання і завдання до розділу 5
- •6 Перевірка наявності зв'язку між змінними
- •6.1 Кореляційний аналіз (ка)
- •6.1.1 Властивості коефіцієнта кореляції
- •Зауваження
- •6.1.2 Значущість коефіцієнта кореляції
- •6.2 Поняття про багатовимірний кореляційний аналіз
- •6.2.1 Часткова кореляція
- •6.2.2 Множинний коефіцієнт кореляції
- •Питання і завдання до розділу 6
- •Лабораторна робота Тема. Багатофакторний кореляційний аналіз
5.5.2 Перевірка гіпотези про рівність середніх при нерівних дисперсіях (малі вибірки)
Умови:
– вибірки розподілені нормально;
– дисперсії невідомі і різні;
– дані незалежні.
Використовується критерій Стьюдента
, (5.12)
де K – число ступенів вільності, обчислюється таким чином:
–2,
де N1,
N 2
– розміри вибірок;
виправлені
дисперсії;
оцінки
середніх значень.
Правила вибору правильної гіпотези аналогічні 5.5.1 (таблиця 5.2).
В Excel Сервис – Анализ данных – Двухвыборочный t-тест с разными дисперсиями.
Приклад. На заводі з метою контролю вмісту марганцю в одній з марок сталі зробили 10 відливів з конвертора 1 і стільки ж з конвертора 2. Чи можна вважати вміст марганцю в сталі, виплавленій в цих конверторах, однаковим з рівнем значущості =0,05?
-
Конвертор 1
Конвертор 2
1,05
1,38
1,11
1,34
1,14
1,32
1,17
1,30
1,18
1,38
1,21
1,35
1,25
1,35
1,14
1,32
Задача зводиться до перевірки гіпотези про рівність середніх значень двох вибірок. Але спочатку необхідно перевірити, чи значущо відрізняються їх дисперсії.
Для перевірки рівності дисперсій висуваємо такі гіпотези:
H0: S1=S2; H1: S1≠S2.
Fкр
знаходимо з рівняння
;
α/2=0,025.
Обираємо Сервис – Анализ данных – Двухвыборочный F-тест для дисперсии. Отримаємо такі дані.
Двухвыборочный F-тест для дисперсии |
||
|
Переменная 1 |
Переменная 2 |
Среднее |
1,15625 |
1,3425 |
Дисперсия |
0,003769643 |
0,000821429 |
Наблюдения |
8 |
8 |
df |
7 |
7 |
F |
4,589130435 |
|
P(F<=f) одностороннее |
0,031104627 |
|
F критическое одностороннее |
4,994888059 |
|
Як бачимо з таблиці Fp= 4,589, Fкр=3,787. Оскільки Fp>Fкр , гіпотезу H0 відхиляємо. Отже, дисперсії не рівні, тобто S1≠S2.
Перевіряємо, чи можна вважати рівними середні значення вибірок. Висуваємо гіпотези
,
.
Вибираємо в пакеті Анализ данных – Двухвыборочный t-тест с разными дисперсиями.
Двухвыборочный t-тест с разными дисперсиями |
||
|
Переменняа 1 |
Переменная 2 |
Среднее |
1,15625 |
1,3425 |
Дисперсия |
0,003769643 |
0,000821429 |
Наблюдения |
8 |
8 |
Гипотетичческая разность средних |
0 |
|
df |
10 |
|
t-статистика |
-7,774710921 |
|
P(T<=t) одностороннее |
7,55449E-06 |
|
t критическое одностороннее |
2,228139238 |
|
P(T<=t) двостороннее |
1,5109E-05 |
|
t критическое двостороннее |
2,633769327 |
|
Як бачимо з таблиці tp=-7,775, tкp.двост=2,634. Оскільки |tр|>tкр, приймаємо гіпотезу Н1.
Висновок: не можна вважати вміст марганцю в сталі однаковим у цих конверторах.
5.5.3 Перевірка гіпотез про середні з довільно розподіленими дисперсіями (вибірки великі n >30, незалежні)
Якщо вибірки великого обсягу, то вибіркові дисперсії є досить гарними оцінками генеральних дисперсій, а вибіркові середні розподіляються приблизно нормально. Критерій
, (5.13)
де D1 та
D2 –
дисперсії вибірок;
розміри
вибірок;
– середні значення вибірок.
Z розподілено за стандартним нормальним законом N (0; 1).
1. Висуваємо гіпотези:
Н0 :
,
Н1 :
.
Тоді Zкр.двостороннє обчислюємо за допомогою функції Лапласа
Ф (Zкр) = (1-α)/2. (5.14)
Якщо Zр < Zкр двостороннє – приймаємо гіпотезу Н0,
Zр > Zкр двостороннє – приймаємо гіпотезу Н1.
2. Висуваємо гіпотези:
Н0 :
,
Н1 :
.
Тоді Zкр.одностороннє обчислюємо за допомогою функції Лапласа
Ф (Zкр.одностороннє) = (1-2 α)/2. (5.15)
Якщо Zр < Zкр.одностороннє – приймаємо гіпотезу Н0;
Zр > Zкр.одностороннє – приймаємо гіпотезу Н1.
Вибираємо в пакеті Анализ данных – Двухвыборочный Z–тест для средних.
Двухвыборочный z-тест для средних |
|
|
|
|
|
|
Переменная 1 |
Переменная 2 |
Среднее |
|
|
Известная дисперсия |
|
|
Наблюдения |
|
|
Гипотетическая разность средних |
|
|
Z |
|
|
P(Z<=z) одностороннее |
|
|
z критическое одностороннее |
|
|
P(Z<=z) двухстороннее |
|
|
z критическое двухстороннее |
|
|
Z – відповідає Zр , що розраховане за даними вибірками, z критическое одностороннее – використовують для задач, що відповідають випадку (5.15) (Zкр.одностороннє); z критическое двухстороннее – використовують для задач, що відповідають випадку (5.14) (Zкр.двостороннє).