
- •1 Предмет курсу. Основні задачі
- •1.1 Математична модель. Види моделей
- •1.2 Типи розв'язуваних задач
- •3 Виявлення закономірностей (досліджуємо залежність одних змінних від інших):
- •4 Класифікація, тобто одержання відповіді на одне з питань:
- •1.3 Шкали вимірювання
- •1.4 Види шкал
- •1.5 Зв'язок шкал вимірювань і застосовуваних методів
- •Питання і завдання до розділу 1
- •2 Випадкові величини
- •2.1 Закон розподілу
- •2.1.1 Закон розподілу дискретної випадкової величини
- •2.1.2 Закон розподілу неперервної випадкової величини
- •2.2. Числові характеристики випадкових величин
- •2.2.1 Математичне сподівання
- •2.2.2 Дисперсія випадкової величини
- •2.2.3 Середнє квадратичне відхилення випадкових величин
- •2.2.4 Мода і медіана
- •Графік функції розподілу
- •Питання і завдання до розділу 2
- •Лабораторна робота Тема. Основні характеристики дискретної випадкової величини.
- •3 Нормальний розподіл і основні розподіли, пов'язані з ним
- •Нормальний розподіл
- •3.1.1 Обчислення ймовірності заданого відхилення від математичного сподівання
- •3.1.2 Правило трьох сигм (3σ)
- •3.1.3 Моменти
- •3.1.4 Оцінка відхилення теоретичного розподілу від нормального. Асиметрія та ексцес
- •3.2 Розподіл χ2 (розподіл Пірсона)
- •Функції Excel
- •3.3 Розподіл Стьюдента (t – розподіл)
- •Питання і завдання до розділу 3
- •Лабораторна робота Тема. Нормальний закон розподілу
- •4 Вибірковий метод
- •4.1 Теорема Чебишева
- •4.2 Основні поняття вибіркового методу
- •4.3 Емпіричний закон розподілу
- •4.3.1 Статистичний розподіл у вигляді таблиці
- •4.3.2 Графічне зображення статистичного розподілу
- •4.3.3 Побудова гістограми
- •4.4 Статистичні оцінки параметрів розподілу
- •4.4.1 Міри положення
- •4.4.2 Міри розсіювання
- •4.4.3 Міри форми
- •4.5 Визначення параметрів з використанням ms Excel
- •4.6 Довірчий інтервал
- •4.6.1 Довірчий інтервал для оцінки математичного сподівання нормального розподілу при невідомому
- •4.6.2 Довірчий інтервал для середнього квадратичного відхилення (нормальний розподіл)
- •Питання і завдання до розділу 4
- •Лабораторна робота Тема. Обчислення основних статистичних характеристик вибірки
- •5 Статистична перевірка статистичних гіпотез
- •Помилки першого і другого роду
- •5.1 Перевірка гіпотези про закон розподілу
- •5.1.1 Емпіричні та теоретичні частоти. Безперервний розподіл
- •5.1.2 Критерій згоди Пірсона
- •5.2 Поняття про параметричну, непараметричну і робастну статистику
- •5.3 Порівняння двох дисперсій нормальної генеральної сукупності
- •5.3.1 Критерій Фішера
- •5.4 Порівняння виправленої вибіркової дисперсії з гіпотетичною генеральною дисперсією
- •5.5 Перевірка гіпотез про середні для нормальної генеральної сукупності
- •5.5.2 Перевірка гіпотези про рівність середніх при нерівних дисперсіях (малі вибірки)
- •5.5.4 Перевірка гіпотези про рівність середніх при зв'язаних вибірках
- •5.5.5 Порівняння вибіркової середньої (з генеральної нормальної сукупності) із заданим а
- •Питання і завдання до розділу 5
- •6 Перевірка наявності зв'язку між змінними
- •6.1 Кореляційний аналіз (ка)
- •6.1.1 Властивості коефіцієнта кореляції
- •Зауваження
- •6.1.2 Значущість коефіцієнта кореляції
- •6.2 Поняття про багатовимірний кореляційний аналіз
- •6.2.1 Часткова кореляція
- •6.2.2 Множинний коефіцієнт кореляції
- •Питання і завдання до розділу 6
- •Лабораторна робота Тема. Багатофакторний кореляційний аналіз
4.3.3 Побудова гістограми
Можна побудувати гістограму за допомогою функції, що наявна в пакеті Анализ данных. Для цього спочатку необхідно відсортувати варіаційний ряд за зростанням.
Потім введіть набір граничних значень, які визначають границі відрізка (кишені). Ці значення повинні бути введені у зростаючому порядку із кроком h, а також xmin<x1, xn<xmax.
Наприклад:
Х |
Кишеня |
2.24 |
2 |
3.05 |
4 |
3.87 |
6 |
4 |
8 |
5.09 |
|
6.78 |
|
7.01 |
|
Потім у меню послідовно вибирається Сервис – Анализ данных. У вікні, що з'явилося, вибираємо пункт Гистограмма:
Після цього з'являється вікно, у якому необхідно задати вихідні дані для побудови гістограми:
Параметри діалогового вікна Гистограмма мають таке призначення:
Вхідний інтервал – у цьому вікні необхідно задати посилання на діапазон комірок, у яких знаходяться вхідні дані. Вхідні дані повинні являти собою перелік значень, а не частот!
Інтервал кишень (необов'язковий) – введіть у поле діапазон комірок, що містить набір граничних значень, тобто визначають границі відрізків (кишені).
У Microsoft Excel обчислюється число влучень даних між поточним початком відрізка і сусіднім більшим за значенням, якщо такий є. При цьому включаються значення на нижній границі відрізка і не включаються значення на верхній границі.
Якщо діапазон кишень не був введений, то набір відрізків, рівномірно розподілених між мінімальним і максимальним значеннями даних, буде створений автоматично.
Мітки – ставиться відмітка, якщо перший рядок або перший стовпець вхідного інтервалу містить заголовки. Якщо такі відсутні, назви для даних вихідного діапазону створюються автоматично.
Вихідний діапазон – вводиться посилання на лівий верхній кут вихідного діапазону. Розмір останнього буде визначений автоматично, і на екран буде виведене повідомлення у разі можливого накладення вихідного діапазону на вхідні дані.
Новий робочий лист – встановлюється перемикач, щоб відкрити новий лист у книзі і вставити результати аналізу, починаючи з комірки А1.
Нова робоча книга – щоб відкрити нову робочу книгу і вставити результати аналізу в комірку А1, на першому листі в цій книзі встановлюється перемикач.
Парето (відсортована діаграма) – при виборі цієї можливості дані представляються в порядку спадання частоти. У математичній системі така форма гістограми не використовується.
Інтегральний відсоток – розраховуються значення і будується графік накопиченої частоти.
Виведення графіка – встановлюється прапорець для автоматичного створення вбудованої діаграми.
П
риклад
побудови гістограми в Excel.
4.4 Статистичні оцінки параметрів розподілу
Після того як визначений вигляд закону розподілу, необхідно оцінити його параметри. Наприклад, для нормального закону розподілу треба визначити математичне сподівання і середнє квадратичне відхилення, тому що ці параметри цілком визначають його.
Звичайно в розпорядженні дослідника є значення деякої ознаки x1…xn, отримані в результаті n незалежних спостережень.
Розглядаючи x1,x2…xn як незалежні випадкові величини X1,X2,…,Xn, можна сказати, що знайти статистичну оцінку невідомого параметра теоретичного розподілу – це означає знайти функцію від випадкових величин, що спостерігаються, яка дає наближене значення оцінюваного параметра.
Наприклад, для оцінки математичного сподівання нормального закону розподілу служить функція
.
Властивості оцінок параметрів
Незсуненість – це означає, що при проведенні великої кількості випробувань з вибірками будь якого розміру середнє значення кожної вибірки тяжіє до дійсного значення генеральної сукупності. Наприклад, M(Q*)= Q (математичне сподівання прирівнюється до оцінюваного параметра Q при будь-якому обсязі вибірки). Зсуненість, як правило, обумовлена наявністю систематичної помилки.
Спроможність. Із збільшенням розміру вибірки оцінка повинна наближатися до значення відповідного параметра генеральної сукупності з імовірністю, що наближається до 1.
Ефективність. Обрана оцінка для вибірок рівного обсягу повинна мати мінімальну дисперсію.
Достатність. Оцінка повинна містити всю необхідну інформацію і не вимагати додаткової.
До характеристик одновимірного розподілу відносять:
-
Міри положення (середнє, медіана, мода та інші).
-
Міри розсіювання (дисперсія, середнє квадратичне відхилення, коефіцієнт варіації, розмах).
-
Міри форми (асиметрія, ексцес, моменти 3-го і 4-го порядку).