- •1. Що включає в себе первинний статистичний аналіз?
- •2. Як побудувати гістограму?
- •3. Що таке гістограма?
- •Як перевірити точність отриманих даних?
- •Які статистичні характеристики використовуються для визначення відхилень?
- •Що таке математичне сподівання?
- •Що таке дисперсія?
- •Що таке середнє квадратичне відхилення?
- •9. Для чого використовується коефіцієнт асиметрії?
- •Що значить коефіцієнт ексцесу?
- •Як визначити, чи існує нормальний закон розподілу?
- •12. Що таке закон розподілу?
- •13. Які види гістограм ви знаєте?
- •14. Що таке коефіцієнт кореляції?
- •15. Які властивості коефіцієнта кореляції?
- •16. Які є види коефіціентів кореляції? Чим вони відрізняються?
- •17.Як розраховується парна рангова кореляція?
- •18. Як визначаэться, чи існує залежність між метриками?
- •1 9. Як можна розрахувати коефіцієнт кореляції?
- •20. Що таке регресія?
- •21. Для чого використовується регресія?
- •22. Які є передумови визначення регресії?
- •23. Які є методи побудови регресії?
- •24. Як побудувати регресію?
- •25. Як визначити функцію регресії?
- •26. Які визнаєте засоби автоматизації обробки даних?
- •27. Які визнаєте засоби автоматизації аналізу даних?
- •28. Що таке caesEзасоби?
- •29. Що таке експертне оцінювання?
- •30. Які ви знаєте властивості програмного забезпечення?
- •31. Як і коли може використовуватися експертне оцінювання програмного забезпечення?
- •32. Що таке рефакторинг?
- •33. Які дані можна отримати після проведення вимірювань в Visual Studio?
- •35. Які дані можна отримати після проведення вимірювань в iPlasma?
- •37. При рефакторингу використовуються наступні метрики пз
- •40. Які метрики краще використовувати при проведенні рефакторинга? Чому?
- •41. Як можна використати метрики при розробці нового пз?
- •42. Які метрики краще використовувати і для яких цілей при розробці нового пз?
17.Як розраховується парна рангова кореляція?
Для пар „метрика – експертна оцінка”, які не мають нормального закон розподілу, проводиться парна рангова кореляція. Суть парної рангової кореляції заключається в порівнянні не самих значень величин, чи їх статистичних характеристик, а рангів, тобто номерів величин (метрик та експертних оцінок) у відповідних матрицях (наборах статистичних даних). Визначається парна рангова кореляція методом обчислення коефіцієнта Спірмена чи Кендала. Якщо значення коефіцієнта виявилось рівним 0, то робиться висновок про відсутність кореляції, і пара „метрика – експертна оцінка” відкидається. Якщо коефіцієнт кореляції приймає значення 1, чому відповідає повне співпадання коефіцієнтів, то робиться висновок про прямо пропорційну залежність (тобто лінійну), якщо -1, то робиться висновок про обернено пропорційну залежність (тобто також лінійну). Якщо ж коефіцієнт кореляції приймає інше значення, то далі його перевіряють на значущість, перевіряючи гіпотезу, що коефіцієнт рівний 0.
Отже, результатом даного етапу є відсіювання незалежних між собою пар „метрика – експертна оцінка” та визначення за можливістю виду залежності для інших пар.
18. Як визначаэться, чи існує залежність між метриками?
Процес визначення залежності між метриками проводиться наступним чином. Спочатку за визначеними раніше законами розподілу всі метрики та експерті оцінки класифікуються на ті, що мають нормальний розподіл, і ті, що його не мають. Для пар „метрика – експертна оцінка”, які мають нормальний закон розподілу, проводиться просте визначення коефіцієнту кореляції та його оцінка. При коефіцієнті кореляції рівному 0, ніякого зв’язку в парі немає. Якщо коефіцієнт кореляції знаходиться між -1 і 1, присутній лінійний регресійний зв’язок. Якщо ж коефіцієнт кореляції рівний 1, то має місце функціональний зв’язок. Далі проводиться визначення значущості коефіцієнта кореляції (висувається гіпотеза, що коефіцієнт кореляції рівний 0), при якому використовується t – тест на основі статистичної характеристики, яка має t – розподіл Стьюдента. Якщо дане значення значущості менше, ніж задане табличне, ця пара відсіюється з подальших досліджень. У випадку значущості проводиться дослідження на довірчі інтервали. При потраплянні коефіцієнту в довірчі інтервали можна зробити висновок про те, що дана метрика і експертна оцінка мають лінійну регресійну залежність. В іншому випадку вони відсіюються.
1 9. Як можна розрахувати коефіцієнт кореляції?
Спочатку перевіряємо чи є розподіл нормальним, чи ні. Якщо розподіл нормальний, то рахуємо коефіцієнт кореляції через формулу лінійної кореляції Спірмена:
де xi, yi - це масиви даних, а х і у з рисками це математичне сподівання кожного з масивів.
Якщо у нас не нормальний закон розподілу, а то ми будемо використовувати рангову кореляцію Спірмена. Її суть полягає в тому, що спочатку ми беремо два масиви, далі в кожному масиві ми розподіляємо ранги залежно від величини значення кожного елементу масиву. Ранг дорівнює порядку елементу в відсортованому масиві. Після цього ми знаходимо суму квадратів різниці рангів пар елементів масивів, тобто від рангу першого елемента масиву віднімаємо ранг першого елементу іншого масиву, від другого - другий і тд. Далі ми підраховуємо коефіцієнт кореляції за формулою:
де
- це і є сума
квадратів різниці рангів пар елементів
масивів, а n - кількість елементів в
масиві.
