Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
EMPImodul2_empi.docx
Скачиваний:
0
Добавлен:
01.07.2025
Размер:
582.48 Кб
Скачать

1. Що включає в себе первинний статистичний аналіз?

2. Як побудувати гістограму?

3. Що таке гістограма?

4. Як перевірити точність отриманих даних?

5. Які статистичні характеристики використовуються для визначення відхилень?

6. Що таке математичне сподівання?

7. Що таке дисперсія?

8. Що таке середнє квадратичне відхилення?

9. Для чого використовується коефіцієнт асиметрії?

10. Що значить коефіцієнт ексцесу?

11. Як визначити, чи існує нормальний закон розподілу?

12. Що таке закон розподілу?

13. Які види гістограм ви знаєте?

14. Що таке коефіцієнт кореляції?

15. Які властивості коефіцієнта кореляції?

16. Які є види коефіцієнтів кореляції? Чим вони відрізняється?

17. Як розраховується парна рангова кореляція?

18. Як визначити, чи існує залежність між метриками?

19. Як можна розрахувати коефіцієнт кореляції?

20. Що таке регресія?

21. Для чого використовується регресія?

22. Які є передумови визначення регресії?

23. Які є методи побудови регресії?

24. Як побудувати регресію?

25. Як визначити функцію регресії?

26. Які визнаєте засоби автоматизації обробки даних?

27. Які визнаєте засоби автоматизації аналізу даних?

28. Що таке CAESE-засоби?

29. Що таке експертне оцінювання?

30. Які ви знаєте властивості програмного забезпечення?

31. Як і коли може використовуватися експертне оцінювання програмного забезпечення?

32. Що таке рефакторинг?

33. Які дані можна отримати після проведення вимірювань в Visual Studio?

34. Як використати дані вимірювань в Visual Studio? Які висновки можна зробити?

35. Які дані можна отримати після проведення вимірювань в iPlasma?

36. Як використати дані вимірювань в iPlasma? Які висновки можна зробити?

37. Як метрики ПЗ використовуються при рефакторингу?

38. Чи відрізняються прямі метрики при вимірюванні проекту вцілому та окремо кожного класу? Чому?

39. Чи відрізняються непрямі метрики при вимірюванні проекту вцілому та окремо кожного класу? Чому?

40. Які метрики краще використовувати при проведенні рефакторинга? Чому?

41. Як можна використати метрики при розробці нового ПЗ?

42. Які метрики краще використовувати і для яких цілей при розробці нового ПЗ?

1. Що включає в себе первинний статистичний аналіз?

На етапі первинного статистичного аналізу відбувається дослідження вхідних статистичних даних. Спочатку аналізуються   метрики, отримані в результаті вимірювання набору програм, далі експертні оцінки, що зробили експерти для цього ж набору програм. В ході дослідження спочатку виявляється графічний вигляд (гістограма) закону розподілу. Після побудови гістограми за її виглядом можна відсіяти частину метрик, які мають багатомодальний вигляд, так як статистичний аналіз залежностей побудований на дослідженні унімодальних законів розподілу. Для уточнення законів розподілу визначаються статистичні характеристики, такі як математичне сподівання, середнє квадратичне відхилення, коефіцієнти асиметрії та ексцесу. Наступним етапом є визначення математичного сподівання – ключової величини в аналізі. На основі значень математичного сподівання проводиться видалення аномальних явищ (відхилень), при якому за допомогою квантилів розподілу Стьюдента  визначаються „грубі” значення, тобто такі значення, які не потрапляють під заданий закон розподілу, і значно віддалені від математичного сподівання. Після видалення аномальних явищ проводяться обчислення коефіцієнтів асиметрії та ексцесу.

Оскільки метою цього етапу є визначення „нормальності” розподілу, то досліджується даний закон розподілу на симетричність. Для цього всі статистичні характеристики обчислюються у зсуненому та  в незсуненому виглядах. Зсунені дані являють собою обчислені результати вимірів, незсунені – теоретичні значення, які повинні приймати характеристики при „нормальності” розподілу. Далі проводиться інтервальне оцінювання параметрів. Якщо значення статистичної характеристики не потрапляє  в заданий інтервал робиться висновок, що метрика (експертна оцінка) не має нормального розподілу. Для всіх метрик та експертних оцінок, які пройшли попередній етап проводиться порівняння коефіцієнтів асиметрії та ексцесу із заданим теоретично нормальним. Після цього на основі гістограм та висновків аналізу числових характеристик робиться висновок про „нормальність” закону розподілу величини.

Кінцевою метою первинного статистичного аналізу є визначення, чи належить побудований закон до нормального. Причиною цього є те, що подальший аналіз базується на перевірці на „нормальність” закону розподілу, тобто кожний з наступних етапів починається цією перевіркою, і в залежності від відповіді застосовуються різні методи обчислень.

2. Як побудувати гістограму?

Побудова варіаційного ряду (гістограми) вимагає ранжування результатів спостережень та обчислення відповідних їм частот і випадковостей:

х1, х2, ..., хr

n1, n2, ..., nr

f1, f2, ..., fr,

  • де r – кількість варіант;

  • хі – і-те значення х метрики;

  • ni – частота хі, ;

fi- випадковість хі. ; - випадковість хі.

По осі абсцис відкладають значення варіант хі, а по осі ординат — відповідні значення fі, що дозволяє швидко візуально оцінити емпіричні ймовірності тих чи інших реалізацій.

Для побудови гістограми проводиться розбиття варіаційного ряду на класи. Для цього фіксується рівномірне розбиття осі спостережень ∆h на класи, де h — крок розбиття. Крок розбиття визначається із співвідношення:

де а — початок спостережень (окремий випадок х1 = а);

b — кінець спостережень (окремий випадок хг = b );

т — кількість елементів розбиття ∆h (кількість класів).

Кількість класів — величина довільна, проте радять вибирати т непарним і таким, щоб гістограма, по можливості, не мала осциляції випадковостей і була більш-менш "гладкою". Iснує оптимальна кількість класів, яка залежить від обсягу даних вибірки п та від типу їх закону розподілу (мається на увазі врахуванї асиметрії та ексцесу). При п < 100 можна використати формулу

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]