- •Статистика
- •За даними таблиці 3.4 визначити відносні величини структури, порівняння та координації.
- •Розв’язок типових завдань
- •Розв’язок типових завдань
- •Розв’язок типових завдань
- •Розв’язок типових завдань
- •Розв’язок типових завдань
- •Розв’язок типових завдань
- •Розв’язок типових завдань
- •Список рекомендованої літератури
- •Додатки
- •Імовірності розподілу помилок вибірки
- •Критичні значення кореляційного відношення і рівень коефіцієнта детермінаціїR
- •Критичні значення f-критерію
- •Квантилі
Розв’язок типових завдань
Завдання 7.10
Необхідно:
– використовуючи дані таблиці 7.7 про споживання м’яса та м’ясопродуктів у сім’ях робітників і службовців залежно від рівня середньодушового сукупного доходу, за допомогою кореляційного відношення оцінити тісноту зв’язку між названими показниками. Відомо, що загальна дисперсія споживання м’яса і м’ясопродуктів становить 12,9. Перевірити істотність зв’язку між цими ознаками з імовірністю 0,95.
Дані для виконання:
Таблиця 7.7. Дані про споживання м’яса та м’ясопродуктів у сім’ях робітників і службовців залежно від рівня середньодушового сукупного доходу
Рівень середньодушового сукупного доходу |
Кількість сімей, % до підсумку |
Споживання м’яса і м’ясопродуктів на члена сім’ї за рік, кг |
Низький |
21 |
47 |
Середній |
52 |
63 |
Високий |
27 |
83 |
Разом |
100 |
65 |
Розв’язок. Результативною ознакою y є споживання м’яса і м’ясопродуктів, а факторною x – рівень середньодушового сукупного доходу. Для оцінки тісноти зв’язку між цими ознаками використовують відношення , де–міжгрупова і загальна дисперсія.
Міжгрупову дисперсію обчислюють за формулою
Розрахунок міжгрупової дисперсії подано в таблиці 7.8.
Таблиця 7.8. Розрахунок міжгрупової дисперсії
Номер груп за факторною ознакою |
f I |
_ y i |
_ _ y i – y |
_ _ 2 (y i – y) f I |
1 |
21 |
47 |
-18 |
378 |
2 |
52 |
63 |
-2 |
104 |
3 |
27 |
83 |
18 |
486 |
Разом |
100 |
65 |
- |
968 |
Міжгрупова дисперсія становить , а загальна= 12,9, кореляційне відношення –
Це означає, що 75% варіації споживання м’яса і м’ясопродуктів залежить від рівня середньодушового сукупного доходу, 25% припадає на долю інших ознак.
Істотність зв’язку перевіримо за допомогою F-критерію
.
Число ступенів вільності можна визначити так:
k1 = m – 1 = 3 – 1 = 2,
k2 = n – m = 100 – 3 = 97,
де m – число груп за факторною ознакою; n – кількість елементів сукупності;
Фактичне значення F-критерію більше від критичного F0,95(2; 97) = 3,11, тобто зв’язок між рівнем середньодушового сукупного доходу і споживанням м’яса та м’ясопродуктів з імовірністю 0,95 визнається істотним.
Завдання 7.11
Необхідно:
– за даними таблиці 7.9 обчислити параметри лінійного рівняння регресії, надати їм економічну інтерпретацію;
– за допомогою коефіцієнта детермінації визначити тісноту зв’язку між урожайністю кукурудзи та строком її збирання.
– перевірити істотність зв’язку між зазначеними ознаками з імовірністю 0,95.
Дані для виконання:
Таблиця 7.9. Залежність урожайності кукурудзи від строку збирання урожаю обстежено 10 господарств, які належать до однієї природно-кліматичної зони
Номер господарства |
Строк збирання урожаю, днів |
Урожайність кукурудзи, ц/га |
1 |
27 |
25 |
2 |
23 |
45 |
3 |
18 |
48 |
4 |
20 |
44 |
5 |
25 |
41 |
6 |
30 |
22 |
7 |
24 |
45 |
8 |
34 |
20 |
9 |
16 |
52 |
10 |
20 |
50 |
Розв’язок. Результативною ознакою y є урожайність кукурудзи, а факторною x – строк збирання урожаю.
Для оцінки параметрів лінійного рівняння регресії складають систему нормальних рівнянь, що має вигляд
Розрахункові суми для складання систем нормальних рівнянь наведено в таблиці 7.10. Отже,
Таблиця 7.10. Розрахунок сум для складання систем нормальних рівнянь
№ з/п |
x |
y |
xy |
2 x |
2 y |
Y |
_ 2 (Y – y) |
А |
1 |
2 |
3 |
4 |
5 |
6 |
7 |
1 |
27 |
25 |
675 |
729 |
625 |
32,60 |
43,56 |
2 |
23 |
45 |
1035 |
529 |
2025 |
40,64 |
2,07 |
3 |
18 |
48 |
864 |
324 |
2304 |
50,69 |
132,02 |
4 |
20 |
44 |
880 |
400 |
1936 |
46,67 |
55,80 |
5 |
25 |
41 |
1025 |
625 |
1681 |
36,62 |
6,66 |
6 |
30 |
22 |
660 |
900 |
484 |
26,57 |
159,52 |
7 |
24 |
45 |
1080 |
576 |
2025 |
38,63 |
0,33 |
8 |
34 |
20 |
680 |
1156 |
400 |
18,53 |
427,25 |
9 |
16 |
52 |
832 |
256 |
2704 |
54,71 |
240,56 |
10 |
20 |
50 |
1000 |
400 |
2500 |
46,67 |
55,80 |
Разом |
237 |
392 |
8731 |
5895 |
16684 |
- |
1123,57 |
392 = 10b0 + 237b1;
8731 = 237b0 + 5895b1.
Після розв’язку цієї системи будь-яким способом одержимо
Y = 86,87 – 2,01x.
При збільшенні строку збирання урожаю кукурудзи на один день її урожайність знижується в середньому на 2,01 ц/га.
На підставі рівняння регресії обчислюють теоретичні значення Y для всіх елементів сукупності. Наприклад, для першого господарства Y1 = 86,87 – 2,01х27 = 32,6 ц/га.
Теоретичні значення Y використовують для обчислення коефіцієнту детермінації
,
де – факторна,– загальна дисперсія.
Отже,
Таким чином, 85,3% варіації урожайності кукурудзи лінійно пов’язані зі строком збирання урожаю.
Перевірку істотності зв’язку здійснюють за допомогою F-критерію, або для ступенів вільнoсті:
k1 = m – 1 = 2 – 1 = 1;
k2 = n – m = 10 – 2 = 8,
де m – число параметрів рівняння регресії для лінійного рівняння (m = 2), а n – кількість елементів сукупності (n = 10).
Критичне значення для імовірності 0,95 згідно з додатком становить(1,8) = 0,399. Фактичне значення= 0,853 перевищує критичне, що свідчить про істотність зв’язку.
Завдання 7.12
Необхідно:
– за результатами соціологічного опитування робітників-верстатників (таблиця 7.11) обчислити коефіцієнт асоціації, перевірити істотність зв’язку з імовірністю 0,95.
Дані для виконання:
Таблиця 7.11. Дані соціологічного опитування робітників-верстатників
Чи задоволені ви темпами кваліфікаційного зростання |
Чи маєте намір оволодіти суміжною професією |
Разом | |
так |
ні | ||
Так |
46 |
12 |
58 |
Ні |
14 |
28 |
42 |
Разом |
60 |
40 |
100 |
Розв’язок.Коефіцієнт асоціації обчислюють за формулою
,
де – частоти відповідних комбінацій ознак. За розрахунком коефіцієнт асоціації становить +0,46, що свідчить про наявність прямого зв’язку між темпами кваліфікаційного зростання і набуттям суміжних професій,
.
Перевірку істотності зв’язку здійснюють за допомогою критерію c, статистична характеристика якого функціонально пов’язана з коефіцієнтом асоціації,
c=nA.
Критичне значення cдля рівня істотностіa = 0,05 і числа ступенів вільності K = 1 становить c0,95 (1) = 3,84 (див. додаток).
Фактичне значення c= 100 х 0,46 = 21,2 більше від критичного. Отже, зв’язок між темпами кваліфікаційного зростання і набуттям суміжних професій істотний.
Завдання 7.13
Необхідно:
– за даними таблиці 7.12 обчислити коефіцієнт співзалежності; з імовірністю 0,95 перевірити істотність зв’язку між ознаками.
Дані для виконання:
Таблиця 7.12. Дані комбінаційного розподілу подружніх пар за віком, років
Вік дружини |
Вік чоловіка |
Разом | ||
15 – 29 |
30 – 44 |
45 і більше | ||
15 – 29 |
21 |
5 |
1 |
27 |
30 – 44 |
4 |
30 |
10 |
44 |
45 і більше |
- |
5 |
24 |
29 |
Разом |
25 |
40 |
35 |
100 |
Розв’язок. Оскільки число груп за обома ознаками однакове, використовуємо формулу коефіцієнта співзалежності Чупрова
,
де c=– сума стандартизованих відхилень фактичних частот розподілу від теоретичних;m1 та m2 – кількість груп за першою і другою ознаками; n – кількість елементів сукупності.
Розрахунок cподано в таблиці 7.13. Теоретичні частоти обчислюють на основі підсумкових частот.
Наприклад, і т. д.
Таблиця 7.13. Розрахункова таблиця
Група i j |
f i j |
f ‘i j |
f i j – f ‘i j |
2 (f i j – f ‘i j) |
2 (f i j – f ‘i j) / f ‘i j |
11
|
21
|
7
|
14
|
196
|
28,0
|
12 |
5 |
11 |
-6 |
36 |
3,3 |
13 |
1 |
9 |
-8 |
64 |
7,1 |
21 |
4 |
11 |
-7 |
49 |
4,4 |
22 |
30 |
18 |
12 |
144 |
13,1 |
23 |
10 |
15 |
-5 |
25 |
8,0 |
31 |
0 |
7 |
-7 |
49 |
7,0 |
32 |
5 |
12 |
-7 |
49 |
4,1 |
33 |
24 |
10 |
14 |
196 |
19,6 |
Разом |
100 |
100 |
0 |
- |
96,3 |
Коефіцієнт співзалежності становить 0,49, тобто
.
Перевірку істотності зв’язку здійснюють за допомогою критерію cз числом ступенів вільностіK = (m1 – 1) (m2 – 1) = 2 x 2 = 4.
Критичне значення c(0,95) (4) = 9,49 значно менше від фактичногоc= 96,3, отже, зв’язок між віком подружжя істотний.
Завдання 7.14
Необхідно:
– обчислити коефіцієнт рангової кореляції та перевірити істотність зв’язку між результатами лижників у кросах і лижних гонках з імовірністю 0,95.
Дані для виконання:
Підсумкові результати в кросах (ранг Х) і лижній гонці (ранг Y) у 10 лижників розподілились так:
X |
1 |
2 |
3 |
4 |
5 |
6 |
7 |
8 |
9 |
10 |
Y |
2 |
3 |
1 |
4 |
7 |
5 |
10 |
6 |
9 |
8 |
Розв’язок. Коефіцієнт рангової кореляції визначають за формулою Спірмена
r = 1 – ,
де n – кількість елементів сукупності; d = – відхилення рангів.
Розрахунок суми квадратів відхилень рангів наведено в таблиці 7.14.
Таблиця 7.14. Розрахунок суми квадратів відхилень рангів
X |
Y |
d = |
2 d |
1 |
2 |
1 |
1 |
2 |
3 |
1 |
1 |
3 |
1 |
2 |
4 |
4 |
4 |
0 |
0 |
5 |
7 |
2 |
4 |
6 |
5 |
1 |
1 |
7 |
10 |
3 |
9 |
8 |
6 |
2 |
4 |
9 |
9 |
0 |
0 |
10 |
8 |
2 |
4 |
- |
- |
- |
28 |
За розрахунком коефіцієнт рангової кореляції становить 0,83.
Критичне значення r для a = 0,05 наведено в додатку. Для n = 10 критичне значення r 0,95 = 0,563 менше від фактичного, що свідчить про істотний зв’язок між ознаками.
Завдання 8.1
Необхідно:
дати повну і змістовну відповідь на наступні питання.
Дані для виконання:
1. Сутність вибіркового спостереження. та характеристика основних видів вибірок
2. Основні види вибірок
3. Види і порядок розрахунку помилок вибіркового спостереження
Завдання 8.2
Необхідно:
– обчислити середні витрати часу на завантаження вагона шихтою та з імовірністю 0,997 помилку вибірки для середньої.
Дані для виконання:
За даними вибіркового обстеження, витрати часу на завантаження вагону шихтою з вугільної башти становлять, с: 104, 113, 110, 108, 105, 97, 103, 111, 119, 100.
Завдання 8.3
Необхідно:
– за даними таблиці 8.1 обчислити: 1) середнє число дітей у сім’ях переселенців та довірчий інтервал для середньої з імовірністю 0,954; 2) з такою самою імовірністю граничну помилку та довірчий інтервал для частки сімей, які мають троє і більше дітей.
Дані для виконання:
Таблиця 8.1. Дані 20%-го вибіркового обстеження 100 сімей переселенців із зони жорсткого радіаційного контролю
Число дітей |
0 |
1 |
2 |
3 |
4 |
5 |
Разом |
Число сімей |
8 |
32 |
28 |
19 |
10 |
3 |
100 |
Завдання 8.4
Необхідно:
– за даними таблиці 8.2 обчислити: 1) середній строк служби верстатів та довірчий інтервал для середньої з імовірністю 0,997; 2) граничну помилку і довірчий інтервал для частки верстатів, строк служби яких більш, як 12 років, з такою самою імовірністю.
Дані для виконання:
Таблиця 8.2. Дані 5%-го вибіркового обстеження верстатів за строком служби
Строк служби, років |
до 4 |
4 – 8 |
8 – 12 |
12 і більше |
Разом |
Кількість верстатів |
25 |
40 |
20 |
15 |
100 |
Завдання 8.5
Необхідно:
– за даними табл. 8.3 визначити середній процент під кредит, граничну помилку та довірчий інтервал для середньої з імовірністю 0,954.
Дані для виконання:
Комерційні банки надають кредит на купівлю автомобілів під 12%, дилери, що торгують автомобілями, – 8 – 16%.
Таблиця 8.3. Дані вибіркового обстеження 25 дилерів
Процент під кредит |
8 – 10 |
10 – 12 |
12 – 14 |
14 і більше |
Число дилерів |
2 |
6 |
10 |
7 |
Завдання 8.6
Необхідно:
– визначити: 1) з імовірністю 0,954 граничну помилку та довірчий інтервал для частки тих відповідей, що передбачають поліпшення ситуації, припускаючи, що думку висловили випадково відібрані бізнесмени; 2) яка має бути вибіркова сукупність, щоб точність висновку щодо погіршення ситуації на ринку з імовірністю 0,997 не перевищила 5%.
Дані для виконання:
При опитуванні, яке проводилось асоціацією промисловців відносно перспектив торгівлі в найближчі півроку, думки 64 бізнесменів розподілилися так: 28 осіб вважають, що ситуація поліпшиться, 16 – погіршає, 20 осіб – змін не передбачається.
Завдання 8.7
Необхідно:
– встановити, яка має бути вибіркова сукупність, щоб помилка вибірки для частки працюючого без простоїв обладнання з імовірністю 0,954 не перевищила 5%.
Дані для виконання:
За даними пробного вибіркового обстеження роботи ковальсько-пресового обладнання (обсяг вибірки – 16), в першу зміну без простоїв працювало 80% машин.
Завдання 8.8
Необхідно:
– за даними таблиці 8.4 визначити: 1) середній вміст жиру в молоці; 2) середнє квадратичне відхилення і дисперсію вмісту жиру; 3) з імовірністю 0,954 граничну помилку вибірки та інтервал, в якому знаходиться середній вміст жиру в молоці.
Дані для виконання:
Таблиця 8.4. Вміст жиру у 15 партіях молока
Вміст жиру, % |
Кількість партій |
2,8 |
3 |
2,9 |
4 |
3,0 |
5 |
3,4 |
3 |
Завдання 8.9
Необхідно:
– за даними таблиці 8.5 визначити: 1) середній відсоток вологості; 2) середнє квадратичне відхилення; 3) з імовірністю 0,997 граничну помилку вибірки для середньої вологості всієї партії виробів.
Дані для виконання:
Таблиця 8.5. Дані вибіркового обстеження трьох відсотків виробів партій готової продукції
Відсоток вологості |
До 15, 0 |
15,0 – 17,0 |
17,0 – 19,0 |
19,0 – 21,0 |
21,1 – 23,0 |
Кількість виробів |
8 |
23 |
35 |
20 |
13 |
Завдання 8.10
Необхідно:
– за даними табл. 8.5 визначити з ймовірністю 0,997, в яких границях коливається середній відсоток природного убутку в генеральній сукупності.
Дані для виконання:
Таблиця 8.5. Дані обстеження 100 рівних за вагою партій
Відсоток природного убутку |
3 – 5 |
5 – 7 |
7 – 9 |
9 – 11 |
11 – 13 |
Разом |
Кількість партій товару |
10 |
26 |
43 |
16 |
5 |
100 |
Завдання 8.11
Необхідно:
– за даними табл. 8.6 визначити середнє навантаження на одного продавця, середнє квадратичне відхилення; з ймовірністю 0,954, в яких границях міститься середній розмір навантаження в генеральній сукупності.
Дані для виконання:
Таблиця 8.6. Дані обстеження 100 продавців
Товарообіг на одного продавця, млн. грош. од. |
1 – 5 |
5 – 10 |
10 – 15 |
15 – 20 |
Разом |
Кількість продавців |
24 |
40 |
26 |
10 |
100 |
Завдання 8.12
Необхідно:
– за даними табл. 8.7 визначити ймовірність того, що помилка репрезентативності при визначенні середньої зольності вугілля не перевищує 0,3 %.
Дані для виконання:
Із різних вагонів вугілля, який надійшов на електростанцію, в порядку випадкової і безповторної вибірки взято 100 проб для визначення зольності. На підставі аналізу отримані наступні дані:
Таблиця 8.7. Дані вибіркового обстеження 100 проб за рівнем зольності
Зольність, % |
До 12 |
12 – 14 |
14 – 16 |
16 – 18 |
18 – 20 |
Більше 20 |
Число проб |
10 |
20 |
70 |
50 |
30 |
20 |
Завдання 8.13
Необхідно:
– за даними таблиці 8.8 з ймовірністю 0,954 визначити границі, в яких можна очікувати середні витрати часу на виготовлення одної деталі всіма верстатними підприємствами. З ймовірністю 0,997 визначити частку верстатників, у яких витрати часу вище 25 хвил.
Дані для виконання:
Для вивчення продуктивності праці верстатників заводу проведено 10 %-ве вибіркове обстеження за методом безповторного відбору.
Таблиця 8.8. Дані вибіркового обстеження робітників-верстатників для визначення продуктивності праці
Час обробки деталі, хвил. |
17 – 19 |
17 – 21 |
21 – 23 |
23 – 25 |
25 – 27 |
Число працівників |
10 |
24 |
50 |
82 |
34 |