Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

ПРАКТИЧЕСКИЕ РАБОТЫ-12,13

.pdf
Скачиваний:
37
Добавлен:
28.02.2016
Размер:
1.1 Mб
Скачать

Задание 4. Критерий сравнения двух выборок, свободный от вида закона распределения.

Проверьте значимость различия средних переменных «индекс_1» и «индекс_5» с помощью критерия Манна—Уитни. Воспользуйтесь шаблоном на листе «сравнение средних 2».

1)Для выбранных переменных («индекс_1» и «индекс_5») вычислите:

количество наблюдений (в ячейках В32:С32),

оценки среднего x (в ячейках В33:С33),

среднеквадратических отклонений S (в ячейках В34:С34)

и стандартных ошибок среднего m (в ячейках В35:С35). Используйте статистические функции, указанные в задании 1.

При этом должны получиться значения оценок средних с учѐтом стандартной ошибки ( x m): 7,15 0,186 и 6,79 0,124. На первый взгляд, они значимо различаются.

2)В пустой столбец электронной таблицы с названием «Индексы 1 и 5» скопируйте 30 значений переменной «Индекс_1», а затем 30 значений переменной «Индекс_5». Всего будет 60 значений.

3)В следующем столбце (с названием «Номер переменной») укажите напротив первых 30-ти значений номер переменной «1», напротив следующих 30-ти значений – номер переменной

«5».

4)Определите средние ранги наблюдений в столбце «Индексы 1 и 5» в соответствии с указаниями в задании 2.

5)После того, как определили средние ранги, снова отсортируйте полученную таблицу (диапазон F1:I61), но уже по номеру переменной, таким образом, чтобы в первых 30-ти ячейках стояли данные по переменной «индекс_1», а в следующих 30-ти – данные по переменной «индекс_5».

6)Вычислите суммы средних рангов (R1 и R5) для переменных «Индекс_1» и «Индекс_5».

Правильно вычисленные значения будут равны R1 = 1019 и

R5= 811.

7) Вычислите значения статистик Манна-Уитни по формулам:

 

U

1

n n

n1(n1 1)

 

R ,

 

 

Примечание:

 

1

5

 

2

1

 

 

 

 

 

 

 

в нашем случае количества

U n n n5 (n5 1) R .

наблюдений n1 = n5 = n = 30.

 

 

 

 

 

 

 

 

5

1

5

 

 

 

 

 

2

 

5

 

 

 

 

 

 

 

 

 

Должны получиться значения: U1 = 346, U5 = 554.

8)Найдите наименьшее значение из вычисленных U1 и U5 (используйте функцию MIN). Это и будет значение расчѐтной (вычисленной) статистики критерия Манна—Уитни.

9)Определите критическое значение Uкрит для данного случая. Для этого воспользуйтесь таблицей в файле «Table_Man-Whitney-U.pdf». В таблице критических значений на пересечении строки, соответствующей объему выборки переменной «Индекс_1» (30), и столбца для объема выборки переменной «Индекс_5» (30) найдите число. Это и есть критическое значение Uкрит.

10)Сравните вычисленную статистику критерия Манна—Уитни U и критическое значение Uкрит.

Если Uкрит > U , то принимается гипотеза о значимом различии выборочных средних. В противном случае гипотеза отвергается.

Внашем случае Uкрит = 317 < 346 = U. Поэтому делаем вывод о том, что средние переменных «индекс_1» и «индекс_5» между собой значимо не различаются.

11

Задание 5. Подготовка к контрольной работе.

1) Посмотрите на гистограммы распределения переменных «индекс_2» и «индекс_6» (Вы их построили при выполнении задания 1). По виду гистограммы сделайте вывод о нормальности законов распределения каждой из переменных.

Постройте график рассеивания для переменных «индекс_2» и «индекс_6». По виду графика постарайтесь сделать вывод о силе корреляционной связи между этими переменными.

Какой коэффициент корреляции (линейный Пирсона или ранговый Спирмена) будет более правильным использовать для оценки силы взаимозависимости между этими переменными?

Вычислите соответствующий коэффициент корреляции и подтвердите свой вывод, сделанный по виду графика рассеивания.

Посмотрите на средние значения, стандартные ошибки среднего, медианы и моды переменных «индекс_2» и «индекс_6» (Вы их вычислили при выполнении задания 1). Как Вы думаете, значимо ли различаются эти переменные?

Какой из критериев сравнения двух выборок (Стьюдента или Манна—Уитни) будет более правильным использовать для проверки значимости различия этих переменных и почему?

Проверьте значимость различия переменных «индекс_2» и «индекс_6», воспользовавшись

соответствующим критерием.

2)Посмотрите на гистограммы распределения переменных «индекс_1» и «индекс_5» (Вы их построили при выполнении задания 1). По виду гистограммы сделайте вывод о нормальности законов распределения каждой из переменных.

Постройте график рассеивания для переменных «индекс_1» и «индекс_5». По виду графика постарайтесь сделать вывод о силе корреляционной связи между этими переменными.

Какой коэффициент корреляции (линейный Пирсона или ранговый Спирмена) будет более правильным использовать для оценки силы взаимозависимости между этими переменными?

Вычислите соответствующий коэффициент корреляции и подтвердите свой вывод, сделанный по виду графика рассеивания.

Посмотрите на средние значения, стандартные ошибки среднего, медианы и моды переменных «индекс_1» и «индекс_5» (Вы их вычислили при выполнении задания 1). Как Вы думаете, значимо ли различаются эти переменные?

Какой из критериев сравнения двух выборок (Стьюдента или Манна—Уитни) будет более правильным использовать для проверки значимости различия этих переменных и почему?

Проверьте значимость различия переменных «индекс_1» и «индекс_5», воспользовавшись

соответствующим критерием.

12

Контрольные вопросы по теме:

1.Генеральная совокупность.

2.Выборочная совокупность.

3.Типы данных.

4.Шкалы измерений.

5.Виды графиков для описания данных.

6.Гистограмма распределения.

7.Что такое выброс.

8.Количественные данные (генеральная совокупность): среднее, дисперсия, средненквадратическое отклонение.

9.Параметрические и непараматрические методы статистики.

10.Статистические гипотезы.

11.Описательные статистики для выборок с нормальным законом распределения.

12.Описательные статистики для выборок с законом распределения отличным от нормального.

13.Что такое медиана? Как она соотносится с выборочным средним?

14.Мода выборки. Что определяет значение моды?

15.Чем характеризуется разброс значений в выборке для случаев нормального или ненормального законов распределения?

16.Среднеквадратическое отклонение.

17.Квартили, процентили.

18.Минимальное, максимальное значение в выборке. Еѐ размах.

19.Ошибка среднего. Что она показывает?

20.Статистические функции для вычисления описательных статистик в пакете LibreOffice Calc.

21.Виды связей между переменными. Статистическая связь.

22.Корреляция.

23.Линейный коэффициент корреляции Пирсона.

24.Ранговый коэффициент корреляции Спирмена.

25.Коэффициент детерминации в линейной регрессии. Его связь с коэффициентом корреляции.

26.В каких пределах может изменяться значение коэффициента корреляции.

27.Что означает, что коэффициент корреляции больше или меньше 0.

28.Понятие рангов. Средний ранг.

29.Критерии сравнения значимости различия средних двух выборок.

30.Критерий сравнений двух средних Стьюдента.

31.Критерий Манна-Уитни для сравнения двух выборок.

13