Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

М1ДВ1.2 Мат_обработка_данных

.pdf
Скачиваний:
31
Добавлен:
23.02.2015
Размер:
1.19 Mб
Скачать

Тема 1.5. Способы графического представления результатов исследования

График. Виды графиков: гистограмма, полигон, кумулята, диаграмма. Виды диаграмм: состыкованные, столбчатые (простые и кластеризованные), линейные (простые и сложные), с областями (простые и состыкованные), круговые, максимальных и минимальных значений, коробчатые (простые, для разных переменных, кластеризованные) рассеяния.

Гистограмма – специальное графическое изображение нескольких дискретных величин в выборке. Представляет собой совокупность нескольких вытянутых вверх прямоугольников, высота которых пропорциональна частоте встречаемости каждого из значений переменной в

выборке.

Кумулята – график накопленной частоты.

Диаграмма – круговая гистограмма, построенная на основе частностей.

Полигон частот– ломаная линия, отрезки которой соединяют точки с координатами (хi; fi). Полигон частностей - ломаная линия, отрезки которой соединяют точки с координатами (хi;

wi).

Раздел II Проверка статистических гипотез

Тема 2.1. Дескриптивная (описательная) статистика

Мода правила определения моды. Медиана. Правила определения медианы. Среднее арифметическое. Размах значений выборки. Дисперсия. Среднеквадратическое отклонение. Коэффициент вариации. Структурные средние или квантили распределения: процентиль, квартиль, квинтель, дециль.

Средняя арифметическая применяется, если известны значения усредняемого признака и количество единиц совокупности с определенным значением признака.

Средняя арифметическая простая употребляется при следующих условиях: каждое значение признака встречается 1 раз; исходные данные не упорядочены.

Средняя арифметическая простая равна сумме отдельных значений признака, деленной на число этих значений.

Например, средняя арифметическая признаков, обладающих числовыми значениями 3, 6 и 9, равна 6.

Средняя арифметическая обладает рядом свойств:

от уменьшения или увеличения частот каждого значения признака величина средней арифметической не изменится;

если все частоты разделить или умножить на какое-либо число, то величина средней не изменится

Структурные средние — вспомогательные характеристики изучаемой статистической совокупности, имеющие вполне конкретное значение признака, т. е. значение одной из вариант.

Для характеристики структуры вариационных рядов применяются так называемые структурные средние.

Различают такие структурные средние, как.

1.мода;

2.медиана;

3.дециль;

4.перцентиль.

Мода — это наиболее часто встречающаяся варианта признака в данной совокупности.

В вариационных рядах мода определяется по наибольшей частоте. Предположим, товар А реализуют в городе 9 фирм по цене в рублях: 44; 43; 44; 45; 43; 46; 42; 46; 43; Так как чаще всего встречается цена 43 руб., то она и будет модальной.

Мода применяется для решения некоторых практических задач. Так, например, при изучении товарооборота рынка берется модальная цена, для изучения спроса на обувь, одежду используют модальные размеры обуви и одежды и др.

Медиана — такое значение варьирующего признака, которое делит ряд распределения на 2 равные части по объему частот. Медиана рассчитывается по-разному в дискретных и интервальных рядах.

В дискретных вариационных рядах с нечетным числом единиц совокупности — это конкретное численное значение в середине ряда. Так, в группе студентов из 27 человек медианным будет рост у 14-го, если они выстроятся по росту. Если число единиц совокупности четное, то медианой будет средняя арифметическая из значений признака у 2 средних членов ряда. Так, если в группе 26 человек, то медианным будет средний рост 13-го и 14-го студентов.

Квартель — значение признака, делящее совокупность на 4равнее части. Квинтель — значение признака, делящее совокупность на 5 равных частей.

Децель — значение признака, делящее совокупность на 10 равных частей. Перцентель — значение признака, делящее совокупность на 100 равных частей.

Вариация признака — различие индивидуальных значений признака внутри изучаемой совокупности, возникающее в результате того, что индивидуальные значения складываются под совокупным влиянием разнообразных факторов, которые по-разному сочетаются в каждом отдельном случае.

Не всякие различия принято называть вариацией. Под вариацией в статистике понимают такие количественные изменения величины исследуемого признака в пределах однородной совокупности, которые обусловлены перекрещивающимся влиянием действия различных факторов.

Размах вариации — наиболее простой показатель, характеризующий колеблемость признака и показывающий отличие самого большого и самого малого значения признака у единицы совокупности.

Размах вариации (амплитуда колебаний) — разность между наибольшим и наименьшим значениями вариантов.

Дисперсия — это средняя арифметическая квадратов отклонений каждого значения

признака от общей средней. Дисперсия обычно называется средним квадратом отклонений. Среднее квадратическое отклонение представляет собой корень квадратный из дисперсии

и обозначается.

Среднее квадратическое отклонение — это обобщающая характеристика абсолютных размеров вариации признака в совокупности. Выражается оно в тех же единицах измерения, что и признак (в метрах, тоннах, процентах, гектарах и т. д.), в отличие от дисперсии, которая не имеет единицы измерения.

Среднее квадратическое отклонение является мерилом надежности средней. Чем меньше среднее квадратическое отклонение, тем лучше средняя арифметическая отражает собой всю представляемую совокупность.

Свойства дисперсии:

1.уменьшение или увеличение весов (частот) варьирующего признака в определенное число раз дисперсии не изменяет;

2.уменьшение или увеличение каждого значения признака на одну и ту же постоянную величину дисперсии не изменяет;

3.уменьшение или увеличение каждого значения признака в какое-то число раз

Существует 3 вида дисперсий:

общая — вариация, измеряющая вариацию признака по всей совокупности под влиянием всех факторов, обусловивших эту вариацию, количественно вычисляется с помощью формул простой и взвешенной дисперсий;

межгрупповая — вариация, характеризующая вариацию результативного признака, обусловленную влиянием фактора, положенного в основание группировки;

внутригрупповая – дисперсия, отражающая случайную вариацию, т.е. обусловленную влиянием неуточенных факторов. Может быть вычислена как простая или взвешенная дисперсия.

Общая дисперсия равна сумме средней и межгрупповой дисперсий.

Тема 2.2. Анализ статистических гипотез

Теоретическая, статистическая и экспериментальная гипотезу исследования.

Статистический вывод. Ошибки первого и второго рода при статистических выводах. Способы уменьшения вероятности совершения этих ошибок.

Уровни статистической значимости (низкий, достаточный, высокий) и их соотношение с уровнями достоверности результатов (достаточный, высокий, очень высокий) исследования.

Гипотеза – предположение, имеющее вероятностный характер, обладающее неопределенностью в отношении своей истинности.

Гипотеза - предположение о результатах исследования или способах их достижения. Статистическая гипотеза – формальное предположение о том, что сходство или различие

некоторых особенностей, изученных в исследовании, случайно или неслучайно.

Уровни статистической значимости

Низкий – 5 % уровень значимости Достаточный – 1 % уровень значимости Высокий – 0,1 % уровень значимости

Уровни достоверности результатов исследования

Достаточный – 95 % уровень достоверности Высокий – 99 % уровень достоверности Очень высокий -99,9 % уровень достоверности.

Тема 2.3. Соответствие эмпирических данных нормальному закону распределения

Проверка распределения на соответствие нормальному закону (закон Гаусса). Методы проверки на нормальность: методы, основанные на дескриптивной статистике и визуализации и методы, базирующиеся на критериях согласия распределений.

Визуальный метод. Метод оценки показателя асимметрии. Стандартная ошибка асимметрии. Показатель эксцесса. Стандартная ошибка эксцесса.

Методы, основанные на критериях согласия распределений: х2 Пирсона, W- омега – квадрат (тест Смирнова-Крамера-Мизеса), λ -Колмогорова-Смирнова, W-критерий ШапироУилкса.

Методы проверки данных на соответствие закону нормального распределения:

1) методы, основанные на дескриптивной статистике и визуализации

1.1.визуализация – построение гистограммы эмпирического распределения и сопоставление ее с теоретической кривой нормального распределения.

1.2.Асимметрия – мера отклонения распределения от нормального, характеризующая симметричность графика.

Эксцесс – мера «сглаженности» («островершинности» или «плосковершинности») распределения.

2) методы, базирующиеся на критериях согласия распределений.

Тема 2.4. Анализ надежности измерений в психологии

Показатели надежности: коэффициент Кронбаха, коэффициент Спирмена-Брауна (надежность половинного расщепления). Пошаговый алгоритм вычислений.

Тема 2.5. Стандартизация данных эмпирического исследования

Значение стандартизации данных. Перевод данных в Z-шкалу, IQшкалу, Т-шкалу и St –

шкалу стенов.

Z = хi - х

IQ = 100 +15Z Т = 50 + 10Z St = 5,5 + 2Z

Тема 2.6. Непараметрические критерии для несвязанных выборок

Непараметрические критерии: Q-критерий Розенбаума, U-критерии Манна-Уитни, H- критерий Крускала-Уоллиса, S-критерий Джонкира.

Непараметрические критерии – серия критериев, каждый из которых применяется без предварительных допущений относительно нормальности распределения. Непараметрические критерии основаны на ранжировании, парных сравнениях и других средствах, не требующих нормальности распределения переменных.

Тема 2.7. Непараметрические критерии для связанных выборок

Непараметрические критерии: G-критерий знаков, Т-критерий Вилкоксона, хr2 критерий Фридмана, L-критерий Пейджа, М-критерий Макнамары.

Непараметрические критерии – серия критериев, каждый из которых применяется без предварительных допущений относительно нормальности распределения. Непараметрические критерии основаны на ранжировании, парных сравнениях и других средствах, не требующих нормальности распределения переменных.