Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

М1ДВ1.2 Мат_обработка_данных

.pdf
Скачиваний:
27
Добавлен:
23.02.2015
Размер:
1.19 Mб
Скачать

Раздел III. Многомерные статистические методы

Тема 3.1. Факторный анализ

Латентные факторы. Общая модель факторного анализа. Выбор и вращение факторов: варимакс, биквартимакс, квартимакс, эквимакс. Интерпретация факторов.

Факторный анализ – метод, позволяющий свести большое количество исходных переменных к значительно меньшему числу факторов, каждый из которых объединяет исходные переменные, имеющие сходный смысл.

Факторный анализ нельзя применять для обработки первичных («сырых») данных. Основой факторного анализа является подсчет корреляционных связей между переменными.

Фактор – в факторном анализе объединение нескольких переменных, чья взаимная корреляция исчерпывает определенную долю общей дисперсии. Процедура извлечения факторов из матрицы интеркорреляций называется факторизацией матрицы. В результате факторизации из корреляционной матрицы может быть извлечено разное количество факторов вплоть до числа, равного количеству исходных признаков. Определение количества факторов, на которые следует делить данные осуществляется при помощи графика собственных значений («каменистая осыпь) – диаграммы, позволяющей выбирать число факторов в факторном анализе. Если между факторами корреляция равна нулю, то в этом случае факторы являются независимыми (ортогональными). Если корреляция между факторами отличается от нуля, то факторы считаются зависимыми (облическими). Ортогональные факторы дают более простые варианты взаимодействий внутри факторной матрицы.

Простой факторной структурой называют структуру факторной матрицы, в которой каждая переменная имеет значимые нагрузки только по одному из факторов и сами факторы ортогональны. Факторная матрица с простой структурой может быть проинтерпретирована с точки зрения содержания каждого фактора.

Условия применения факторного анализа:

1.нельзя факторизовать качественные данные, полученные в шкале наименований;

2.все переменные должны быть независимыми, а их распределение должно приближаться к нормальному;

3.связи между переменными должны быть приблизительно линейны;

4.в исходной корреляционной матрице должно быть несколько корреляций по модулю выше 0,3.

5.выборка испытуемых должна быть больше 100 человек.

Тема 3.2. Кластерный анализ

Общая схема применения кластерного анализа в психологических исследованиях. Классификация методов кластерного анализа по измерительным шкалам, направлению кластеризации и используемой метрике. Классификация методов кластерного анализа по стратегиям кластеризации. Классификация иерархических агломеративных методов кластерного анализа по способам определения межкластерных расстояний. Пошаговый алгоритм вычислений.

Кластерный анализ – процедура, направленная на объединение объектов или явлений в группы (кластеры) на основе заданного правила. Соответственно эмпирические данные делятся на несколько классов. Однако кластерный анализ не дает общего правила для отнесения новых объектов (новых данных) к одному из построенных ранее классов, ни

четких критериев оценки качества классификации.

Кластер – это гроздь, пучок, группа объектов. Элементы, включенные в один кластер

являются более похожими друг на друга, более близкими по каким-то характеристикам по сравнению с остальными.

После построения классификации ее результаты считаются окончательными и не пересматриваются. При дополнении новыми сведениями эмпирических данных или выборе иного метода кластеризации может быть создана иная классификация эмпирических

показателей, отличная от ранее созданной.

Дендрограмма – диаграмма древовидной структуры, иллюстрирующая процесс кластеризации в кластерном анализе.

Тема 3.3. Дискриминантный анализ

Теоретические основы дискриминантного анализа. Основные направления дискриминантного анализа: линейный дискриминантный анализ Фишера, канонический дискриминантный анализ, пошаговый дискриминантный анализ.

Дискриминантный анализ математический метод классификации объектов, целью которого является отнесение некоторого объекта к одному из уже построенных классов с

последующей проверкой непротиворечивости (качества) построенной классификации. Дискриминация – это разделение объектов на классы и построение правил этого

разделения.

Применение дискриминантного анализа позволяет сохранять структуру ранее построенной классификации и качественный состав каждого класса (кластера).

Тема 3.4. Регрессионный анализ

Теоретические основы регрессионного анализа. Линейная и нелинейная регрессия. Простая и множественная регрессия. Методы регрессионного анализа. Пошаговые

алгоритмы вычислений.

Регрессионный анализ – статистический метод позволяющий установить влияние ряда независимых переменных на зависимую переменную.

Регрессия – статистика, отражающая влияние независимых переменных (предикторов) на зависимую переменную.

Условия применения регрессионного анализа:

1.Все переменные должны быть измерены в шкале интервалов или отношений;

2.Все переменные должны соответствовать закону нормального распределения;

3.Число варьирующихся признаков в сравниваемых переменных должно быть одинаковым.

Простая регрессия – зависимость откликов от одного предиктора. Множественная регрессия- зависимость откликов от нескольких предикторов.

18. Словарь терминов

Асимметрия – мера отклонения распределения от нормального, характеризующая симметричность графика.

Варианта – эмпирическое значение, полученное на выборке.

Вероятность – ожидаемая относительная частота некоторого события.

Вилкоксона критерий – непараметрический критерий, определяющий различие двух измерений полученных на одной выборке на основе знаков разности ранговых пар значений.

Внутригрупповая сумма квадратов – сумма квадратов отклонений наблюдаемых значений от среднего для каждой группы.

Вращение – процедура, применяемая в факторном анализе для того, чтобы получить более простую структуру факторов.

Выборка – ограниченная по численности группа лиц, выделенная из генеральной совокупности, полностью отражающая все специфические особенности данной генеральной совокупности.

Гистограмма – столбиковая диаграмма, использующаяся для отображения частот по категориям (диапазонам значений) переменной. Горизонтальная ось графика соответствует значениям переменной, а вертикальная – частотам.

Генеральная совокупность – 1) группа лиц, обладающая определенным признаком; 2) не бесконечное по численности, но не доступное для сплошного исследования множество потенциальных испытуемых.

Гетерогенность – свойство статистической выборки, данные которой в значительной степени отличаются друг от друга.

Гипотеза статистическая – формальное предположение о тм, что сходство или различие некоторых особенностей, изученных в исследовании случайно или неслучайно. Это научная гипотеза, которая может быть проверена математически.

График собственных значений («каменистая осыпь) – диаграмма, позволяющая выбрать число факторов в факторном анализе.

Дендрограмма – диаграмма древовидной структуры, иллюстрирующая процесс кластеризации в кластерном анализе.

Децель – девять точек измеренного признака, делящие упорядоченное множество на десять равных частей.

Дискриминантный анализ – статистический метод, позволяющий включать свободные объекты в уже созданную посредством кластерного анализа классификацию, не нарушая ее структуру.

Дисперсия – показатель разброса данных, соответствующий среднему квадрату отклонений этих данных от среднего арифметического; средняя арифметическая квадратов отклонений каждого значения признака от общей средней.

Дисперсия общая – вариация, измеряющая вариацию признака по всей совокупности под влиянием всех факторов, обусловивших данную вариацию.

Дисперсия межгрупповая – вариация, характеризующая вариацию результативного признака, обусловленную влиянием фактора, положенного в основание группировки.

Дисперсия внутригрупповая – отражает случайную вариацию, обусловленную влиянием неучтенных факторов.

Дисперсионный анализ – статистический метод, позволяющий анализировать влияние различных факторов (признаков) на исследуемую (зависимую) переменную.

Знаков критерий – непараметрический критерий, определяющий различие двух измерений полученных на одной выборке на основе знаков разности пар значений.

Измерение – выявление количественных характеристик изучаемого психологического явления.

Интервал – упорядоченный набор величин, находящихся в заданных числовых границах и характеризуемых их средней величиной.

Квантиль – точка на числовой оси измеренного признака, которая делит всю совокупность упорядоченных данных на две группы с известным соотношением их численности.

Квинтель – четыре значения измеренного признака, делящие упорядоченное множество на пять равных частей.

Квартель – три значения измеренного признака, делящие упорядоченное множество на

четыре равные части.

Кластерный анализ – процедура, направленная на объединение объектов или явлений в группы (кластеры) на основе заданного правила.

Колмогорова-Смирнова критерий для одной выборки– непараметрический критерий,

определяющий отличие эмпирического распределения от теоретического.

Колмогорова-Смирнова критерий для двух выборок - непараметрический критерий,

определяющий отличие одного эмпирического распределения от другого.

Корреляционный анализ – метод статистической оценки тесноты и знака связи исследуемых признаков.

Коэффициент вариации – показатель степени однородности значений, полученных в исследовании, показатель однородности выборки.

Кумулята – накопленная частота.

Манна-Уитни и Вилкоксона критерий ранговых сумм – непараметрический аналог t-

критерия Стьюдента, определяющий различие между двумя выборками на основе рангов.

Медиана – значение переменной, делящее множество упорядоченных значений выборки пополам.

Мода – переменная, которая наиболее часто встречается на выборке.

Непараметрические критерии – серия критериев, каждый из которых применяется без предварительных допущений относительно нормальности распределения. Непараметрические критерии основаны на ранжировании, парных сравнениях и других средствах, не требующих нормальности распределения переменных.

Номинативная переменная – переменная, каждое значение которой указывает на принадлежность объекта к определенной группе (категории), данная переменная не является количественной, она делит все объекты на непересекающиеся множества по определенному признаку (класс, пол, хобби и пр.), но не позволяет сравнивать объекты по уровню выраженности этого признака.

Нормальное распределение – распределение частот (вероятностей), графически представляемое в виде симметричной кривой, имеющей пик в центре и приближающееся к горизонтальной оси по краям. Идеальное нормальное распределение характеризуется

нулевыми значениями асимметрии и эксцесса.

Ошибка второго рода – Н0 отклоняется как неверная гипотеза, но она верна.

Ошибка первого рода – Н0 принимается как правильная гипотеза, но она неверна.

Параметрические критерии – критерии, применяемые в предположении о нормальном распределении переменных в генеральной совокупности.

Полигон частот– ломаная линия, отрезки которой соединяют точки с координатами (хi; fi).

Полигон частностей - ломаная линия, отрезки которой соединяют точки с координатами (хi; wi).

Процентиль – девяносто девять точек, делящие упорядоченное множество на сто равных частей.

Размах – характеристика распределения, равная разности между максимальным и минимальным значениями, полученными на выборке.

Ранговая (порядковая) переменная – количественная переменная, отражающая измеренное качество на уровне порядка.

Рандомизация – прием при помощи которого создается репрезентативная выборка, состоящая в простом случайном подборе испытуемых в выборку для исследования особенностей генеральной совокупности.

Регрессионный анализ – статистический метод позволяющий установить влияние ряда независимых переменных на зависимую переменную.

Репрезентативная выборка – меньшая по объему, но точная модель генеральной совокупности, в которой все основные признаки генеральной совокупности представлены примерно в той же пропорции и с той же частотой.

Ряд вариационный – набор эмпирических данных, записанных в убывающем (возрастающем) порядке.

Ряд распределения – набор неупорядоченных данных, полученных в эмпирическом исследовании.

Ряд статистический – набор упорядоченных эмпирических данных с указанием частоты встречаемости каждого признака.

Случайная величина – переменная величина, принимающая свои значения на некотором

множестве.

Случайное событие – событие, проявляющееся в исследовании.

Среднеквадратическое отклонение – обобщенная характеристика абсолютных размеров вариации признака в совокупности. Является критерием надежности среднего арифметического.

Стьюдента критерий для зависимых выборок – критерий, сравнивающий средние значения двух распределений, полученных на одной выборке.

Стьюдента критерий для независимых выборок - критерий, сравнивающий средние значения двух разных распределений.

Стьюдента критерий для одной выборки – критерий, предназначенный для сравнения среднего значения распределения переменной с некоторой эталонной величиной.

Сумма квадратов – стандартная мера разброса, представляющая собой сумму квадратов отклонений всех значений величины от среднего значения.

Табулирование выборки – деление выборки на интервалы с подсчетом частоты встречаемости признака в каждом из них.

Уровень значимости – мера случайности полученного результата, равная вероятности того, что в генеральной совокупности этот результат отсутствует. Чем меньше эта вероятность, тем выше статистическая значимость результата.

Фактор – в факторном анализе объединение нескольких переменных, чья взаимная корреляция исчерпывает определенную долю общей дисперсии.

Факторный анализ – метод, позволяющий свести большое количество исходных переменных к значительно меньшему числу факторов, каждый из которых объединяет исходные переменные, имеющие сходный смысл.

Фишера критерий – математико-статистический критерий, применяя который можно сделать вывод о сходстве или различии в дисперсиях случайных величин.

Хи-квадрат для одной выборки – непараметрический критерий, определяющий отличие наблюдаемого распределения от ожидаемого (теоретического) распределения.

Хи-квадрат критерий – непараметрический критерий для сравнения ожидаемых и наблюдаемых частот.

Частота – количество значений в выборке, имеющих данное значение признака.

Число степеней свободы – количество возможных направлений изменчивости

статистического показателя, служит для определения уровня значимости.

Эксцесс – мера «сглаженности» («островершинности» или «плосковершинности») распределения.

19. Балльно-рейтинговая система, используемая преподавателем для оценивания знаний студентов по дисциплине.

ОСНОВНАЯ ОБРАЗОВАТЕЛЬНАЯ ПРОГРАММА по направлению подготовки магистра 050400.68 Психолого-педагогическое образование,

магистерская программа «Психология организационно-управленческой деятельности»

 

 

(код, направление, профиль)

 

 

ТЕХНОЛОГИЧЕСКАЯ КАРТА

Шифр дисциплины по РУП

М1.ДВ.1

 

Дисциплина

Математическая обработка данных психолого-педагогических исследований

Курс 6

семестр В

 

 

Кафедра

психологии

 

 

 

 

 

Двоеглазова Маргарита Юрьевна, кандидат

Ф.И.О. преподавателя, звание, должность

психологических наук, доцент кафедры

 

 

 

психологии

Общ. трудоемкостьчас/ЗЕТ

72/2 Кол-во семестров

1

Интерактивные формыобщ./тек. сем.

8

ЛКобщ./тек. сем.

4

ПР/СМобщ./тек. сем.

20 ЛБобщ./тек. сем.

0

Форма контроля

зачет

Содержание задания

 

Количество

Максимальное

Срок

 

п/п

 

мероприятий

количество баллов

предоставления

 

 

 

 

 

 

 

 

 

 

 

Вводный блок

 

 

 

 

1.

Эссе (домашняя работа)

 

1

 

2

 

Сентябрь

 

 

 

 

 

 

Основной блок

 

 

 

 

2.

Посещение занятий

 

 

22

 

10

 

По расписанию

3.

АСТ-тест

 

 

 

 

4

 

20

 

По графику

4.

Решение задач

 

 

 

1

 

3

 

На практическом

 

 

 

 

 

 

 

 

 

 

занятии

5.

Презентация-реклама

 

 

1

 

5

 

На практическом

 

прочитанной книги

 

 

 

 

 

 

занятии

6.

Выступление с докладами

 

5

 

5

 

На практических

 

 

 

 

 

 

 

 

 

 

занятиях

7.

Защита опорных схем

 

 

1

 

5

 

Октябрь-ноябрь

8.

Подготовка конспектов

 

10

 

10

 

По расписанию

 

практических занятий

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Всего:

 

60

 

 

 

9.

Зачет

 

 

 

 

1

1 вопрос -10

 

 

 

 

 

 

 

 

 

 

2 вопрос -10

 

По расписанию

 

 

 

 

 

 

 

3 вопрос - 20

 

 

 

 

 

 

 

 

 

Всего

 

40

 

 

 

 

 

 

 

 

 

Итого:

 

100

 

 

 

 

 

 

 

 

 

Дополнительный блок

 

 

 

10.

Внеучебная деятельность

 

 

10

 

 

 

 

 

 

 

 

 

 

 

11.

Подготовка презентации

 

 

5

 

 

 

 

 

 

 

 

 

 

 

 

12.

Подготовка реферата

 

 

 

 

5

 

По согласованию с

 

 

 

 

 

 

 

 

 

 

преподавателем

13.

Составление тестовых заданий

 

 

10

 

 

 

 

 

 

 

 

 

 

 

 

 

14.

Аннотирование учебной литературы

 

10

 

 

 

 

 

 

 

 

 

 

 

15.

Работа с Интернет-источниками

 

 

10

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Всего:

 

50

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

20. Изменения в рабочей программе, которые произошли после ее утверждения:

 

Номер и дата

Подпись заведующего

Подпись декана факультета

Характер

протокола заседания

кафедрой,

(проректора по учебной

изменений в

кафедры, на котором

утверждающего

работе), утверждающего

программе

было принято данное

внесенное изменение

данное изменение

 

решение

 

 

 

 

 

 

 

 

 

 

 

21. Учебные занятия по дисциплине ведут:

Ф.И.О., ученое звание и степень

Учебный год

Факультет

Специальность

преподавателя

 

 

 

 

 

 

 

Двоеглазова М.Ю., к.пс.н

2013-2014

ППИ

050400.68 Психолого-

 

 

 

педагогическое

 

 

 

образование,

 

 

 

магистерская программа

 

 

 

«Психология

 

 

 

организационно-

 

 

 

управленческой

 

 

 

деятельности»