Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
4-6_mi.docx
Скачиваний:
0
Добавлен:
01.05.2025
Размер:
115.29 Кб
Скачать

49. Стат проверка первичн информ

Стат методы – 1) описательный анализ (частотное табулирование) 2) дисперсионный и ковариаиционный анализ (стат методы, кот примен для изучения различий средн значений зависим переменных, вызванных влиянием контролир независ перем) 3) коррел и регресс анализ (измерение силы связи при совместном изменении завис и независ перем) 3) дискриминантный анализ (анализ различий заранее заданных групп объектов) 4) факторный анализ (позволяет выявить обобщающие хар-ки) 5) кластерный анализ (позвол классифиц многомер наблюдения) 6) многомерное шкалирование (представл данных с помощью наглядного изображ)

50. Методы анализа марк. Инф

Делятся на одномерные и многомерные. Одном: в зависимости от хар-ки данных – метрические: одна выборка, 2 и более выборки (методы: z-критерий, однофакторный анализ, дисперсионный анализ, парный критерий) и неметрические: одна выборка, 2 и более выборки (методы: хи-квадрат, построение медианы, ANOVA-анализ).

Многомерн: зависимые переменные – 1 выборка (методы: корреляц., дисперс анализ, множ регрессия), 2 и более выборки (методы: многомерн дисперс анализ, множестве дисп анализ), взаимозависимые перем – поиск взаимозависимости (методы: факторный анализ), поиск межобъектн сходства (методы: кластерный анализ, многомерн шкалирование)

51. Одномерн.Анализ

Одн анализ примен для изучения данных если сущ ед.измерения для оценки кажд элемента выборки либо если измер несколько, но каждая перем измен отдельно от всех остальных

Вариац ряд – мат распредел, цель которого подсчитать связь с разл значениями первой перем. Характеристики вар.ряда: варианта (х), частоты (f), шаг интервала i= (Xmax-Xmin)/n

Показатели центра распределения: средняя, мода, медиана. Показатели вариации: размах, межквартильн размах, станд отклонение). Форма распредел (ассиметрия и эксцесс)

Определяется степень тесноты связи (коэфф корреляции r – стат показ, характер степень тесноты связи между двумя метрич переменными

52. Двухмерный анализ (перекрестная табуляция, корреляция, регрессия)

! (не весь). Корреляция – измерение силы связи между двумя и более переменными, при этом совместное измерение переменных.

Регрессия – выведение уравнения, связывающего зависимую переменную с одной или несколькими независимыми.

Табуляция – подсчёт количественных событий, которые попадают в каждую категорию, в том случае, когда категории базируются на одной переменной.

53. Дисперсионный анализ – стат метод анализа, который используют для изучения различий средних значений зависимых, вызванных влиянием контролируемых независимых переменных. Зависимая – интервальная или относительная шкала, а независимая – номинальная.

Статистики:

  • Эта-квадрат – корреляционное отношение, выражают степень влияния (от 0 до 1).

  • F-статистика – отношение межгрупповой дисперсии к дисперсии ошибки.

  • MS – сумма квадратов отклонений наблюдений.

  • SSx – вариация переменной у, различия средних между группами.

  • SSошибки - вариация переменной у, внутри каждой группы

  • SSy – полная дисперсия У.

Процесс:

  1. определение зависимой и независимой переменных

  2. выбор метода разложения дисперсии

  3. разложение полной дисперсии

  4. измерение эффектов

  5. проверка значимости

  6. интерпретация полученных результатов

54. Дискриминантный анализ – анализ различий заранее заданных групп объектов исследования. Зависимая – метрическая, а независимая – номинальная. Результат – дискриминантная модель (функция).

D = b0 + b1x1 + … + bkxk, где D –зависимая; b0 – свободный член; х – независимая; к – коэффициент.

Статистики:

  • Каноническая корреляция – степень связи между показателями и группами.

  • Средняя точка – средние значения для показателей конкретной группы.

  • Классификационная матрица – содержит ряд правильно и ошибочно классифицированных случаев

  • F-статистика

  • Коэффициент Уилкса – отношение внутри групповой суммы квадратов к общей сумме квадратов (от 0 до 1) и другие.

Процесс:

  1. определение зависимой и независимой переменных

  2. выбор метода дискриминантного анализа

  3. определение коэффициентов дискриминантной функции

  4. определение значимости функции

  5. интерпретация полученных результатов

  6. оценка достоверности

55. Факторный анализ. Методы факторного анализа. Факторный анализ(ФА) – совокупность методов, которые на основе объективно существующих корреляционных взаимосвязей признаков позволяют выявлять скрытые обобщающие хар-ки структуры изучаемых объектов и их св-в. Цели ФА: сокращение числа переменных, опр-е структуры связей между переменными. Основное предположение ФА в том, что каждый признак можно выразить в виде суммы некоторых других факторов, умноженный каждый на свой коэффициент (факторную нагрузку). Факторы можно разделить на общие и характерные. Каждый характерный фактор имеет ненулевое значение только для одного наблюдаемого признака. Количество общих факторов намного меньше. Статистики и понятия в ФА: критерий сферичности Бартлетта – проверяет гипотезу о том, что переменные в генеральной сов-ти не коррелируют между собойю Корреляционная матрица – матрица попарных корреляций r между всеми возможными парами переменных. Общность – доля дисперсии, объясняемая общими факторами. Собственное значение – полная дисп-я, объясняемая каждым фактором. Факторные нагрузки – линейные корреляции между переменными и факторами. Матрица факторных нагрузок – содержит факторные нагрузки по всем факторам. Значение фактора- суммарные значения, определённые для каждого респондента по производным факторам. Критерий адекватности выбора Кайзера-Мейера-Олкина – коэфф. для проверки целесообразности выполнения ФА. Процент дисперсии – процент от полной дисперсии, приписываемый каждому фактору. Остатки – разница между наблюдаемыми корреляциями в исходной корр. матрице и вычисленными по матрице факторных нагрузок. Этапы ФА: формулировка проблемы(опр-ть цели, задать переменные в интерв или относ шкале). Построение корреляционной матрицы(её анализ определяет целесообразность ФА: если корреляции между переменными небольшие, то бесполезно). Опр-е метода ФА(Анализ главных компонент(учитывают всю дисперсию) и анализ общих факторов(учитывают общую дисперсию). Опр-е числа фак-ов (основывается на предварительносй информации или на собственных значениях факторов или на критерии «каменистой осыпи», на проценте объяснённой дисперсии, на оценке надёжности, на критериях занчимости). Вращение фак-ов(ортогональное – когда сохраняется прямоугольная сис-ма координат, неортогональное – когда не сохран-ся прям. с-ма координат и метод варимакс – минимизирует число переменных с болшим значением нагрузок, усиливая интерпр-ть фак-ов). Интерпретация фак-ов.Определение степени соответствия модели (Изучив разности между наблюдаемыми корреляциями и вычисленными, можно определить соответствие модели исходным данным).

56. Кластерный анализ – сов-ть методов, позволяющих класс-ть многомерные наблюдения, каждое описывается набором исходных переменных Х12…Хm. Цель – образование схожих групп объектов (кластеров), используется при сегментации рынка, понимании поведения покупателей и др. Этапы: формулировка проблемы(выбор переменных для кластеризации) опр-е метода кластеризации (иерархическая кластеризация – когда объекты разделяются из всей совокупности на кластеры или наоборот – из кластеров в большую сов-ть, неиерархическая – позволяет объектам покидать свой кластер и примыкать к другому) выбор меры расстояния(вычисление расстояния между объектами. Евклидово расстояние – наименьшее между х и у: Квадрат Евклидова расстояния – лучше учитываются большие разности. Корреляция пирсона – для большого количества переменных. Мера Чебышева – абсол. Зн-е разности 2-х наблюдений. Блок .Мера Минковского Мера «хи квадрат» - сравнивают частоты выпадения переменных). Опр-е числа кластеров (на предварительной информации, уровне кластеризации, модели кластеров, которую генерирует программа, графике зависимости отношения лисперсий от числа кластеров, размерах). Интерпретация и профилирование кластеров(для описания результатов исп-ся центроид – среднее знач-е объектов кластера по каждой из переменных, формирующих профиль объекта).

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]