Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
ответы_статистика.doc
Скачиваний:
3
Добавлен:
22.04.2019
Размер:
1.37 Mб
Скачать

9.1. Цели, виды.

При использовании методов корреляционно-регрессионного анализа можно выделить три группы решаемых практических задач.

  1. Задачи, связанные с установлением наличия или отсутствия корреляционной зависимости. Решение этих задач предполагает расчет показателей корреляции.

  2. Группа задач диктуется желанием управлять тем или иным объектом, или признаком через воздействие на факторы его определяющие. При этом строиться уравнение связи, называемое регрессионным, и производится ранжирование факторов по степени их влияния на результат.

  3. Прогнозирование изменения того или иного явления или признака в условиях изменения соответствующих признаков-факторов. В основе решения данных задач лежат уравнения регрессии, которые в данном случае не являются самоцелью. Основное – это расчет прогнозируемых значений результативного признака с расчетом доверительных интервалов и указанием уровня доверительной вероятности.

Для решения всех задач используют методы корреляции и регрессии, но так как у них много общих вычислительных процедур, то принято говорить о корреляционно-регрессионном анализе.

Условия применения методов корреляционно-регрессионного анализа

  1. Наличие статистической совокупности достаточно большого объема. Объем совокупности должен превышать в 5-6 раз (идеально в10 раз) число факторов, включенных в анализ.

  2. Изучаемая совокупность должна быть однородна.

  3. Независимость наблюдений и отсутствие мультиколлинеальности факторов.

  4. Признаки, участвующие в анализе должны иметь количественное выражение.

  5. Распределение единиц совокупности должно соответствовать нормальному закону распределения.

9.2. Ошибка выбранной модели.

10. Кластерный анализ.

  1. Кластерный анализ: цели, Евклидово расстояние.

- это разделение выборки объектов на непересекающиеся подмножества (кластеры) так, чтобы каждый кластер состоял из схожих объектов, а объекты разных кластеров существенно отличались.

Кластерный анализ: методы объединения объектов.

1)«Ближнего соседа» (Расстояние между двумя кластерами определяется расстоянием между двумя наиболее близкими объектами (ближайшими соседями) в различных кластерах. Позволяет выделять кластеры сложной формы при условии, что части таких кластеров соединены цепочками близких друг к другу элементов.). 2)«Дальнего соседа» (Расстояние между двумя кластерами определяется расстоянием между двумя наиболее далекими объектами в различных кластерах. Хорошо использовать, когда объекты действительно происходят из различных "рощ") 3)Центроидный 4)Варда (В качестве расстояния между кластерами берется прирост суммы квадратов расстояний объектов до центров кластеров, получаемый в результате их объединения. Применим для малых выборок. Объединение близко расположенных кластеров и "стремление" создавать кластеры малого размера). 5)Невзвешенного попарного среднего 6)Взвешенного попарного среднего.

10.1. Цели. Евклидово расстояние. Стандартизация.

Цели: 1)Понимание данных (Каждому кластеру – свой метод анализа); 2)Сжатие данных (Один типичный представитель от каждого кластера); 3)Novelty Detection (Выделение нетипичных объектов).

Евклидово расстояние – мера расстояния между кластерами.

Р асст-е между точками в трёхмерном пр-ве

Кластерный анализ: стандартизация.

- выбор масштаба.

Из значений переменных вычитается их среднее, и эти значения делятся на стандартное отклонение.

Z-шкалы