Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Статистика. 4 лекция.doc
Скачиваний:
54
Добавлен:
15.04.2015
Размер:
732.67 Кб
Скачать

[Править] Многомерный статистический анализ

Перейдем к многомерному статистическому анализу. Его применяют при решении следующих задач:

  • исследование зависимости между признаками;

  • классификация объектов или признаков, заданных векторами;

  • снижение размерности пространства признаков.

При этом результат наблюдений — вектор значений фиксированного числа количественных и иногда качественных признаков, измеренных у объекта. Напомним, что количественный признак — признак наблюдаемой единицы, который можно непосредственно выразить числом и единицей измерения. Количественный признак противопоставляется качественному — признаку наблюдаемой единицы, определяемому отнесением к одной из двух или более условных категорий (если имеется ровно две категории, то признак называется альтернативным). Статистический анализ качественных признаков — часть статистики объектов нечисловой природы. Количественные признаки делятся на признаки, измеренные в шкалах интервалов, отношений, разностей, абсолютной. А качественные — на признаки, измеренные в шкале наименований и порядковой шкале. Методы обработки данных должны быть согласованы со шкалами, в которых измерены рассматриваемые признаки.

[Править] Корреляция и регрессия.

Целями исследования зависимости между признаками являются доказательство наличия связи между признаками и изучение этой связи. Для доказательства наличия связи между двумя случайными величинами XиYприменяют корреляционный анализ. Если совместное распределениеXиYявляется нормальным, то статистические выводы основывают на выборочном коэффициенте линейной корреляции, в остальных случаях используют коэффициенты ранговой корреляции Кендалла и Спирмена, а для качественных признаков — критерий хи-квадрат.

Регрессионный анализ применяют для изучения функциональной зависимости количественного признака Yот количественных признаковx(1),x(2),...,x(k). Эту зависимость называют регрессионной или, кратко, регрессией. Простейшая вероятностная модель регрессионного анализа (в случаеk= 1) использует в качестве исходной информации набор пар результатов наблюдений (xi,yi),i= 1,2,...,n, и имеет вид

,

где εi— ошибки наблюдений. Иногда предполагают, что εi— независимые случайные величины с одним и тем же нормальным распределениемN(0,σ2). Поскольку распределение ошибок наблюдения обычно отлично от нормального, то целесообразно рассматривать регрессионную модель в непараметрической постановке, то есть при произвольном распределении εi.

Основная задача регрессионного анализа состоит в оценке неизвестных параметров aиb, задающих линейную зависимостьyотx. Для решения этой задачи применяют разработанный еще К.Гауссом в 1794 г. метод наименьших квадратов, то есть находят оценки неизвестных параметров моделиaиbиз условия минимизации суммы квадратов

по переменным aиb.

Теория регрессионного анализа описана и расчетные формулы даны в специальной литературе [2],[11],[19]. В этой теории разработаны методы точечного и интервального оценивания параметров, задающих функциональную зависимость, а также непараметрические методы оценивания этой зависимости, методы проверки различных гипотез, связанных с регрессионными зависимостями. Выбор планов эксперимента, то есть точекxi, в которых будут проводиться эксперименты по наблюдениюyi— предмет теории планирования эксперимента[20].