Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
МатметодыУП для Заочников (1).doc
Скачиваний:
48
Добавлен:
08.05.2019
Размер:
3.78 Mб
Скачать

1.8. Прогнозирование средствами матстатистики

Прогнозирование средствами мат. статистики производится на основе анализа вариационных рядов и их связей.

Варьирование - изменение признака от наблюдения к наблюдению. (Например, варьирование веса или роста в к.-л. группе людей).

Вариационный ряд – количественная характеристика варьирования признака.

Прогнозирование представляет собой суждение на основе знания:

  1. совместного изменения двух (или более) признаков в ряде наблюдений

  2. известного значения одного признака (фактора) (или более) в новом наблюдении о наиболее вероятном значении второго признака.

То есть Фактор[ы] – признак[и] на основе которого производится предсказание значения другого признака - регрессии.

Для выработки такого суждения необходимо:

  1. описать закономерность связи между регрессией и факторами (в виде: математической функции; перечисления или алгоритма)

  2. оценить силу этой закономерности - степень зависимости между признаками (фактором и регрессией). Количественная оценка такой зависимости существенно определяется шкалой измерения признаков.

Зависимость применимости метода моделирования от шкалы

Количество может быть измерено в различных шкалах.

Шкала

Допустимая операция

Пример

Номинальная

=

Имена

Порядковая

= <>

Баллы

Интервальная

= <> + -

Температура, Прибыль

Абсолютная

= <> + - * /

Вес, Выручка

Номинальная шкала

Заключение о связи признаков можно получить графическим (зрительным / визуальным) и расчётным (аналитическим) путём. Взаимосвязь признаков номинальной шкалы отображается Пузырьковой диаграммой. Из двух признаков один рассматривается как независимый (фактор) – ось абсцисс(X), а другой как определяемый им (зависимый) – ось ординат(Y). Деление признаков на «независимый» и «зависимый» зависит от исследователя.

Рисунок 9 Пузырьковые диаграммы признаков «Район» и «Орг.-правовая форма»

Для ответа на вопрос есть ли связь между признаками, нужно сопоставить диаграммы с крайними случаями, когда признаки независимы или зависимы полностью.

Рис. 10 Предельные случаи Пузырьковой диаграммы

Из примера видно, что зависимость одного признака от второго и обратная зависимость второго от первого просматриваются различным образом. Количественная мера близости для номинальной шкалы – условная энтропия: .

Прогнозом является суждение о том, что если у нового объекта известно значение одного признака (фактора), то значение другого признака он принимает с определённой вероятностью. Например, если фирма Приморского района (3), то это скорее всего ООО (1) и вряд ли АООТ(5). Если же фирма – ИЧП, то, почти наверняка из Приморского р-на.

Ранговая шкала

Взаимосвязь ранговых признаков отображается на двухосной (лестничной) диаграмме. Каждому объекту соответствует отрезок (ступенька лестницы), связывающий значения признаков этого объекта.

Рис. 11 Двухосная (лестничная) диаграмма

Нарушение согласованности в порядке варьирования признаков (инверсия порядков – Inv) отображается пересечением ступенек лестницы. Чем меньше инверсий – тем сильней однонаправленная связь признаков, чем больше – тем сильнее разнонаправленная связь. Связь отсутствует, когда инверсий – «в среднем» от максимально возможного числа, равного N*(N-1)/2 , где N-число объектов.

Рис. 12 Предельные случаи двухосной диаграммы

Количественная мера близости для ранговой шкалы – [ненормированный] коэффициент ранговой корреляции , показывающий долю согласованных рангов. Для того, что бы разнонаправленному ранжированию соответствовали отрицательные значения коэффициента, последний преобразуют в [нормированный] коэффициент ранговой корреляции: . Недостатком нормированного коэффициента является отсутствие содержательной интерпретации величины.

Прогнозом являются суждения о том, что если у нового объекта улучшается один признак, то другой:

  1. скорее улучшится (при нормированном коэффициенте [ранговой корреляции] >0) или ухудшится (в противном случае) и

  2. улучшится с вероятностью, равной ненормированному коэффициенту (если вероятность <0,5 – значит ухудшится).

Например, если мы выбираем гостиницу подороже, то уровень комфорта скорее всего возрастёт (r норм. = 0,33 >0) с вероятностью 67% (= r ненорм.).