Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Упражнения и задачи.doc
Скачиваний:
0
Добавлен:
01.04.2025
Размер:
2.38 Mб
Скачать

Упражнения и задачи к теме "Некоторые аспекты построения моделей множественной регрессии"

  1. Изучалась зависимость ВВП стран (Y ) от объема добычи полезных ископаемых ( ), среднегодовой численности занятых в промышленности ( ), и годового объема сельскохозяйственного производства ( ). По выборке из 21 наблюдения проведено МНК-оценивание всевозможных многофакторных линейных моделей. Получены коэффициенты детерминации для однофакторных (I), двуфакторных (II) и трехфакторных моделей (III).

=0,33

=0,39

=0,42

(I)

=0,41

=0,51

=0,66

(II)

=0,67

(III)

Провести отбор в модель наиболее информативных факторов.

  1. Получена таблица выборочных парных коэффициентов корреляции, вычисленных по некоторым исходным данным.

1

0,75

0,65

0,33

0,25

0,81

0,35

1

0,91

0,22

-0,14

0,16

0,22

1

0,85

0,74

0,91

0,71

1

0,88

0,84

0,73

1

0,48

0,89

1

0,85

1

На основе анализа матрицы парных коэффициентов корреляции провести отбор наиболее существенных факторов в модель.
  1. Исследуется зависимость суммарного балла , набранного студентом-выпускником, от его суммарного балла , набранного по результатам ЕГЭ, и активности в занятиях спортом. Предполагается, что активность студента в занятиях спортом описывается четырьмя уровнями градации:

  • не занимается никакими видами спорта и не делает зарядки по утрам;

  • не занимается спортом, но делает ежедневную зарядку;

  • не делает зарядку, но занимается в спортивной секции;

  • делает зарядку и занимается в спортивной секции.

Сколько булевых переменных следует выбрать для описания приверженности студента занятиям спортом? Запишите общий вид линейного соотношения между суммарным баллом студента-выпускника и его суммарным баллом, набранным по результатам ЕГЭ, а также его активностью в спортивных занятиях.

  1. Исследуется зависимость заработной платы молодого специалиста от суммарного балла , набранного им за время учебы, и от его активности в занятиях наукой. Предполагается, что активность студента в занятиях наукой описывается тремя уровнями:

  • во время учебы студент никогда не занимался научными исследованиями;

  • во время учебы студент занимался научными исследованиями, но опубликованных результатов не имеет;

  • результаты научных исследований студента были опубликованы.

Сколько булевых переменных следует выбрать для описания степени активности студента в занятиях наукой? Запишите общий вид линейного соотношения между зарплатой молодого специалиста и средним баллом, набранным им за время учебы, а также его активностью в занятиях наукой.

  1. Исследуется зависимость рыночной цены на автомобиль определенной марки от его «возраста» и расположения руля. Предполагается, что качественный фактор D может принимать два значения:

  • «правый» руль (произведен для стран с левосторонним движением) (D=0);

  • «левый» руль (обычный) (D=1).

Результаты регрессии, полученные по данным выборки объемом 33 наблюдений, имеют вид:

Можно ли принять, что цена на машину существенно ниже, если машина снабжена «правым» рулем?

  1. Исследуется зависимость веса человека (Y, см) от его роста (X, кг) и пола. Предполагается, что качественный фактор D: пол человека – описывается двумя уровнями градации:

мужской ;

женский .

Результаты регрессии, полученные по данным выборки объемом 40 наблюдений, имеют вид:

Проверить статистическую значимость эмпирических коэффициентов модели и ее качество при 5%-ом уровне значимости. На сколько в среднем увеличится вес женщины, если ее рост увеличится на 1 см? На сколько в среднем увеличится вес мужчины, если его рост увеличится на 2 см?

  1. Какие из представленных моделей могут быть линеаризованы:

  1. ;

  2. ;

  3. ;

  4. ;

  5. ;

  6. ;

  7. ;

  8. ;

  9. ;

  10. .

Какие из моделей являются нелинейными по включенным переменным, но линейными по параметрам?