Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Voprosy_EKZ_STAT_12-13 (1).docx
Скачиваний:
2
Добавлен:
01.05.2025
Размер:
31.57 Кб
Скачать

Перечень вопросов к экзамену по дисциплине «статистика» для студентов 2-го курса, 4-ый семестр 2012-2013 учебного года

1. Корреляция и регрессия

  1. Для каждого из приведенных ниже равенств укажите типичный вариант интерпретации. Затем укажите, есть ли какие-то другие варианты.

  1. r = 1.

  2. r = 0,85.

  3. r = 0.

  4. r = -0,15.

  5. r=-1.

  1. Постройте диаграмму рассеяния, которая иллюстрировала бы каждый из перечисленных ниже типов структуры двумерных данных. Для ответа на этот вопрос не обязательно использовать какие-либо данные, можно непосредственно рисовать точки.

  1. Взаимосвязь между X и Y отсутствует.

  2. Линейная взаимосвязь с сильной положительной корреляцией.

  3. Линейная взаимосвязь со слабой отрицательной корреляцией.

  4. Линейная взаимосвязь с корреляцией -1.

  5. Положительная связь с неравной вариацией.

  6. Нелинейная взаимосвязь.

  7. Кластеринг (разделение совокупности данных на относительно однородные группы).

  8. Положительная связь с резко отклоняющимся значением.

  1. Допустим, что стандартные отклонения X и Y остаются неизменными, тогда как корреляция уменьшилась, оставшись при этом положительной. Что в таком случае происходит с коэффициентом наклона b?

  2. В чем разница между стандартной ошибкой оценки и коэффициентом детерминации? Какое значение R2 лучше - более низкое или более высокое? Какое значение Se лучше - более низкое или более высокое?

  3. Статистический вывод в регрессии основывается на линейной модели. Укажите по меньшей мере три проблемы, возникающие в случае несоответствия данных линейной модели.

  4. Что такое экстраполяция? В чем заключается особая потенциальная опасность ее применения?

  5. Что легче интерпретировать, ковариацию или корреляцию? Почему?

  6. Чем именно линия наименьших квадратов так отличается от всех других линий?

  7. Есть все основания считать «наиболее типичным» значением данных такое, у которого значение X равно Xср. а значение Y – Yср.. Покажите, что линия наименьших квадратов проходит через эту «наиболее типичную» точку.

  8. Дайте определение и напишите формулу вычисления для каждой из перечисленных ниже величин, которые используются в статистических выводах.

  1. Стандартная ошибка, используемая для коэффициента регрессии.

  2. Стандартная ошибка сдвига.

  3. Стандартная ошибка нового наблюдения.

  4. Число степеней свободы для каждой из этих стандартных ошибок.

2. Множественная регрессия

  1. Ответьте на следующие вопросы, касающиеся множественной регрессии.

  1. Какие три цели множественной регрессии вы можете указать?

  2. Какого рода данные требуются для множественной регрессии?

  1. Ответьте на следующие вопросы, касающиеся уравнения регрессии.

  1. Для чего используется это уравнение?

  2. Откуда берется уравнение регрессии?

  3. Как интерпретируется постоянный член уравнения регрессии?

  4. Как интерпретируется коэффициент регрессии?

  1. Опишите два критерия, свидетельствующие о качестве анализа множественной регрессии.

  2. О чем свидетельствует результат F-теста? Запишите две гипотезы F-теста. Какое значение R2 (высокое или низкое) требуется, чтобы F-тест оказался значимым?

  3. Если F-тест незначим, можно ли продолжать анализ и тестировать отдельные коэффициенты регрессии?

  4. Что такое мультиколлинеарность? В чем заключается искажающее влияние высокой мультиколлинеарности? Каким образом умеренная мультиколлинеарность может сделать ваш F- тест значимым даже в том случае, когда ни один из ваших t-тестов

  5. Что такое модель линейной множественной регрессии? Перечислите три случая, когда модель линейной множественной регрессии неприменима.

  6. Назовите оси диагностической диаграммы. Чем полезно отсутствие структуры в диагностической диаграмме? Как интерпретировать диагностическую диаграмму?

  7. Опишите, как построены таблицы критических значений для тестирования R2. В каком случае регрессию можно считать значимой на каждом уровне тестирования?

  8. Какие цели преследует использование таблиц R2 при проведении тестирования значимости модели множественной регрессии?

  9. Какой тест – F-тест или t-тест для отдельных коэффициентов регрессии – считается более важным при проведении анализа значимости модели множественной регрессии? Почему?

  10. В чем заключается основной статистический результат мультиколлинеарности? Можно ли в этом случае при высокой значимости регрессии определить важность конкретной переменной?

  11. Каким образом умеренная мультиколлинеарность может сделать ваш F- тест значимым даже в том случае, когда ни один из ваших t-тестов не является значимым?