Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Statistika_vsya_teoria_glavny_fayl11111111111.docx
Скачиваний:
0
Добавлен:
01.05.2025
Размер:
2.99 Mб
Скачать

19.Виды и способы отбора единиц наблюдения.

Возможны три способа отбора: 

  • индивидуальный

  • групповой

  • комбинированный

Виды:

  • типическая

  • серийная

  • собственно-случайная

  • механическая

  • комбинированная

20.Виды ошибок выборки.

Средняя ошибка

  • собственно-случайной выборки

  • Для механического отбора

  • При использовании типического отбора

  • В случае серийного отбора

  • Комбинированного отбора

  • Многоступенчатого отбора

  • Многофазного отбора

  • Малой выборки

21.Определение предельной ошибки выборки. Определение необходимой численности выборки.

Предельная ошибка выборки равна t-кратному числу средних ошибок выборки (t – коэфф. Доверия) дельта= t * мю

Если ошибку увеличить в 2 раза t=2, то вероятность того, что она не превысит опр. Предела (двойной средней ошибки)- 0,954 если t=3, то доверительная вероятность 0,997- практически достоверность. Уровень предельной ошибки выборки зависит от:

  1. Степени вариации единиц стат совокупности

  2. Объема выборки

  3. Выбранных схем отбора (повторный отбор уменьшает ошибку)

  4. Уровня доверительной вероятности

Необходимая численность выборки зависит от вида предполагаемой выборки, способа отбора (повторный, бесповторный), выбор оцениваемого параметра (ср.значения или доли)

Необходимо определиться со значениями доверительной вероятности и размером допустимой ошибки (т.е. определить для себя значения дельта(предел.ошибка) и t)

Сложность вызывает определение дисперсии (размер вариации признака), т.к. ее тяжело определить ДО того, как проведено исследование.

22.Задачи, решаемые с помощью корреляционно-регрессионного анализа

Требования, предъявляемые к анализируемой информации:

  1. Случайно выбранные из ген.совокупности наблюдения

  2. Требование независимости наблюдений друг от друга

  3. Однородность исходной совокупности данных

  4. Желательно, чтобы исходные данные подчинялись (К+1) мерному нормальному закону распределения

  5. И др.

Исследуется финансовая деятельность

23.Определение параметров уравнения регрессии.

Параметрыуравнениярегрессииможновычислитьчерезопределители:

                                               (8.10)

гдеΔ - определительсистемы;

Δa - частныйопределитель, получаемыйврезультатезаменыкоэффициентовприасвободнымичленамиизправойчастисистемыуравнений;

Δb - частныйопределитель, получаемыйврезультатезаменыкоэффициентовприbсвободнымичленамиизправойчастисистемыуравнений.

Формулы (8.10) соответствуютсамомуобщемуподходукопределениюпараметровуравнениярегрессииимогутприменятьсявслучаекакпарной, такимножественнойрегрессии.

Математическое определение регрессии

Строго регрессионную зависимость можно определить следующим образом. Пусть Y, X1,X2,...,Xp — случайные величины с заданным совместным распределением вероятностей. Если для каждого набора значений X1 = x1,X2 = x2,...,Xp = xp определено условное математическое ожидание

y(x1,x2,...,xp) = E(Y | X1 = x1,X2 = x2,...,Xp = xp) (уравнение линейной регрессии в общем виде),

то функция y(x1,x2,...,xp) называется регрессией величины Y по величинам X1,X2,...,Xp, а её график — линией регрессииY по X1,X2,...,Xp, или уравнением регрессии.

Зависимость Y от X1,X2,...,Xp проявляется в изменении средних значений Y при изменении X1,X2,...,Xp. Хотя при каждом фиксированном наборе значений X1 = x1,X2 = x2,...,Xp = xp величина Y остаётся случайной величиной с определённым рассеянием.

Для выяснения вопроса, насколько точно регрессионный анализ оценивает изменение Y при изменении X1,X2,...,Xp, используется средняя величина дисперсии Y при разных наборах значений X1,X2,...,Xp (фактически речь идет о мере рассеяния зависимой переменной вокруг линии регрессии)

Метод наименьших квадратов (расчёт коэффициентов)

На практике линия регрессии чаще всего ищется в виде линейной функции Y = b0 + b1X1 + b2X2 + ... + bNXN (линейная регрессия), наилучшим образом приближающей искомую кривую. Делается это с помощью метода наименьших квадратов, когда минимизируется сумма квадратов отклонений реально наблюдаемых Y от их оценок (имеются в виду оценки с помощью прямой линии, претендующей на то, чтобы представлять искомую регрессионную зависимость):

(M — объём выборки). Этот подход основан на том известном факте, что фигурирующая в приведённом выражении сумма принимает минимальное значение именно для того случая, когда Y = y(x1,x2,...xN).

Для решения задачи регрессионного анализа методом наименьших квадратов вводится понятие функции невязки:

Условие минимума функции невязки:

Полученная система является системой N + 1 линейных уравнений с N + 1 неизвестными b0...bN

Если представить свободные члены левой части уравнений матрицей

а коэффициенты при неизвестных в правой части матрицей

то получаем матричное уравнение: , которое легко решается методом Гаусса. Полученная матрица будет матрицей, содержащей коэффициенты уравнения линии регрессии:

Для получения наилучших оценок необходимо выполнение предпосылок МНК (условий Гаусса−Маркова). В англоязычной литературе такие оценки называются BLUE (BestLinearUnbiasedEstimators) − наилучшие линейные несмещенные оценки.

Интерпретация параметров регрессии

Параметры bi являются частными коэффициентами корреляции; (bi)2 интерпретируется как доля дисперсии Y, объяснённая Xi, при закреплении влияния остальных предикторов, то есть измеряет индивидуальный вклад Xi в объяснение Y. В случае коррелирующих предикторов возникает проблема неопределённости в оценках, которые становятся зависимыми от порядка включения предикторов в модель. В таких случаях необходимо применение методов анализа корреляционного и пошагового регрессионного анализа.

Говоря о нелинейных моделях регрессионного анализа, важно обращать внимание на то, идет ли речь о нелинейности по независимым переменным (с формальной точки зрения легко сводящейся к линейной регрессии), или о нелинейности по оцениваемым параметрам (вызывающей серьёзные вычислительные трудности). При нелинейности первого вида с содержательной точки зрения важно выделять появление в модели членов вида X1X2, X1X2X3, свидетельствующее о наличии взаимодействий между признаками X1, X2 и т. д.

24.Показатели тесноты связи между количественными признаками (линейный коэффициент корреляции, коэффициент корреляции знаков Фехнера, коэффициент корреляции рангов Спирмена, теоретическое корреляционное отношение).

Линейный коэффициент корреляции

Для устранения недостатка ковариации был введён линейный коэффициент корреляции (или коэффициент корреляции Пирсона), который разработали Карл Пирсон, ФрэнсисЭджуорт и Рафаэль Уэлдон  в 90-х годах XIX века. Коэффициент корреляции рассчитывается по формуле:

Коэффициент корреляции изменяется в пределах отминус единицы до плюс единицы[11].

Линейный коэффициент корреляции связан с коэффициентом регрессии в виде следующей зависимости: где — коэффициент регрессии, — среднеквадратическое отклонение соответствующего факторного признака[12].

Для графического представления подобной связи можно использовать прямоугольную систему координат с осями, которые соответствуют обеим переменным. Каждая пара значений маркируется при помощи определенного символа. Такой график называется «диаграммой рассеяния».

Метод вычисления коэффициента корреляции зависит от вида шкалы, к которой относятся переменные. Так, для измерения переменных с интервальной и количественной шкалами необходимо использовать коэффициент корреляции Пирсона (корреляция моментов произведений). Если по меньшей мере одна из двух переменных имеет порядковую шкалу, либо не является нормально распределённой, необходимо использовать ранговую корреляцию Спирмена или (тау) Кендалла. В случае, когда одна из двух переменных является дихотомической, используется точечная двухрядная корреляция, а если обе переменные являются дихотомическими: четырёхполевая корреляция. Расчёт коэффициента корреляции между двумя недихотомическими переменными не лишён смысла только тогда, когда связь между ними линейна (однонаправлена).

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]