Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Лек 07 модели и методы.doc
Скачиваний:
0
Добавлен:
01.05.2025
Размер:
450.05 Кб
Скачать

Генеральная совокупность и выборка

Часто требуется определить некоторую количественную характеристику большой группы однородных объектов. Например, доход населения, количество покупателей в магазине в течение дня, процент брака в исследуемой партии и т. д. Такая объемлющая группа называется в статистике генеральной совокупностью. Теоретически считается, что объем генеральной совокупности не ограничен. Практически же объем генеральной совокупности всегда ограничен и может быть различным в зависимости от предмета наблюдения и решаемой задачи.

Выборкой называют часть генеральной совокупности, отобранную для изучения. Изучение всей генеральной совокупности почти всегда либо невозможно, либо нецелесообразно. Например, анализ среднего дохода населения г. Минска формально предполагает наличие достоверной информации о каждом жителе города в конкретный момент времени, что нереально. Но информация о генеральной совокупности, полученная на основании выборочного наблюдения, всегда будет иметь некоторую погрешность. Вряд ли средний доход, полученных по выборке объемом даже 1000 респондентов будет в точности таким же, что и во всем городе. Очевидно, что результат будет сильно зависеть и от метода отбора респондентов.

Поэтому требования, предъявляемые к любой выборке, сводятся к тому, что на ее основе должна быть получена наиболее полная, неискаженная информация об особенностях генеральной совокупности, из которой взята эта выборка. Если выборка представляет собой меньшую по размеру, но точную модель той генеральной совокупности, которую она должна отражать, то ее называют репрезентативной. Есть два метода, обеспечивающие репрезентативность выборки.

Первый метод – формирование простой случайной выборки. Элементы, отбираются из генеральной совокупности так, чтобы каждый элемент этой совокупности имел бы равную вероятность попасть в выборку. Получить простую случайную выборку можно путем обычной жеребьевки (по аналогии с лотереей) или с использованием случайных чисел. Но данная процедура требует учитывать каждого представителя генеральной совокупности, что не всегда возможно.

Второй метод предполагает, что элементы генеральной совокупности разбивают на страты (группы) в соответствии с некоторыми характеристиками. Например, при обследовании спроса на определенный товар генеральную совокупность желательно разбить на группы, различающиеся по величине дохода, социальной принадлежности, месту жительства и т.д. Тогда случайная выборка производится отдельно из каждой группы (страты) с учетом ее относительной численности, а полученная в итоге выборка называется стратифицированной случайной выборкой.

5. Статистическая проверка гипотез

Статистические выводы - это заключения о генеральной совокупности (т. е. о законе распределения исследуемой СВ и его параметрах, либо о наличии и силе связи между исследуемыми переменными) на основе выборки, случайно отобранной из генеральной совокупности. Например, анализ дохода (X) населения некоторого двухмиллионного города реально можно выполнить только на базе выборки ограниченного объема. Но при таком подходе возможно лишь получение оценок этих параметров, которые могут изменяться от выборки к выборке. Процесс нахождения оценок по определенному правилу называют оцениванием. Можно выделить два вида оценивания: оценивание вида распределения и оценивание параметров распределения (описательные статистики). Для оценки вида распределения можно взять выборочное распределение и подсчитать частоты попадания рассматриваемой СВ в заданные подынтервалы. Процедура оценивания всегда однотипна. На основе выборки с помощью соответствующей формулы рассчитывается оценка исследуемой характеристики. В качестве оценок параметров распределения генеральной совокупности берутся их выборочные оценки.

Для судить о надежности оценки, было бы хорошо знать в каком интервале и с какой вероятностью находится истинное значение искомого параметра. Такой интервал называется доверительным интервалом, а вероятность попадания значения в этот интервал – доверительной вероятностью. Часто используется величина, дополняющая доверительную вероятность до единицы, которая называется уровнем значимости. Это вероятность того, что истинное значение параметра окажется вне доверительного интервала.

Большинство эконометрических моделей требуют многократного улучшения и уточнения. Для этого требуется проведение расчетов, связанных с установлением выполнимости или невыполнимости тех или иных предпосылок. Обычно эти расчеты проводятся по схеме статистической проверки гипотез. Статистическая гипотеза - это утверждение относительно неизвестного параметра генеральной совокупности, которое формулируется для проверки надежности связи и которое можно проверить по известным выборочным статистикам — результатам исследования. Обычно выделяют основную (нулевую) и альтернативную статистические гипотезы. Основная (нулевая) гипотеза (Н0) — содержит утверждение об отсутствии связи в генеральной совокупности и доступна проверке методами статистического вывода. Альтернативная гипотеза (Н1) — принимается при отклонении Н0 и содержит утверждение о наличии связи. При этом нулевая и альтернативная гипотезы представляют собой, в терминах теории вероятности, «полную группу несовместных событий»: если верна одна из них, то другая является ложной, и наоборот.

Очевидный способ проверки надежности обнаруженной в исследовании связи — это многократное проведение аналогичного исследования на разных выборках. Однако это и трудоемко и не всегда возможно. Но можно сформулировать вопрос по-другому. Какова вероятность, что полученный результат является случайным, а на самом деле связи в генеральной совокупности нет? На такой вопрос, с использованием методов статистики можно получить ответ.

Статистический критерий - это инструмент определения уровня статистической значимости. В качестве основы для применения статистических критериев используют теоретические распределения, для условия, когда верна нулевая гипотеза. Критерий также подразумевает формулу, позволяющую соотнести эмпирическое значение выборочной статистики с этим теоретическим распределением. Применяя эту формулу, вычисляем эмпирическое значение критерия. Полученное эмпирическое значение позволяет определить р-уровень – вероятность того, что нулевая статистическая гипотеза верна.

Помимо формулы эмпирического значения, критерий задает формулу для определения числа степеней свободы. Число степеней свободы (degrees of freedom — обозначается как df) — это количество возможных направлений изменчивости признака. Как правило, число степеней свободы линейно растет вместе с объемом выборки.

Каждая формула для расчета эмпирического значения критерия обязательно сопровождается правилом (формулой) для определения числа степеней свободы.

Для проверки статистических гипотез применяются различные критерии. Но принцип проверки является общим: вычисленное по формуле эмпирическое значение критерия сопоставляется с теоретическим распределением для заданного числа степеней свободы, что позволяет определить вероятность того, что Н0 (нулевая гипотеза) верна.

Проверка гипотез

При обработке данных на компьютере при помощи статистической программы достаточно указать, какой критерий необходимо применить к заданной выборке исходных данных. Далее программа сама вычисляет эмпирическое значение критерия и сопоставляет его с теоретическим распределением. В качестве результата получаем значение р-уровня значимости, наряду с эмпирическим значением критерия и числом степеней свободы.

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]