- •Государственное образовательное учреждение высшего профессионального образования новоуральский государственный технологический институт
- •Новоуральск 2004
- •Содержание
- •Предисловие
- •Глава 1 Выборочный метод
- •1.1 Выборка
- •1.2 Основные задачи статистики
- •1.3 Основные способы отбора
- •1.4 Первичный анализ выборки
- •Глава 2 Виды представления выборочных
- •2.3 Эмпирическая плотность распределения
- •3.6 Другие способы представления данных
- •Объём реализации
- •3.6.2 Ленточные диаграммы
- •3.6.3 Столбиковые диаграммы
- •Глава 3 Числовые характеристики выборки
- •3.1 Выборочное среднее, выборочная дисперсия
- •3.1.1 Несгруппированные данные
- •3.1.4Введение «ложного нуля»
- •3.2 Коэффициенты асимметрии, эксцесса и вариации
- •3.2.1 Начальные моменты p-го порядка
- •3.2.3 Связь центральных и начальных моментов
- •3.2.4 Коэффициент асимметрии
- •Мода и медиана
- •4.2 Виды статистических оценок. Исправление дисперсии
- •5 Теоретические распределения
- •5.1 Дискретные случайные величины
- •5.1.1 Биномиальное распределение
- •5.1.2 Альтернативный признак
- •5.1.4 Геометрическое распределение
- •5.1.5 Гипергеометрическое распределение
- •5.2 Непрерывные случайные величины
- •5.2.4 Распределение Хи-квадрат
- •5.2.5 Распределение Стьюдента
- •5.3 Использование MathCad
- •6 Проверка гипотезы о виде распределения
- •6.1 Общие определения
- •6.2 Критерий согласия Пирсона
- •6.3 Критерий согласия Романовского
- •6.4 Критерий согласия Колмогорова
- •6.5 Сравнение наблюдаемой относительной частоты альтернативного признака с его гипотетической вероятностью
- •7 Доверительные интервалы
- •7.1 Понятие доверительного интервала
- •7.2 Наименьший объём выборки
- •7.3 Доверительный интервал для м(х)
- •7.4 Доверительный интервал для (х)
- •7.5 Оценка вероятности по относительной частоте
- •8 Общий план обработки статистических данных
- •8.1 Получение выборочных данных
- •Первичная обработка выборочных данных
- •Теоретическое распределение
- •9 Пример обработки статистических данных
- •10 Контрольное задание
- •Критические точки распределения
- •Критические точки распределения Стьюдента
- •12 Рекомендуемая литература
- •Подписано в печать _______________ Формат а5 Гарнитура
- •624130, Г.Новоуральск, ул. Ленина 85, нгти
1.2 Основные задачи статистики
1) Определить
наименьший
объём выборки
,
обеспечивающий достаточный уровень
достоверности
и уровень погрешности
при оценке характеристик генеральной
совокупности по выборочным данным.При
этом
задаёт наибольшую вероятность отклонения
выборочных показателей от показателей
генеральной совокупности. При обычном
анализе выбирается уровень погрешности
0,1 (вероятность ошибки не более 10%) или
0,05 (вероятность ошибки не более 5%). При
более важных результатах уровень
погрешности берётся меньший, например
0,01 , 0,005 и т.д.;
2) Указать способ отбора элементов выборки из генеральной совокупности, удобный для исследователя и дающий такую выборку, чтобы она сохраняла все закономерности, присущие генеральной совокупности, т.е. обеспечить репрезентативность выборки;
3) Указать способы необходимой обработки выборочных данных, получения её числовых или качественных характеристик;
4) Указать способы анализа выборочных данных, чтобы на их основании оценить характеристики генеральной совокупности с соответствующим уровнем достоверности;
5) Указать способы прогноза ожидаемых значений с целью принятия соответствующих действий по полученным данным.
Дальнейшие главы данного пособия покажут, как решаются перечисленные задачи в общем случае. Применение рассмотренных методов на реальном объекте исследования и, особенно, анализ получаемых результатов, рекомендуем посмотреть в специальной литературе (статистика труда, статистика производства, социологические исследования и др.).
1.3 Основные способы отбора
Элементы как
генеральной так и выборочной совокупностей
могут считаться значениями
некоторой случайной величины Х.
Если выборка репрезентативная, то её
числовые характеристики являются
достаточно точными приближениями
соответствующих числовых характеристик
для значений соответствующих характеристик
Х (исследуемого признака). Если
репрезентативность выборки не обеспечена,
то в результате обработки полученных
выборочных данных можем получить
характеристики, существенно отличающиеся
от реальных значений.
Пример 1
Пусть необходимо найти средний рост учеников некоторой школы.
Для решения такой
задачи можно измерить рост всех
учеников и, взяв среднее арифметическое
для полученных результатов, получить
средний рост (точный). Можно упростить
процедуру, измеряя рост лишь части
учеников. Для этого можно последовательно
измерять рост всех входящих в школу,
пока не получим n
значений –
.
Средний рост для исследованных учеников
найдём как среднее арифметическое
полученных значений (их сумма, делённая
на количество). При репрезентативной
выборке можно предполагать малое отличие
полученного среднего роста от
действительного среднего роста для
всех учеников школы.
Стоит обратить внимание на возможность ситуации, когда в момент исследования в школу заходит школьная команда по баскетболу (с искусственно отобранными высокорослыми школьниками). В этом случае можно сказать, что, скорее всего, получим нерепрезентативную выборку. Отличие выборочных значений от реального среднего роста становится особенно заметным при сравнительно малом объёме выборки (n<30).
Даже такой простой пример показывает, что большую роль в получении верных результатов и в их дальнейшей обработке играет выбранный способ отбора элементов выборки из генеральной совокупности.
Перечислим основные способы отбора:
Механический
Применяется, когда из общего числа элементов генеральной совокупности последовательно выбирается каждый к-й её элемент (каждый десятый, каждый сотый и т.д.).
Данный способ удобен, когда элементы совокупности упорядочены:
Детали последовательно идут по конвейеру ;
Изделия имеют серийный номер по которым производится отбор;
Студенты имеют номер студенческого билета и т.д.;
Случайный отбор (по датчику случайных чисел)
Для такого способа существует несколько разновидностей:
а) Использование компьютера для получения случайного числа;
б) Выбор наудачу одного или нескольких билетов с номерами из общего
числа билетов с помощью лототрона (как в лотереях);
в) Использование таблиц случайных чисел (которые имеются в большинстве учебников по теории вероятностей, например приложение 10). В таких таблицах фиксируется одна или несколько строк (либо столбцов), число которых – число разрядов ожидаемых чисел. Если объём выборочной совокупности N в пределах десяти тысяч, то нужно брать по четыре числа из одного столбца (строки разбивать по 4 числа) и получать четырёхразрядные числа, в других случаях берётся большее либо меньшее число разрядов.
Например Трёхразрядные числа могут получиться при прочтении трёх столбцов таблицы приложения 10, начиная с шестого (или любого другого). В результате получим последовательность номеров 135, 813, 244, 083, 662, 841, 637, 578, 125, …. . После этого следует измерить интересуемое значение исследуемого признака для элементов с выбранными случайными номерами.
Существует ещё множество модификаций применения датчика случайных чисел, в результате каждого из них получаем n случайных номеров элементов генеральной совокупности. Получив случайный номер, необходимо исследовать элемент с этим номером, измерить значение исследуемого признака (получив числовое значение), записать его значение рядом с результатом предыдущего исследования. Процедура повторяется n раз, в результате получая выборку из n элементов;
Типический
Применяется, когда вся генеральная совокупность разбивается на несколько групп (типов) с разным распределением исследуемого признака. Из каждой группы выбирается такое число ее элементов, которое обычно пропорционально доле этой группы в общем объеме. В результате получается выборка из значений исследуемого признака выбранных элементов.
Пример 2
Для социологического опроса необходимо организовать такую выборку людей, в которой каждая из основных для данного региона групп населения (рабочие, инженеры, коммерсанты, фермеры и т.д.) была бы представлена с соблюдением их доли в населении данного региона.
В таком случае учитывают долю каждого типа (процентное отношение) среди населения данного региона. При обследовании социолог должен стараться, чтобы среди опрошенных людей (в выборке) соблюдался процент данной группы населения в общем объёме.
Пусть рабочие
предприятия А в данном регионе составляют
23% населения, социолог собрался опросить
200 человек. В таком случае он среди
двухсот опрошенных должен опросить
200·
=
46 рабочих предприятия А.
Пусть численности
работников трёх предприятий находятся
в отношении 5:3:2, тогда из двухсот человек
(n=200)
следует обследовать 200·
=100
рабочих с первого завода, 200·
=60
со второго завода и 200·
=40
рабочих с третьего завода;
Серийный
Применяется для совокупностей, состоящих из большого числа однотипных серий (групп), если в различных сериях исследуемый признак колеблется незначительно. В этом случае сплошному обследованию можно подвергнуть элементы одной или нескольких серий. По полученным данным можно говорить о признаке во всей генеральной совокупности;
Существуют и другие способы отбора.
