Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Shpory_po_mm.doc
Скачиваний:
1
Добавлен:
01.04.2025
Размер:
13.44 Mб
Скачать

2. По математической статистике

Вопрос 2.1 Генеральная совокупность и выборка

Генеральная и выборочная совокупности.

  1. Пусть требуется изучить совокупность однородных объектов относительно некоторого качественного или количественного признака, характеризующего эти объекты.

  2. Иногда проводят сплошное обследование. На практике, однако, сплошное обследование применяют редко. Чаще случайно отбирают из всей совокупности ограниченное число объектов и подвергают их изучению.

  3. Выборочной совокупностью или просто выборкой называют совокупность случайно отобранных объектов.

  4. Генеральной совокупностью называют совокупность объектов, из которых производится выборка.

  5. Объемом совокупности (выборочной или генеральной) называют число объектов этой совокупности.

  6. Различают повторную (с возвращением) и бесповторную (при которой отобранный объект в генеральную совокупность не возвращается) выборки.

  7. Для того, чтобы по данным выборки можно было судить об интересующем признаке генеральной совокупности, необходимо, чтобы объекты выборки правильно ее представляли. Другими словами, выборка должна правильно представлять пропорции генеральной совокупности. Это требование коротко формулируют так: выборка должна быть репрезентативной (представительной).

Для этого необходимо, чтобы выборка была:

  1. случайной;

  2. объем выборки должен быть достаточно велик.

  3. Способы отбора:

Отбор не требующий расчленения генеральной совокупности на части: а) простой случайный бесповторный отбор; б) простой случайный повторный отбор.

  1. 2.Отбор, при котором генеральная совокупность разбивается на части:а) типический отбор; б) механический отбор; в) серийный отбор.

  2. Чтобы избежать грубых ошибок в работе и получить сопоставимые результаты, необходимо соблюдать признанные правила записи и округления приближенных чисел. Очень важно, чтобы числа, фиксируемые в документах учета, соответствовали точности, принятой при измерении варьирующих объектов. Так, если измерения проводят с точностью до одного десятичного знака, то результаты измерений нельзя записывать, например, в таком виде: 4,2; 6; 6,69; 5,082 и т.д. Правильная запись этих чисел будет такова: 4,2; 6,0; 6,7; 5,1.

Способы группировки первичных данных

Обработка начинается с упорядочения или систематизации собранных данных. Процесс систематизации результатов массовых наблюдений, объединения их в относительно однородные группы по некоторому признаку называется группировкой.

Наиболее распространенной формой группировки являются статистические таблицы; они бывают простыми и сложными. К простым относятся, например, четырехпольные таблицы, применяемые при альтернативной группировке, когда одна группа вариант противопоставляется другой.

К сложным относятся многопольные таблицы.

Особую форму группировки представляют так называемые статистические ряды.

Пусть из генеральной совокупности извлечена выборка, причем х1 наблюдалась n1 раз, х2 – n2 раз,… хк – nк раз и Σnк = n – объем выборки.

Наблюдаемые значения хi называют вариантами, а последовательность вариант, записанных в возрастающем порядке, – вариационным рядом. Числа наблюдений (ni) называют частотами, а их отношения к объему выборки ni/n = Wi относительными частотами. (Вариационный ряд – ряд ранжированных значений признака, в котором указана частота их встречаемости в данной совокупности.)

Статистическим распределением выборки называют перечень вариант и соответствующих им частот или относительных частот.

Статистическое распределение можно задать также в виде последовательности интервалов и соответствующих им частот (в качестве частоты, соответствующей интервалу, принимают сумму частот попавших в этот интервал).

Вариационные ряды бывают:

- безынтервальные;

- интервальные (неравноинтервальные или равноинтервальные).

Число классов в интервальном вариационном ряду определяют:

- по таблицам (например, при объеме выборки n=25…40 число классов принимают 5..6; при n=40…60 – 6-8;

- по формуле, например, Стерджеса: К = 1 + 3,32∙lgn

или по формуле Брукса и Карузерс: К = 5∙lgn при n > 100.

Графическое изображение вариационных рядов.

  1. Для наглядного представления закономерностей варьирования количественных признаков, вариационные ряды изображают в виде графиков. При построении графика безынтервального вариационного ряда по оси абсцисс откладывают срединные значения классов, по оси ординат – частоты. Высота перпендикуляров, восставляемых по оси авсцисс, соответствует частотам классов. Соединяя вершины перпендикуляров прямыми линиями, получают геометрическую фигуру в виде многоугольника, называемую полигоном распределения частот.

  2. При постороении графика интервального вариационного ряда по оси абсцисс откладывают границы классовых интервалов, по оси ординат - частоты интервалов. В результате получается гистограмма распределения частот.

Эмпирическая функция распределения.

Пусть nx – число наблюдений, при которых наблюдалось значение признака, меньшее х; n – объем выборки. Ясно, что относительная частота события X < x равна nх/n.

Эмпирической функцией распределения (функцией распределения выборки или выборочной функцией распределения) называют функцию F*(x), определяющую для каждого значения х относительную частоту события Х < x.

Итак, по определению,

F*(x) = nх/n, (1.1)

где nх – число вариант, меньших х;

n – объем выборки.

В отличие от эмпирической функции распределения выборки функцию распределения F(x) генеральной совокупности называют теоретической функцией распределения.

При больших n F*(x) и F(x) мало отличаются одно от другого. Отсюда следует целесообразность использования эмпирической функции распределения выборки для приближенного представления теоретической (интегральной) Функции распределения генеральной совокупности.

Следует заметить, что F*(x) обладает всеми свойствами F(x) (принадлежит [0,1]; неубывающая; F*(x) = 0 при x ≤ x1; F*(x) =1 при х> xi ).

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]