Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Matem_ekzamen.docx
Скачиваний:
1
Добавлен:
01.05.2025
Размер:
11 Mб
Скачать

38. Анализ выборки: вариационный ряд, полигон, гистограмма, эмпирический закон и функция распределения.

Виды выборок

Повторная выборка – отобранный объект после обследования возвращается в совокупность перед отбором следующего объекта.

Бесповторная выборка – отобранный объект не возвращается в совокупность при обследовании.

(На практике обычно пользуются бесповторными выборками)

Репрезентативная (представительная) – дает правильное представление о совокупности,

(насколько это позволяют имеющиеся деньги и время)

Ошибочно сформированная выборка даст искаженное представление о совокупности.

В силу закона больших чисел можно утверждать, что выборка будет представительной,

      • если ее объем достаточно велик, а ее значения независимы;

      • если ее осуществлять случайно и если все ее объекты имеют одинаковую вероятность попасть в выборку.

(Если объем совокупности достаточно велик, а выборка составляет лишь незначительную часть этой совокупности, то различие между повторными и бесповторными выборками практически исчезает)

Способы отбора( составления выборки)

1.Отбор, не требующий расчленения генеральной совокупности на части.

      • простой случайный бесповторный отбор;

      • простой случайный повторный отбор.

2. Отбор, при котором генеральная совокупность разбивается на части:

  • типический отбор;

  • механический отбор;

  • серийный отбор.

Простой случайный отбор:

  • «лотерея»

  • таблицы случайных чисел

  • генерация случайных чисел на ПЭВМ

  • Типическим называют отбор, при котором объекты отбираются не из всей генеральной совокупности, а из каждой ее “типической” части. Типическим отбором пользуются тогда, когда обследуемый признак заметно колеблется в различных типических частях генеральной совокупности.( Например, если продукция изготовляется на нескольких машинах, среди которых есть более и менее изношенные, то здесь типический отбор целесообразен)

  • Механическим называют отбор, при котором генеральную совокупность “механически” делят на столько групп, сколько объектов должно войти в выборку, а из каждой группы отбирают один объект.

  • (иногда механический отбор может не обеспечить репрезентативности выборки)

  • Серийным отбор – объекты отбирают из генеральной совокупности не по одному, а “сериями”, которые подвергаются сплошному обследованию.Серийным отбором пользуются тогда, когда обследуемый признак мало колеблется в различных сериях. Подчеркнем, что на практике часто применяется комбинированный отбор, при котором сочетаются указанные выше способы. Например, иногда разбивают генеральную совокупность на серии одинакового объема, затем простым случайным отбором выбирают несколько серий и, наконец, из каждой серии простым случайным отбором извлекают отдельные объекты.

  • Статистическое распределение выборки

  • Обычно исследуется лишь некоторая количественная характеристика хi объекта генеральной совокупности, (или набор характеристик х, у).

  • Множество значений хi для всех объектов генеральной совокупности может рассматриваться как случайная величина ξ, а множество наборов (хii) – как случайный вектор (ξ,η) с неизвестными распределениями, изучаемые с помощью выборки.

  • Вариационные ряды.

  • Пусть обследуется некоторый количественный признак ξ и из генеральной совокупности извлечена выборка (х1, х2, ..., хn), причем значение х1 наблюдалось n1 раз, значение х2 наблюдалось n2 раз и т.д.

  • .

, где n-объем выборки.

Наблюдаемые значения xi называются вариантами, последовательность вариант, записанных в возрастающем порядке, называется вариационным рядом.

Числа ni называются частотами вариант, а отношение частоты ni к объему n выборки, т.е.

называется относительной частотой варианты хi , где i=

Эмпирическим (выборочным) распределением

называется перечень вариант xi вариационного ряда и их соответствующих частот (или их относительных частот).

При изучении непрерывных распределений, когда значения вариант могут отличаться на сколь угодно малую величину, всю область, где находятся наблюдаемые значения признака, разбиваем на частичные интервалы (i-1, i,) длиной i – i-1= hi и находим для каждого интервала ni – сумму частот вариант, попавших в этот i-й интервал.

Пример . Дана выборка: 2; 5; 7; 3; 2; 5; 6; 3; 6; 5. Записать выборку в виде вариационного и статистического рядов. Определить объем.

Решение.

Вариационный ряд выборки: 2; 2; 3; 3; 5; 5; 5; 6; 6; 7.

Статистический ряд (дискретный) имеет вид

Объем выборки n=

Полигон и гистограмма

Полигоном частот выборки называется ломаная, соединяющая точки (х1;n1), (x2; n2) ,..., (xк;nк).

Полигоном относительных частот называется ломаная, соединяющая точки (х1; W1), (х2; W2),..., (хк; Wк).

Гистограмма частот – это ступенчатая фигура, состоящая из прямоугольников, основаниями которых являются частичные интервалы длины hi, а высоты равны (плотность частоты).

Эмпирическая функция распределения

Пусть известно статистическое распределение частот количественного признака ξ, обозначим через nx - число наблюдений, при которых наблюдаемое значение признака меньше некоторого числа х.

Эмпирической функцией распределения назовем функцию

Это есть функция выборочного (эмпиричекого) распределения.

По теореме Бернулли из закона больших чисел следует, что относительная частота события сходится по вероятности к вероятности этого события при ; т. е. при больших n значения F*(х) и F(x) мало отличаются, т. к.

F*(x) обладает свойствами:

      • Неубывающая функция.

      • Если хi=x min и хj=хmax соответственно наименьшая и наибольшая варианты ряда, то F*(x)=0 при х<x min, и F*(x)=1 при х>x max.

  • Пример:Построить эмпирическую функцию распределения, если распределение выборки имеет вид

Решение.

Т.к., где n = 20, то

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]