Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Лекции / Лекции по математической статистике / Матстат 2 конспект / 02_Первичная обработка данных наблюдений.doc
Скачиваний:
89
Добавлен:
13.06.2014
Размер:
5.56 Mб
Скачать

§2. Первичная обработка данных наблюдений. Построение закона распределения по статистическим данным Основные определения.

Над случайной величиной Х проводятся наблюдения (опыты). Результатом каждого наблюдения является одно число, которое обозначаем х i ( то значение, которое она приняла в данном опыте). Каждое такое опытное значение называют в статистике словом «варианта».

Опытные данные, записанные в порядке получения, образуют простой статистический ряд.

х 1 ; х 2 ; х 3 ; . . . . х n

Все вместе данные наблюдений образуют выборочную совокупность или выборку : ( х 1 , х 2 , х 3 , . . . . х n )

Общее число проведенных наблюдений обозначают n и называют объемом выборки.

Все возможные значения случайной величины Х образуют т.н. генеральную совокупность (от слова general – общий).

Замечание: обрабатывая опытные данные, мы хотим получить информацию о случайной величине. Источником этой информации являются числа, которые попали в выборку. Но это только часть возможных значений случайной величины.

Во–первых, информация, которую мы таким образом получаем, неизбежно будет неполной, приблизительной. Это неизбежная черта всех статистических методов, которую постоянно приходится учитывать.

Во–вторых, отобранные опытные данные должны правильно отображать случайную величину в целом, выборка должна быть представительной или репрезентативной. Существуют специальные методы отбора информации для получения репрезентативной выборки. Отбор может быть случайным, сплошным, групповым и т.д.

Первичная обработка опытных данных.

Сначала опытные данные принято упорядочить. Опытные данные, записанные в порядке возрастания, образуют вариационный ряд.

х 1 х 2 ≤ х 3 . . . . ≤ х n

Дальнейшие действия зависят от того, с какой случайной величиной мы имеем дело, с дискретной или с непрерывной.

Пусть рассматривается дискретная случайная величина. Тогда опытные данные могут повторяться. Если данные повторяются, для каждого повторяющегося значения найдем его частоту n i (количество повторений). Составим таблицу:

х

х 1

х 2

х 3

х k

ni

n1

n2

n3

nk

Сумма всех частот должна быть равна объему выборки:

Теперь для каждого опытного значения можем подсчитать и занести в таблицу относительную частоту:

х i

х 1

х 2

х 3

х k

wi

w1

w2

w3

wk

Это – статистический ряд распределения

Замечание: Такая же по виду таблица, в которой записывались вероятности, называлась рядом распределения (теоретическим). Так как относительные частоты – это и есть опытным путем найденные вероятности (их приближенное значение, w i ≈ p i), делаем вывод: дает нам представление о теоретическом ряде распределения. Чем больше проведено наблюдений (чем больше объем выборки n) тем ближе относительные частоты к вероятностям, тем ближе статистический ряд распределения к теоретическому ряду распределения