Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Методичка Пиявского.doc
Скачиваний:
10
Добавлен:
29.03.2015
Размер:
908.29 Кб
Скачать

МЕТОДЫ АНАЛИЗА ДАННЫХ

для выполнения исследований на младших курсах ФИСТ

С.А.Пиявский

1 Несколько основных понятий математической статистики

Сразу оговоримся, что материал излагается в упрощенной терминологии и применительно к достаточно узкой сфере возможностей математической статистики, достаточной для выполнения исследований на младших курсах ФИСТ. Он не может заменить систематизированное освоение математической статистики.

Математическая статистика (МС)используется для формирования правдоподобных суждений относительно объектов из некоторой однородной совокупности (так называемойгенеральной совокупности) на основе результатов наблюдений за ограниченным их числом (так называемойвыборкой). Степень правдоподобия суждений оценивается количественно числом, которое называютвероятностьюсуждения.

Вероятность – это отвлеченное число от нуля до единицы (или, в процентах, от нуля до ста процентов), которое тем больше, чем правдоподобнее суждение. Можно считать, что численно вероятность равна доле объектов генеральной совокупности, для которых суждение справедливо. Если вероятность равна нулю, то суждение неверно, если единице – полностью верно для всех элементов генеральной совокупности.

Далее будем рассматривать объекты, каждый из которых характеризуется значением единственного числового параметра. Этот параметр назовем случайной величиной (СВ). Например, можно рассматривать всех людей Земли как генеральную совокупность, элементы которой (объекты) характеризуются ростом (в сантиметрах). Тогда рост людей (в сантиметрах) – это случайная величина. Наблюдая за отдельными элементами генеральной совокупности, т.е. измеряя рост отдельных людей, можно делать различные суждения относительно любого объекта из генеральной совокупности. Например, «рост конкретного человека не менее 10 см» - вероятность этого равна нулю; «рост конкретного человека не более трех метров» - вероятность этого равна единице; «рост конкретного человека заключен между 160 и 180 см» - вероятность этого нам неизвестна, но МС позволяет ее приближенно рассчитать, измеряя рост сравнительно небольшого количества людей. При этом, правда, нужно обеспечить однородность элементов генеральной совокупности (например, это должны быть люди одной расы, социального слоя, выросшие в одной местности и т.п.).

2 Гистограмма

Поскольку об объектах генеральной совокупности не известно ничего, кроме значений, которые принимает на каждом из них случайная величина, генеральная совокупность полностью характеризуется совокупностью этих значений. Если число элементов генеральной совокупности конечно, эти значения можно перечислить. Но более удобно построить т.н. гистограмму, которая дастнаглядноепредставление о генеральной совокупности в целом. Для этого выясним диапазонзначений СВ, разобьем его наравных промежуткови рассчитаем долю значений СВ, попадающих в каждый промежуток (если значение СВ попадает на границу двух соседних промежутков, будем добавлять к числу попаданий в каждый из них). Получится таблица типа таблицы 1.

Таблица 1 – Пример расчетов для построения гистограммы СВ

Границы промежутков значений СВ

Количество попаданий СВ на промежуток

Доля попаданий СВ на промежуток

-1

5

0,09

-0,5

7,5

0,14

0

10,5

0,19

0,5

15

0,27

1

10,5

0,19

1,5

6,5

0,12

2

Сумма

55

1,00

На основании таблицы 1 строится гистограмма, показанная на рисунке 1. По оси абсцисс откладываются значения СВ, по оси ординат – доля объектов генеральной совокупности, для которых значения СВ попадают в соответствующий интервал. Гистограмма состоит из прямоугольников, основаниями которых являются промежутки значений СВ, а высотами – доля значений СВ, попадающих в эти промежутки. Заметим, что сума высот всех прямоугольников всегда равна единице.

-1 -0,5 0 0,5 1 1,5 2

Рисунок 1 – Пример гистограммы

Замечательное свойство гистограммы состоит в следующем. Начиная с некоторого объема выборки, ее вид практически не меняется, если увеличивать выборку, произвольно (т.е. без каких либо особых условий) добавляя к ней новые элементы генеральной совокупности. Это дает возможность по сравнительно небольшому числу элементов выборки делать суждения о генеральной совокупности в целом.