
- •Государственное образовательное учреждение высшего профессионального образования новоуральский государственный технологический институт
- •Новоуральск 2004
- •Содержание
- •Предисловие
- •Глава 1 Выборочный метод
- •1.1 Выборка
- •1.2 Основные задачи статистики
- •1.3 Основные способы отбора
- •1.4 Первичный анализ выборки
- •Глава 2 Виды представления выборочных
- •2.3 Эмпирическая плотность распределения
- •3.6 Другие способы представления данных
- •Объём реализации
- •3.6.2 Ленточные диаграммы
- •3.6.3 Столбиковые диаграммы
- •Глава 3 Числовые характеристики выборки
- •3.1 Выборочное среднее, выборочная дисперсия
- •3.1.1 Несгруппированные данные
- •3.1.4Введение «ложного нуля»
- •3.2 Коэффициенты асимметрии, эксцесса и вариации
- •3.2.1 Начальные моменты p-го порядка
- •3.2.3 Связь центральных и начальных моментов
- •3.2.4 Коэффициент асимметрии
- •Мода и медиана
- •4.2 Виды статистических оценок. Исправление дисперсии
- •5 Теоретические распределения
- •5.1 Дискретные случайные величины
- •5.1.1 Биномиальное распределение
- •5.1.2 Альтернативный признак
- •5.1.4 Геометрическое распределение
- •5.1.5 Гипергеометрическое распределение
- •5.2 Непрерывные случайные величины
- •5.2.4 Распределение Хи-квадрат
- •5.2.5 Распределение Стьюдента
- •5.3 Использование MathCad
- •6 Проверка гипотезы о виде распределения
- •6.1 Общие определения
- •6.2 Критерий согласия Пирсона
- •6.3 Критерий согласия Романовского
- •6.4 Критерий согласия Колмогорова
- •6.5 Сравнение наблюдаемой относительной частоты альтернативного признака с его гипотетической вероятностью
- •7 Доверительные интервалы
- •7.1 Понятие доверительного интервала
- •7.2 Наименьший объём выборки
- •7.3 Доверительный интервал для м(х)
- •7.4 Доверительный интервал для (х)
- •7.5 Оценка вероятности по относительной частоте
- •8 Общий план обработки статистических данных
- •8.1 Получение выборочных данных
- •Первичная обработка выборочных данных
- •Теоретическое распределение
- •9 Пример обработки статистических данных
- •10 Контрольное задание
- •Критические точки распределения
- •Критические точки распределения Стьюдента
- •12 Рекомендуемая литература
- •Подписано в печать _______________ Формат а5 Гарнитура
- •624130, Г.Новоуральск, ул. Ленина 85, нгти
Предисловие
Статистика как наука зародилась еще несколько тысяч лет назад, когда появились потребности в прогнозе запасов продуктов для крупных городов, проведения переписей населения и т.д. В современном мире практически во всех отраслях промышленности, экономики, социологии и прочих используются статистические данные. Даже если какой – либо процесс можно описать теоретически и получить его математическое описание, реальные значения могут отличаться от ожидаемых из-за погрешности при получении исходных параметров или влияния неучтённых факторов. В этом случае помогают статистические исследования. В наше время существует множество различных объектов статистического исследования и соответствующие им разделы статистики: статистика труда, статистика производства, статистика в социологии и других. Нахождение зависимостей в новых структурах невозможно без их статистического анализа.
Различные разделы статистики могут иметь различные объекты исследования и различные понятия, но все они используют общий вычислительный аппарат – математическую статистику, основные положения которой приведены в данном пособии. На современном этапе имеется множество компьютерных систем обработки статистических данных, которые, при умелом использовании, являются очень мощных аппаратом для исследователя. Данное пособие предназначено для ознакомления с основными понятиями статистики, способами вычисления и свойствами статистических параметров и характеристик.
Пособие рассчитано на студентов, изучивших курс «теория вероятностей» и имеющих представление о
Вероятности события;
Математическом ожидании случайной величины;
Функции F(x) и плотности распределенияf(x) случайной величины;
Основных видах распределения случайных величин, их характеристиках M(X),D(X),
, их основных свойствах.
Внимательно изучивший данное пособие студент, работая со статистическими или математическими пакетами в курсе «Информатика», будет иметь представление о решаемых задачах.
В качестве задачи, требующей применения математической статистики, может выступить такая задача: «Имеется крупная партия изделий (10000 штук), среди которых часть бракована – размер сильно отличается от допустимого. Требуется оценить долю брака во всей партии по результатам измерения некоторой части этих деталей. Погрешность не должна превышать пяти процентов от результата».
В конце пособия находится типовое задание по полной обработке статистических данных, пример подобного задания подробно разобран.
Глава 1 Выборочный метод
1.1 Выборка
Пусть каждому элементу некоторого множества соответствует некоторое числовое значение, возможно, с указанием единиц измерения (тонны, рубли, киловатт-часы, градусы и т.д.). Совокупность всех таких значений образует генеральную совокупность, для которой число элементов называется объемом генеральной совокупности и обозначается N (объём может быть и бесконечным).
В качестве генеральной совокупности могут выступить
Данные о возрасте каждого жителя России на данный момент времени (или их вес, число детей, номер паспорта, другой числовой показатель);
Данные о весе всех производимых на заводе деталей (или другом их размере, цене изделий и т.д.);
Оценки, полученные студентами выбранного института на экзаменах за последние пять лет;
Данные о дневной либо месячной выручке всех торговых точек города (области, страны);
и т.д.
Иногда произвести замер исследуемого показателя для всех элементов совокупности бывает возможно, хотя в большинстве случаев получение данных обо всех элементах генеральной совокупности бывает слишком трудоемко или вообще невозможно. Такие задачи обычно встречаются в экономике, социологии, при управлении большим предприятием и т.д.
Например:
а) Измерение веса каждого гражданина России – очень трудоемкая операция, требующая больших затрат как средств так и людских ресурсов;
б) Измерение срока, через который каждый произведенный продукт испортится, не имеет смысла – ведь после этого будет испорчена вся партия продукта.
Из генеральной совокупности объема N отбирается определенным образом выборочная совокупность (которую в дальнейшем будем называть выборкой). Она состоит из элементов генеральной совокупности, но её объем равен n, причём n < N.
Выборка отбирается, для того, чтобы по её характеристикам (параметрам) судить о соответствующих характеристиках всей генеральной совокупности. Приходится сразу настраиваться, что полученные выборочные значения отличаются от характеристик генеральной совокупности, но ведь и очень точные значения бывают не всегда нужны.
Исследователь должен сразу установить уровень достоверности, которому должны соответствовать полученные данные, ведь за большую точность придётся заплатить увеличением затрат времени и средств. Уровень достоверности устанавливается из уровня важности принимаемых решений. В большинстве случаев берётся уровень достоверности 95% или 90%. В зависимости от важности принимаемых по статистическим данным решений уровень достоверности может быть повышен либо снижен.