- •Томашевский а.В., Рысиков в.П. Учебное пособие компьютерные технологии статистической обработки данных
- •Введение
- •1.Краткая характеристика основных пакетов статистической обработки
- •1.1. Общие представления
- •1.2. Ввод данных в пакете statistica
- •1.3.Контрольные вопросы и задания
- •1.3.1.Вопросы
- •1.3.2. Задания
- •2. Начальная статистическая обработка данных
- •2.1. Понятие о генеральной совокупности и выборке
- •2.2. Случайные величины и их характеристики
- •2.3. Распределения случайных величин
- •2.4. Компьютерные технологии начальной статистической обработки
- •2.5. Контрольные вопросы и задания
- •2.5.1.Вопросы
- •2.5.2. Задание
- •3. Проверка статистических гипотез
- •3.1. Основные положения
- •3.2. Проверка гипотезы о законе распределения
- •3.3. Проверка гипотез о равенстве дисперсий и математических ожиданий
- •3.4. Компьютерные технологии проверки статистических гипотез
- •3.5. Контрольные вопросы и задания
- •3.5.1.Вопросы
- •3.5.2. Задания
- •4. Корреляционный анализ
- •4.1. Основные положения
- •4.2. Корреляционное поле
- •4.3. Выборочный коэффициент корреляции.
- •4.4. Корреляционное отношение
- •4.5. Частные коэффициенты корреляции.
- •4.6. Ранговая корреляция.
- •4.7. Компьютерные технологии корреляционного анализа
- •4.8. Контрольные вопросы и задания
- •4.8.1.Вопросы
- •4.8.2. Задания
- •5. Регрессионный анализ
- •5.1. Основные положения
- •5.2. Компьютерные технологии регрессионного анализа
- •5.3. Контрольные вопросы и задания
- •5.3.1.Вопросы
- •5.3.2. Задания
- •6. Дисперсионный анализ
- •6.1. Основные положения
- •6.2. Однофакторный дисперсионный анализ
- •6.3 Двухфакторный дисперсионный анализ
- •6.5. Контрольные вопросы и задания
- •6.5.1.Вопросы
- •5.3.2. Задания
- •7. Планирование эксперимента
- •7.1. Основные положения
- •7.2. Полный факторный эксперимент
- •7.3 Центральное композиционное планирование
- •7.5. Контрольные вопросы и задания
- •7.5.1.Вопросы
- •7.5.2. Задания
- •Приложение статистические таблицы Функция стандартного нормального распределения
- •Критические точки распределения Стьюдента
- •Критические точки распределения 2
- •Рекомендована література
2.3. Распределения случайных величин
Функция распределения случайной величины задает вероятность того, что случайная величина примет значение меньше, чем x, т.е. вероятность нахождения случайной величины в интервале [-¥ , x]. В общем виде функция распределения определяется как F(x,q), где q - вектор параметров. Для наиболее распространенных законов распределения непрерывных случайных величин q = (a,b,c), где a– параметр положения (сдвига), b – параметр масштаба (рассеяния), c – параметр формы.Если параметры a и b известны, то можно использовать нормированную форму представления случайной величины XN = (x-a)/b.
Функция распределения F(x,q) обладает следующими свойствами:
0 £ F(x,q) £1 ;
F(x2,q) ³ F(x1,q), если x2 ³ x1 ;
F(x,q) = 0, при x® -¥ ,F(x,q) = 1, при x® ¥
При известной функции плотности вероятности f (x,q):
Для непрерывной случайной величины функция плотности вероятности f(x,q) показывает вероятность получения величины x в интервале [x, x+dx], для дискретной случайной величины функция плотности вероятности показывает вероятность получения величины x, т.е. дискретному набору значений х1,х2,, … сопоставляются вероятности f (x1,q), f (x2,q), … .
Наиболее распространенные законы распределения непрерывных и дискретных случайных величин приведены в таблице 2.3.1. [1, 4, 5, 9].
Табл.2.3.1.
-
Вид распределения
Функция плотности вероятности
f (x,q):
Непрерывные распределения
Нормальное
Вейбулла
Экспоненциальное
Равномерное
Дискретные распределения
Биномиальное
Пуассона
Нормальное распределение рассмотрено впервые А. Муавром в 1733г., а в 1809г. снова открыто независимо от А. Муавра К. Гауссом. Нормальное распределение (Муавра–Гаусса) занимает ведущее место в теории и практике , в частности, в технике, экономике, социологии, , медицине, биологии и пр. [1, 9]. При нормировании случайных величин функция нормального распределения представляется функцией Лапласа
.
Нормальное распределение симметрично относительно m и имеет следующие характеристики: математическое ожидание M(x)=m=a, дисперсию D(x) = s2 =b2, коэффициент асимметрии 1 = 0, коэффициент эксцесса 2 = 3, приведенный коэффициент эксцесса = 0.
Распределение Вейбулла довольно часто используется в теории надежности для описания вероятности безотказной работы, плотности вероятности отказов , времени наработки до отказа и др. и[9] для нормированных случайных величин (a=0, b=1) имеет математическое ожидание M(x) = Г(c+1), дисперсию D(x) = Г((c+2)/c) – Г2((c+1)/c) , где Г(×) – гамма-функция.
Экспоненциальное распределение хорошо описывает случайные величины, характеризующие длительность жизни (демография), интенсивность отказов (теория надежности) и др.[1, 5, 9] и для нормированных случайных величин имеет математическое ожидание M(x) = b, дисперсию D(x) = b2.
Равномерное (прямоугольное) распределение находит применение при анализе времени ожидания "обслуживания" при точно периодическом, через каждые Т единиц времени, прибытии (включении) обслуживающего устройства и при случайном поступлении заявки на обслуживание в этом интервале времени [1]. Функция равномерного распределения определяется как
Математическое ожидание M(x)=(a+b)/2, дисперсия D(x) = (b-a)2/12.
Биномиальный закон показывает вероятность появления некоторого события х раз (т.е.дискретной случайной величины, принимающей значения 1,2, … ) при n независимых испытаниях, при условии, что р – вероятность появления этого события и q=1-p вероятность его непоявления. Математическое ожидание M(x) = np, дисперсия D(x) = npq.
Биномиальный закон можно использовать для описания числа дефектных изделий в партии, для оценки числа покупателей в магазине, которые сделали покупку и др.
Закон Пуассона является предельным случаем биномиального при возрастании числа испытаний n ® ¥ , когда q ® 0. Используется, если необходимо описать появление кауих-либо событий (например, возникновение отказов) на заданном интервале времени. Интервал времени связывается с параметром распределения l . Математическое ожидание M(x) = l, дисперсия D(x) = l.
Вид функций плотности вероятности для распределений приведенных в таблице 2.3.1, наглядно проиллюстрирован в модуле Probability calculator пакета STATISTICA
