- •1. Статистическое оценивание характеристик случайных величин
- •1.1. Общие сведения
- •1.2. Предварительная обработка результатов наблюдений
- •1.3. Критерий для неприятия резко выделяющихся наблюдений
- •1.4. Интервальное оценивание
- •2. Определение законов распределения случайных величин по опытным данным
- •2.1. Статистическая оценка гипотез. Уровень значимости
- •2.2. Критерии статистической оценки гипотез
- •2.3. Проверка гипотезы о нормальном распределении случайной величины
- •2.4. Проверка гипотезы о принадлежности опытных данных к показательному закону распределения
- •2.5. Проверка гипотезы о принадлежности опытных данных закону Пуассона
- •2.6. Проверка гипотезы о принадлежности опытных данных к закону Вейбулла
- •2.7. Выравнивание экспериментальных данных логарифмически нормальным законом
- •2.8. Статистическая проверка гипотезы о принадлежности опытных данных к гамма-распределению
- •2.9. Статистическая проверка гипотезы о принадлежности опытных данных к закону Эрланга
- •2.10. Блок-схема алгоритма предварительной обработки экспериментальных данных
2.7. Выравнивание экспериментальных данных логарифмически нормальным законом
В практике обработки наблюдений весьма часто бывают случаи, когда исследователь, использовав метод, изложенный в разделе 2.3, убедился, что гипотеза нормальности распределения не может быть принята, но может быть, что с помощью определенных методов удастся так преобразовать исходные данные, что их распределение будет подчиняться нормальному закону.
Логарифмически нормальный закон имеет место тогда, когда не сама случайная величина, а её натуральный логарифм распределен по закону Гаусса. Характерным признаком логарифмически нормального закона является то, что его кривая распределения имеет очень крутую левую и пологую правую ветвь. Асимметрия в этом случае положительна, и коэффициент вариации больше, чем 33 %. Для выполнения операции преобразования вся выборка данных расписывается до полного состава и каждое наблюдение трансформируют с помощью логарифмического преобразования
y = lnX. (2.21)
Плотность логарифмически нормального закона имеет вид :
,
(2.22)
где x - случайная величина, логарифм которой распределен нормально;
- математическое
ожидание логарифма случайной величины;
S (ln x) - среднее квадратическое отклонение логарифма случайной величины.
Покажем на примере порядок проверки гипотезы о принадлежности опытных данных к логарифмически нормальному закону. Исследуется закон распределения длины пробега тормозных накладок автомобилей семейства ВАЗ. Всего было зафиксировано N = I00 наблюдений. Размах длин пробега тормозных накладок до выхода их из строя составил от Хmin= 5 тыс.км до Хmax = 16 тыс.км. После упорядочения вариационный ряд был сгруппирован (при ширине интервала Δx = 1 тыс.км) в 12 интервалов (табл. 2.8.).
Первоначально находят натуральные логарифмы значений середин интервалов и заносят их в столбец 6 табл. 2.8. Дальнейший порядок действий тот же, что и при проверке гипотезы о принадлежности опытных данных к нормальному закону.
1. Вычисляем статистическое математическое ожидание и дисперсию случайной величины
Средний пробег тормозных накладок до выхода из строя
2. Находим несмещенное среднее квадратическое отклонение
3. Теоретические вероятности определяем по формуле
,
(2.23)
Все результаты расчетов помещаем в таблицу 2.9, в первую строку которой заносим значения границ интервалов γi, во вторую - натуральные логарифмы этих значений. В третью строку таблицы помещаем величины
Таблица 2.8
Статистическая обработка экспериментальных данных - длины пробега тормозных накладок автомобилей семейства ВАЗ
Номер разряда |
Границы интервалов времени простоя αi - βi, тыс.км |
Середины интервалов xci, с |
Опытные частоты
|
Опытные частости
|
yi=ln xci |
Pi ус |
Pi испр |
Теоретические числа попадания в интервалы |
Слагаемые критерия Пирсона
|
1 |
2 |
3 |
4 |
5 |
6 |
7 |
8 |
9 |
10 |
1 |
4,5-5,5 |
5 |
2 |
0,02 |
1,609 |
0,0300 |
0,031 |
3,1 |
0,39 |
2 |
5,5-6,5 |
6 |
11 |
0,11 |
1,792 |
0,0784 |
0,081 |
8,1 |
1,04 |
3 |
6,5-7,5 |
7 |
13 |
0,13 |
1,946 |
0,1278 |
0,131 |
13,1 |
0 |
4 |
7,5-8,5 |
8 |
18 |
0,18 |
2,079 |
0,1553 |
0,159 |
15,9 |
0,28 |
5 |
8,5-9,5 |
9 |
10 |
0,10 |
2,197 |
0,1543 |
0,158 |
15,8 |
2,13 |
6 |
9,5-10,5 |
10 |
13 |
0,13 |
2,303 |
0,1329 |
0,137 |
13,7 |
0,04 |
7 |
10,5-11,5 |
11 |
8 |
0,08 |
2,398 |
0,1032 |
0,106 |
10,6 |
0,64 |
8 |
11,5-12,5 |
12 |
9 |
0,09 |
2,485 |
0,0744 |
0,076 |
7,6 |
0,26 |
9 |
12,5-13,5 |
13 |
7 |
0,07 |
2,565 |
0,0507 |
0,053 |
5,3 |
0,55 |
10 |
13,5-14,5 |
14 |
3 |
0,03 |
2,639 |
0,0329 |
0,034 |
3,4 |
0,05 |
11 |
14,5-15,5 |
15 |
4 |
0,04 |
2,708 |
0,0208 |
0,021 |
2,1 |
1,72 |
12 |
15,5-16,5 |
16 |
2 |
0,02 |
2,773 |
0,0129 |
0,013 |
1,3 |
0,38 |
Итоговая строка |
|
=100 |
==1,0 |
=3339 |
|
|
=1,0 |
χ2 = 7,48 |
|
Таблица 2.9
γi |
4,5 |
5,5 |
6,5 |
7,5 |
8,5 |
9,5 |
10,5 |
11,5 |
12,5 |
13,5 |
14,5 |
15,5 |
16,5 |
ln γi |
1,504 |
1,705 |
1,872 |
2,015 |
2,140 |
2,251 |
2,351 |
2,442 |
2,526 |
2,603 |
2,674 |
2,741 |
2,803 |
zi |
-2,448 |
-1,784 |
-1,198 |
-0,696 |
-0,257 |
0,133 |
0,484 |
0,803 |
1,096 |
1,366 |
1,616 |
1,850 |
2,069 |
Ф(zi) |
-0,4929 |
-0,4629 |
-0,3845 |
-0,2567 |
-0,1014 |
0,0529 |
0,1858 |
0,2890 |
0,3634 |
0,4141 |
0,4470 |
0,4678 |
0,4907 |
Piус |
0,0300 |
0,0794 |
0,1278 |
0,1553 |
0,1543 |
0,1329 |
0,1032 |
0,0744 |
0,0507 |
0,0329 |
0,0208 |
0,0129 |
|
Пользуясь табл.1 приложения и методом линейной интерполяции, вычисляем значения функции Лапласа. Вычитая из каждого последующего значения Ф(zi+1) предыдущее Ф(zi), получаем искомые теоретические вероятности.
4. Суммируя значения (см. столбец 9 табл.2.8), получаем
=0,9746
Имеем усеченное распределение, коэффициент усечения
Вычисляем исправленные значения вероятностей
Pi испр = Кн Pi ус.
Результаты расчетов заносим в столбец 10 табл. 2.8.
5. На основе полученных поинтервальных теоретических вероятностей Pi испр производим выравнивание гистограммы опытных данных теоретической кривой логарифмически нормального закона (рис.2.8)
6. Вычисляем теоретические числа попадания случайной величины в интервалы
mi = Pi N.
Получаем m1 = 0,031 ∙ 100 = 3,1; m2 =0,081 ∙ 100 = 8,1. Аналогично для всех остальных разрядов (см. столбец 8 табл.2.5),
7. Определяем слагаемые критерия Пирсона. Суммируя эти значения, находим
χ2 = 7,48.
Рис.2.8. Гистограмма распределения частостей попадания длин пробега тормозных накладок (1) и выравнивающая её теоретическая кривая логарифмически нормального закона (2)
8. Проверяем правдоподобность гипотезы о принадлежности опытных данных к логарифмически нормальному закону с помощью критерия Пирсона. Для рассматриваемого примера число степеней свободы К = n - S = 12 - 3 = 9 и заданный уровень значимости α = 0,05.
По табл. V приложения с помощью линейной интерполяции находим
Р(χ2; К) = P(7,48; 9) = 0,581 > 0,05.
Следовательно, по критерию Пирсона гипотеза о принадлежности опытных данных к логарифмически нормальному закону подтверждается.
9. Проверяем правдоподобность принятой гипотезы с помощью критерия Романовского
И по критерию Романовского гипотеза о принадлежности опытных данных к логарифмически нормальному закону не отвергается.
Отметим также, что при трансформации асимметричного распределения к нормальному используют и другие преобразования (II). Таи для смещенного влево распределения (асимметрия положительная) применяются следующие замены переменных :
обратная величина
обратное значение
квадратных корней
Преобразование "обратная величина" является наиболее "сильным". Среднее положение между логарифмическим преобразованием и "обратной величиной" занимает преобразование "обратное значение квадратных корней".
Для нормализации смещенного влево распределения (асимметрия отрицательная) служат степенные преобразования y = xn.
При этом для показателя степени принимают значения: a = 1,5 - при умеренном и a = 2 - при сильно выраженном правом смещении.
Следует помнить, что после проведения статистической обработки трансформированных данных надо выполнить и обратное преобразование.
