
- •Отчет по лабораторным работам по предмету «Методы и средства статистической обработки данных»
- •Оглавление
- •1. Индивидуальное задание
- •2. Планирование экспериментов
- •2.1. Стратегическое планирование
- •2.1.1. D - оптимальные планы
- •3. Основные статистические характеристики исд.
- •4. Оценка нормальности исд.
- •5. Временное прогнозирование.
- •6. Корреляционный анализ.
- •7. Кластерный анализ
- •8. Факторный анализ
- •9. Регрессионный анализ.
- •10. Дисперсионный анализ.
- •11. Оптимизация значений факторов и результативных показателей эффективности.
- •Приложение
3. Основные статистические характеристики исд.
Основными статистическими характеристиками являются:
Valid N - объем выборки;
Mean- среднее арифметическое. Среднее значение случайной величины представляет собой наиболее типичное, наиболее вероятное ее значение, своеобразный центр, вокруг которого разбросаны все значения признака.
Median– медиана. Медианой является такое значение случайной величины,которое разделяет все случаи выборки на две равные почисленности части.
StandardDeviation- стандартное отклонение. Стандартное отклонение (или среднее квадратическое отклонение) является мерой изменчивости (вариации) признака. Оно показывает на какую величину в среднем отклоняются случаи от среднего значения признака.
Variance– дисперсия. Дисперсия является мерой изменчивости, вариации признака и представляет собой средний квадрат отклонений случаев от среднего значения признака. В отличии от других показателей вариации дисперсия может быть разложена на составные части, что позволяет тем самым оценить влияние различных факторов на вариацию признака.
Standard error of mean –стандартнаяошибкасреднего. Стандартная ошибка среднего - это величина, на которую отличается среднее значение выборки от среднего значения генеральной совокупности при условии, что распределение близко к нормальному.
95% confidencelimitsofmean- 95%-ый доверительный интервал для среднего. Интервал, в который с вероятностью 0,95 попадает среднее значение признака генеральной совокупности.
Minimum, maximum- минимальное и максимальное значения.
Skewness–асимметрия. Асимметрия характеризует степень смещения вариационного ряда относительно среднего значения по величине и направлению.
Standard error of Skewness–стандартнаяошибкаасимметрии.
Kurtosis– эксцесс. Эксцесс характеризует степень концентрации случаев вокруг среднего значения и является своеобразной мерой крутости кривой.
Standard error of Kurtosis –стандартнаяошибкаэксцесса.
Таблица 5 - Результаты описательной статистики
4. Оценка нормальности исд.
Нормальный закон является наиболее употребительным. Он применяется для представления самых различных случайных процессов, таких, как продолжительность жизни людей, изменения экономических и технических показателей.
Выскажем гипотезу, что исходные статистические данные подчинены нормальному закону, и в качестве параметров нормального закона примем оценки математического ожидания и среднего квадратического отклонения, вычисленные по формулам.
Функция плотности нормального закона имеет вид:
;
.(1)
Так как в нашем случае количество реализаций переменных сравнительно невелико, то для оценки предположения о нормальности принимаем критерий Колмогорова – Смирнова, используемый в пакете прикладных программ (ППП) Statistica 6.0.
;
;
,
где F*(vij) – эмпирическая функция распределения j-ой переменной для i-го значения;
F(vij) – гипотетическая функция распределения j-ой переменной для i-го значения;
dj – абсолютная величина разности между эмпирической и гипотетической функциями распределения.
Значения гипотетической функции распределения находятся по статистическим таблицам.
;
;
.
Если коэффициент доверия Pк предположению о нормальности эмпирического распределения, который можно найти по статистическим таблицам, не меньше 0,20, то предположение о нормальности не отвергается. Если Рк<0,20, то предположение о нормальности рекомендуется отвергнуть.
Соответствие эмпирического и гипотетического распределений можно визуально проследить по графикам. При использовании критерия согласия Колмогорова предпочтительнее использовать функции распределения. Такие графики строятся и выдаются в специальных программных процедурах ППП Statistica 6.0 и Excel 2007 , на которые производится ориентация вычислений по излагаемому математическому аппарату. Представим распределение переменных на гистограммах (рис.3.-рис.8.).
На гистограммах наложена плотность нормального распределения, для проверки близости распределения к нормальному виду при помощи критерия Колмогорова-Смирнова.
Рис.3
Рис.4
Рис.5
Рис.6
Рис.7
Рис.8
Для анализа «нормальности» исходных статистических данных применен критерий согласия Колмогорова – Смирнова. Результаты представлены в таблице 6. Коэффициент доверия найден по статистическим таблицам.
Таблица 6 –Проверка нормальности
В 4 случаях из 10, что составляет 40%, ИСД соответствуют нормальному распределению по критерию Колмогорова-Смирнова. Из этого следует, что при увеличении количества учитываемых временных интервалов количество распределений, подчиненных нормальному закону, уменьшится.