лб3_СОЭ_Каширина
.docxМинистерство образования и науки Российской Федерации
федеральное государственное автономное образовательное учреждение
высшего образования
«НАЦИОНАЛЬНЫЙ ИССЛЕДОВАТЕЛЬСКИЙ
ТОМСКИЙ ПОЛИТЕХНИЧЕСКИЙ УНИВЕРСИТЕТ»
Инженерная школа природных ресурсов
Направление подготовки 18.03.01 Химическая технология
Отделение химической инженерии
ОТЧЕТ
по лабораторной работе № 3
ОПИСАТЕЛЬНЫЕ СТАТИСТИКИ |
|
Студент
Группа |
ФИО |
Подпись |
Дата |
2Д22 |
Каширина Вероника |
|
|
Руководитель
Должность |
ФИО |
Ученая степень, звание |
Подпись |
Дата |
ассистент |
Богданов И.А. |
к.т.н. |
|
|
Томск – 2024 г.
ЦЕЛЬ РАБОТЫ:
Вычислить описательные статистики для представленных статистических данных (1 вариант).
ТЕОРЕТИЧЕСКАЯ ЧАСТЬ:
Предположим, что вы исследуете содержание дибензотиофена в партии дизельного топлива хроматографическим методом. Каждый метод измерения имеет погрешность. Делая одно измерение, вы получаете значение, которое может отличаться от истинного значения (которое, как правило, неизвестно). Если сделать все возможные измерения (потратить на это всю исследуемую партию топлива), и для полученных значений рассчитать среднее, то оно совпадет с истинным значением. Результаты всех проведенных исследований образуют генеральную совокупность.
Генеральная совокупность – теоретически все возможные значения переменной (измерения исследуемого показателя).
Однако проводить такие исследования нецелесообразно – на это уйдет много времени, энергии и вся партия топлива. Поэтому проводится меньшее количество измерений, результаты которых называются выборкой. Выборка является частью генеральной совокупности. В статистике выборкой называют любой исследуемый набор значений.
Переменная (английский термин variable) – это то, что можно измерять, контролировать, или чем можно манипулировать в исследованиях.
Так как значения переменных не постоянны, нужно научиться описывать их изменчивость. Идея описательных (дескриптивных) статистик проста: вместо того чтобы рассматривать все значения переменной, а их может быть очень много (тысячи и миллионы), вначале стоит просмотреть описательные статистики. Они дают общее представление о значениях, которые принимает переменная.
Рассмотрим основные описательные статистики.
Выборочное среднее значение. Для генеральной совокупности среднее значение является истинным значением. Выборка является некоторой частью генеральной совокупности, поэтому для нее среднее значение называется выборочным средним значением. Из генеральной совокупности можно сделать несколько выборок, и каждая из них будет характеризоваться выборочным средним значением, которые могут быть различны.
Отметим, что среднее значение очень чувствительно к выбросам – аномально высоким или низким значениям, которые выделяются из всей выборки. При наличии таких значений, среднее может дать неправильное представление о центре выборки. Если выборка имеет несимметричное распределение, также не следует использовать среднее значение для характеристики центра выборки.
Выборочная дисперсия (аналогично выборочному среднему значению) (английское variance, термин введен впервые Р.Э. Фишером в 1918 г.) переменной величины Х вычисляется по формуле:
|
(1) |
где n
– количество измерений (объем выборки),
– среднее значение.
Дисперсия является мерой разброса данных относительно среднего. Меняется от нуля до бесконечности. Крайнее значение 0 означает отсутствие изменчивости, когда переменная принимает одно и тоже значение.
Выборочное стандартное отклонение (standard deviation) равно корню квадратному из дисперсии:
|
(2) |
Выборочная дисперсия и выборочное стандартное отклонение – наиболее часто используемые меры изменчивости переменной. Чем выше дисперсия или стандартное отклонение, тем сильнее разбросаны значения переменной относительно среднего. Стандартное отклонение – более удобная характеристика, так как измерена в тех же единицах, что исходная величина.
Коэффициент вариации – также является мерой разброса данных относительно среднего значения. Рассчитывается как отношение стандартного отклонения к среднему:
|
(3) |
Коэффициент вариации используется для сравнения степени вариации двух или более выборок, что удобно при различии средних значений. Является безразмерной величиной, измеряется в относительных единицах, либо в процентах.
Среднее значение, дисперсия, стандартное отклонение и коэффициент вариации являются ключевыми описательными статистиками.
Медиана выборки (термин введен впервые Ф. Гальтоном, в 1882 г.) – значение, которое разбивает выборку на две равные части. Половина наблюдений лежит ниже медианы, и половина наблюдений лежит выше медианы.
Медиана определяется следующим образом:
Наблюдения упорядочиваются по возрастанию: Х1 < X2 < … < Xn.
Полученная последовательность Xi называется вариационным рядом, а ее элементы – порядковыми статистиками.
Если число наблюдений нечетно n = 2m + 1, то медиана оценивается как Xm : med = Xm.
Если число наблюдений четно n = 2m, то в качестве медианы берется (Xm + Xm+1)/2.
Предположим, мы исследовали образцы бензинов на содержание ароматических углеводородов и получили следующие значения: 29,1; 29,0; 29,7; 30,2; 28,5. Расположим эти значения по возрастанию: 28,5; 29,0; 29,1; 29,7; 30,2. Медиана этой выборки равна 29,1.
Квартили. Нижняя и верхняя квартили, от слова кварта – четверть (термин впервые использовал Ф. Гальтон в 1882 г.), равны соответственно 25-й и 75-й процентилям распределения.
25-я процентиль переменной – это значение, ниже которого располагаются 25% значений переменной.
Аналогично, 75-я процетиль равна значению, ниже которого расположено 75% значений переменной.
Нижняя квартиль, медиана, и верхняя квартиль – делят выборку на 4 равные части.
¼ наблюдений лежит между минимальным значением и нижней квартилью, ¼ – между нижней квартилью и медианой, ¼ – между медианой и верхней квартилью, ¼ – между верхней квартилью и максимальным значением выборки.
Квартильный размах. Квартильный размах переменных (термин был впервые использован Ф. Гальтоном в 1882 г.) равен разности значений 75-й процентили и 25-й процентили. Таким образом, это интервал, содержащий медиану, в который попадает 50% наблюдений.
Разность между максимальным и минимальным значениям называется размахом (англ. range).
Мода. Мода – это наиболее часто встречающееся значение переменной. Часто используется в социологических исследованиях.
Дескриптивные статистики очень важны, так как они позволяют в удобной компактной форме описать исходные данные, что очень удобно при их большом количестве.
N наблюдений (Объем наблюдений) – истинное число наблюдений переменных (число наблюдений без пропусков);
% годн. набл. – доля наблюдений, пригодных для проведения анализа;
Среднее – выборочное среднее;
Доверит. -95% – нижняя граница 95% доверительного интервала для среднего;
Доверит. 95% – верхняя граница 95% доверительного интервала для среднего;
Медиана – медиана всех значений;
Сумма – сумма значений переменных;
Минимум – минимальное значение;
Максим. – максимальное значение;
Размах – разность между максимальным и минимальным значениями;
Дисперсия – выборочная дисперсия;
Ст. откл. – стандартное отклонение;
Коэф.вар. – коэффициент вариации, отношение стандартного отклонения к среднему, показывает разброс данных в относительных единицах (или в %).
Станд. ошибки – стандартная ошибка среднего;
Асимметрия – выборочный коэффициент асимметрии;
Стд. ош. Асимметрия – стандартная ошибка коэффициента асимметрии;
Эксцесс – выборочный коэффициент эксцесса;
Стд. ош. Эксцесс – стандартная ошибка эксцесса.
ИСХОДНЫЕ ДАННЫЕ:
Вариант |
Импорт продукта №1 |
Импорт продукта №2 |
|||
Вариант 1 |
Пропан |
https://www.eia.gov/dnav/pet/hist/LeafHandler.ashx?n=PET&s=MPAIM_NUS-Z00_2&f=M |
Бутан |
https://www.eia.gov/dnav/pet/hist/LeafHandler.ashx?n=PET&s=MBUIM_NUS-Z00_2&f=M |
|
ПОЛУЧЕННЫЕ РЕЗУЛЬТАТЫ:
Переменная |
Описательные статистики (fuel.gaz) |
|||||
N набл. |
% годн. набл. |
Среднее |
Доверит. -95,000% |
Доверит. 95,000% |
Медиана |
|
Пропан_Импорт |
355 |
60,68376 |
128,8845 |
123,3392 |
134,4298 |
120,0000 |
Бутан_Импорт |
355 |
60,68376 |
25,2451 |
23,4591 |
27,0310 |
21,0000 |
Переменная |
Описательные статистики (fuel.gaz) |
|||||
Сумма |
Минимум |
Максим. |
Размах |
Дисперсия |
Ст.откл. |
|
Пропан_Импорт |
45754,00 |
29,00000 |
364,0000 |
335,0000 |
2822,317 |
53,12548 |
Бутан_Импорт |
8962,00 |
2,00000 |
98,0000 |
96,0000 |
292,751 |
17,10995 |
Переменная |
Описательные статистики (fuel.gaz) |
||||
Коэф.Вар. |
Станд. ошибки |
Асимметрия |
Стд.ош. Асимметрия |
Эксцесс |
|
Пропан_Импорт |
41,21945 |
2,819608 |
0,879860 |
0,129461 |
1,175543 |
Бутан_Импорт |
67,77542 |
0,908102 |
1,170766 |
0,129461 |
1,722023 |
Переменная |
Описательные статистики (fuel.gaz) |
Стд.ош. Эксцесс |
|
Пропан_Импорт |
0,258209 |
Бутан_Импорт |
0,258209 |
Таблица 1. Электронная таблица с описательными статистиками
Переменная
|
Итоговые результатыОписательные статистики (fuel.gaz) |
|
Год |
Среднее |
|
Пропан_Импорт |
1995 |
95,50000 |
Бутан_Импорт |
1995 |
15,75000 |
Пропан_Импорт |
1996 |
112,5833 |
Бутан_Импорт |
1996 |
18,5833 |
Пропан_Импорт |
1997 |
106,5833 |
Бутан_Импорт |
1997 |
24,0000 |
Пропан_Импорт |
1998 |
130,7500 |
Бутан_Импорт |
1998 |
23,5833 |
Пропан_Импорт |
1999 |
115,3333 |
Бутан_Импорт |
1999 |
15,3333 |
Пропан_Импорт |
2000 |
154,1667 |
Бутан_Импорт |
2000 |
19,0833 |
Пропан_Импорт |
2001 |
140,2500 |
Бутан_Импорт |
2001 |
41,8333 |
Пропан_Импорт |
2002 |
137,5833 |
Бутан_Импорт |
2002 |
24,0833 |
Пропан_Импорт |
2003 |
159,0833 |
Бутан_Импорт |
2003 |
33,8333 |
Пропан_Импорт |
2004 |
198,2500 |
Бутан_Импорт |
2004 |
30,3333 |
Пропан_Импорт |
2005 |
218,8333 |
Бутан_Импорт |
2005 |
55,8333 |
Пропан_Импорт |
2006 |
201,3333 |
Бутан_Импорт |
2006 |
60,0833 |
Пропан_Импорт |
2007 |
162,2500 |
Бутан_Импорт |
2007 |
33,8333 |
Пропан_Импорт |
2008 |
161,6667 |
Бутан_Импорт |
2008 |
36,5000 |
Пропан_Импорт |
2009 |
126,3333 |
Бутан_Импорт |
2009 |
21,0833 |
Пропан_Импорт |
2010 |
93,00000 |
Бутан_Импорт |
2010 |
12,25000 |
Пропан_Импорт |
2011 |
81,91667 |
Бутан_Импорт |
2011 |
7,91667 |
Пропан_Импорт |
2012 |
84,83333 |
Бутан_Импорт |
2012 |
8,91667 |
Пропан_Импорт |
2013 |
103,0833 |
Бутан_Импорт |
2013 |
6,0833 |
Пропан_Импорт |
2014 |
89,66667 |
Бутан_Импорт |
2014 |
6,50000 |
Пропан_Импорт |
2015 |
104,5000 |
Бутан_Импорт |
2015 |
6,5000 |
Пропан_Импорт |
2016 |
120,3333 |
Бутан_Импорт |
2016 |
11,1667 |
Пропан_Импорт |
2017 |
133,5000 |
Бутан_Импорт |
2017 |
15,1667 |
Пропан_Импорт |
2018 |
139,2500 |
Бутан_Импорт |
2018 |
23,1667 |
Пропан_Импорт |
2019 |
132,8333 |
Бутан_Импорт |
2019 |
40,0833 |
Пропан_Импорт |
2020 |
112,6667 |
Бутан_Импорт |
2020 |
24,6667 |
Пропан_Импорт |
2021 |
114,1667 |
Бутан_Импорт |
2021 |
36,3333 |
Пропан_Импорт |
2022 |
115,1667 |
Бутан_Импорт |
2022 |
36,7500 |
Пропан_Импорт |
2023 |
107,6667 |
Бутан_Импорт |
2023 |
35,9167 |
Пропан_Импорт |
2024 |
102,4286 |
Бутан_Импорт |
2024 |
37,1429 |
Таблица 2. Результаты расчета среднего импорта пропана и бутана по годам
Переменная
|
Итоговые результатыОписательные статистики (fuel.gaz) |
||
Месяц |
Минимум |
Максим. |
|
Пропан_Импорт |
январь |
103,0000 |
305,0000 |
Бутан_Импорт |
январь |
5,0000 |
48,0000 |
Пропан_Импорт |
февраль |
88,00000 |
310,0000 |
Бутан_Импорт |
февраль |
3,00000 |
64,0000 |
Пропан_Импорт |
март |
81,00000 |
211,0000 |
Бутан_Импорт |
март |
2,00000 |
45,0000 |
Пропан_Импорт |
апрель |
48,00000 |
201,0000 |
Бутан_Импорт |
апрель |
3,00000 |
70,0000 |
Пропан_Импорт |
май |
43,00000 |
160,0000 |
Бутан_Импорт |
май |
3,00000 |
71,0000 |
Пропан_Импорт |
июнь |
35,00000 |
197,0000 |
Бутан_Импорт |
июнь |
5,00000 |
93,0000 |
Пропан_Импорт |
июль |
29,00000 |
203,0000 |
Бутан_Импорт |
июль |
3,00000 |
66,0000 |
Пропан_Импорт |
август |
37,00000 |
247,0000 |
Бутан_Импорт |
август |
2,00000 |
77,0000 |
Пропан_Импорт |
сентябрь |
53,00000 |
296,0000 |
Бутан_Импорт |
сентябрь |
6,00000 |
98,0000 |
Пропан_Импорт |
октябрь |
73,00000 |
364,0000 |
Бутан_Импорт |
октябрь |
6,00000 |
76,0000 |
Пропан_Импорт |
ноябрь |
70,00000 |
287,0000 |
Бутан_Импорт |
ноябрь |
8,00000 |
48,0000 |
Пропан_Импорт |
декабрь |
101,0000 |
277,0000 |
Бутан_Импорт |
декабрь |
6,0000 |
45,0000 |
Пропан_Импорт |
|
|
|
Бутан_Импорт |
|
|
|
Таблица 3. Результаты расчета минимального и максимального импорта пропана и бутана по месяцам
Вывод: В ходе данной лабораторной работы привели полученные результаты: таблицу с результатом вычисления описательных статистик для пропана и бутана, а также интерпретацию результатов вычисления описательных статистик для каждого из двух продуктов.
