Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

лб3_СОЭ_Каширина

.docx
Скачиваний:
0
Добавлен:
20.06.2026
Размер:
41.92 Кб
Скачать

Министерство образования и науки Российской Федерации

федеральное государственное автономное образовательное учреждение

высшего образования

«НАЦИОНАЛЬНЫЙ ИССЛЕДОВАТЕЛЬСКИЙ

ТОМСКИЙ ПОЛИТЕХНИЧЕСКИЙ УНИВЕРСИТЕТ»

Инженерная школа природных ресурсов

Направление подготовки 18.03.01 Химическая технология

Отделение химической инженерии

ОТЧЕТ

по лабораторной работе № 3

ОПИСАТЕЛЬНЫЕ СТАТИСТИКИ

Студент

Группа

ФИО

Подпись

Дата

2Д22

Каширина Вероника

Руководитель

Должность

ФИО

Ученая степень, звание

Подпись

Дата

ассистент

Богданов И.А.

к.т.н.

Томск – 2024 г.

ЦЕЛЬ РАБОТЫ:

Вычислить описательные статистики для представленных статистических данных (1 вариант).

ТЕОРЕТИЧЕСКАЯ ЧАСТЬ:

Предположим, что вы исследуете содержание дибензотиофена в партии дизельного топлива хроматографическим методом. Каждый метод измерения имеет погрешность. Делая одно измерение, вы получаете значение, которое может отличаться от истинного значения (которое, как правило, неизвестно). Если сделать все возможные измерения (потратить на это всю исследуемую партию топлива), и для полученных значений рассчитать среднее, то оно совпадет с истинным значением. Результаты всех проведенных исследований образуют генеральную совокупность.

Генеральная совокупность – теоретически все возможные значения переменной (измерения исследуемого показателя).

Однако проводить такие исследования нецелесообразно – на это уйдет много времени, энергии и вся партия топлива. Поэтому проводится меньшее количество измерений, результаты которых называются выборкой. Выборка является частью генеральной совокупности. В статистике выборкой называют любой исследуемый набор значений.

Переменная (английский термин variable) – это то, что можно измерять, контролировать, или чем можно манипулировать в исследованиях.

Так как значения переменных не постоянны, нужно научиться описывать их изменчивость. Идея описательных (дескриптивных) статистик проста: вместо того чтобы рассматривать все значения переменной, а их может быть очень много (тысячи и миллионы), вначале стоит просмотреть описательные статистики. Они дают общее представление о значениях, которые принимает переменная.

Рассмотрим основные описательные статистики.

Выборочное среднее значение. Для генеральной совокупности среднее значение является истинным значением. Выборка является некоторой частью генеральной совокупности, поэтому для нее среднее значение называется выборочным средним значением. Из генеральной совокупности можно сделать несколько выборок, и каждая из них будет характеризоваться выборочным средним значением, которые могут быть различны.

Отметим, что среднее значение очень чувствительно к выбросам – аномально высоким или низким значениям, которые выделяются из всей выборки. При наличии таких значений, среднее может дать неправильное представление о центре выборки. Если выборка имеет несимметричное распределение, также не следует использовать среднее значение для характеристики центра выборки.

Выборочная дисперсия (аналогично выборочному среднему значению) (английское variance, термин введен впервые Р.Э. Фишером в 1918 г.) переменной величины Х вычисляется по формуле:

(1)

где n – количество измерений (объем выборки), – среднее значение.

Дисперсия является мерой разброса данных относительно среднего. Меняется от нуля до бесконечности. Крайнее значение 0 означает отсутствие изменчивости, когда переменная принимает одно и тоже значение.

Выборочное стандартное отклонение (standard deviation) равно корню квадратному из дисперсии:

(2)

Выборочная дисперсия и выборочное стандартное отклонение – наиболее часто используемые меры изменчивости переменной. Чем выше дисперсия или стандартное отклонение, тем сильнее разбросаны значения переменной относительно среднего. Стандартное отклонение – более удобная характеристика, так как измерена в тех же единицах, что исходная величина.

Коэффициент вариации – также является мерой разброса данных относительно среднего значения. Рассчитывается как отношение стандартного отклонения к среднему:

(3)

Коэффициент вариации используется для сравнения степени вариации двух или более выборок, что удобно при различии средних значений. Является безразмерной величиной, измеряется в относительных единицах, либо в процентах.

Среднее значение, дисперсия, стандартное отклонение и коэффициент вариации являются ключевыми описательными статистиками.

Медиана выборки (термин введен впервые Ф. Гальтоном, в 1882 г.) – значение, которое разбивает выборку на две равные части. Половина наблюдений лежит ниже медианы, и половина наблюдений лежит выше медианы.

Медиана определяется следующим образом:

Наблюдения упорядочиваются по возрастанию: Х1 < X2 < … < Xn.

Полученная последовательность Xi называется вариационным рядом, а ее элементы – порядковыми статистиками.

Если число наблюдений нечетно n = 2m + 1, то медиана оценивается как Xm : med = Xm.

Если число наблюдений четно n = 2m, то в качестве медианы берется (Xm + Xm+1)/2.

Предположим, мы исследовали образцы бензинов на содержание ароматических углеводородов и получили следующие значения: 29,1; 29,0; 29,7; 30,2; 28,5. Расположим эти значения по возрастанию: 28,5; 29,0; 29,1; 29,7; 30,2. Медиана этой выборки равна 29,1.

Квартили. Нижняя и верхняя квартили, от слова кварта – четверть (термин впервые использовал Ф. Гальтон в 1882 г.), равны соответственно 25-й и 75-й процентилям распределения.

25-я процентиль переменной – это значение, ниже которого располагаются 25% значений переменной.

Аналогично, 75-я процетиль равна значению, ниже которого расположено 75% значений переменной.

Нижняя квартиль, медиана, и верхняя квартиль – делят выборку на 4 равные части.

¼ наблюдений лежит между минимальным значением и нижней квартилью, ¼ – между нижней квартилью и медианой, ¼ – между медианой и верхней квартилью, ¼ – между верхней квартилью и максимальным значением выборки.

Квартильный размах. Квартильный размах переменных (термин был впервые использован Ф. Гальтоном в 1882 г.) равен разности значений 75-й процентили и 25-й процентили. Таким образом, это интервал, содержащий медиану, в который попадает 50% наблюдений.

Разность между максимальным и минимальным значениям называется размахом (англ. range).

Мода. Мода – это наиболее часто встречающееся значение переменной. Часто используется в социологических исследованиях.

Дескриптивные статистики очень важны, так как они позволяют в удобной компактной форме описать исходные данные, что очень удобно при их большом количестве.

N наблюдений (Объем наблюдений) – истинное число наблюдений переменных (число наблюдений без пропусков);

% годн. набл. – доля наблюдений, пригодных для проведения анализа;

Среднее – выборочное среднее;

Доверит. -95% – нижняя граница 95% доверительного интервала для среднего;

Доверит. 95% – верхняя граница 95% доверительного интервала для среднего;

Медиана – медиана всех значений;

Сумма – сумма значений переменных;

Минимум – минимальное значение;

Максим. – максимальное значение;

Размах – разность между максимальным и минимальным значениями;

Дисперсия – выборочная дисперсия;

Ст. откл. – стандартное отклонение;

Коэф.вар. – коэффициент вариации, отношение стандартного отклонения к среднему, показывает разброс данных в относительных единицах (или в %).

Станд. ошибки – стандартная ошибка среднего;

Асимметрия – выборочный коэффициент асимметрии;

Стд. ош. Асимметрия – стандартная ошибка коэффициента асимметрии;

Эксцесс – выборочный коэффициент эксцесса;

Стд. ош. Эксцесс – стандартная ошибка эксцесса.

ИСХОДНЫЕ ДАННЫЕ:

Вариант

Импорт продукта №1

Импорт продукта №2

Вариант 1

Пропан

https://www.eia.gov/dnav/pet/hist/LeafHandler.ashx?n=PET&s=MPAIM_NUS-Z00_2&f=M

Бутан

https://www.eia.gov/dnav/pet/hist/LeafHandler.ashx?n=PET&s=MBUIM_NUS-Z00_2&f=M

ПОЛУЧЕННЫЕ РЕЗУЛЬТАТЫ:

Переменная

Описательные статистики (fuel.gaz)

N набл.

% годн. набл.

Среднее

Доверит.

-95,000%

Доверит.

95,000%

Медиана

Пропан_Импорт

355

60,68376

128,8845

123,3392

134,4298

120,0000

Бутан_Импорт

355

60,68376

25,2451

23,4591

27,0310

21,0000

Переменная

Описательные статистики (fuel.gaz)

Сумма

Минимум

Максим.

Размах

Дисперсия

Ст.откл.

Пропан_Импорт

45754,00

29,00000

364,0000

335,0000

2822,317

53,12548

Бутан_Импорт

8962,00

2,00000

98,0000

96,0000

292,751

17,10995

Переменная

Описательные статистики (fuel.gaz)

Коэф.Вар.

Станд.

ошибки

Асимметрия

Стд.ош.

Асимметрия

Эксцесс

Пропан_Импорт

41,21945

2,819608

0,879860

0,129461

1,175543

Бутан_Импорт

67,77542

0,908102

1,170766

0,129461

1,722023

Переменная

Описательные статистики (fuel.gaz)

Стд.ош.

Эксцесс

Пропан_Импорт

0,258209

Бутан_Импорт

0,258209

Таблица 1. Электронная таблица с описательными статистиками

Переменная

Итоговые результатыОписательные статистики (fuel.gaz)

Год

Среднее

Пропан_Импорт

1995

95,50000

Бутан_Импорт

1995

15,75000

Пропан_Импорт

1996

112,5833

Бутан_Импорт

1996

18,5833

Пропан_Импорт

1997

106,5833

Бутан_Импорт

1997

24,0000

Пропан_Импорт

1998

130,7500

Бутан_Импорт

1998

23,5833

Пропан_Импорт

1999

115,3333

Бутан_Импорт

1999

15,3333

Пропан_Импорт

2000

154,1667

Бутан_Импорт

2000

19,0833

Пропан_Импорт

2001

140,2500

Бутан_Импорт

2001

41,8333

Пропан_Импорт

2002

137,5833

Бутан_Импорт

2002

24,0833

Пропан_Импорт

2003

159,0833

Бутан_Импорт

2003

33,8333

Пропан_Импорт

2004

198,2500

Бутан_Импорт

2004

30,3333

Пропан_Импорт

2005

218,8333

Бутан_Импорт

2005

55,8333

Пропан_Импорт

2006

201,3333

Бутан_Импорт

2006

60,0833

Пропан_Импорт

2007

162,2500

Бутан_Импорт

2007

33,8333

Пропан_Импорт

2008

161,6667

Бутан_Импорт

2008

36,5000

Пропан_Импорт

2009

126,3333

Бутан_Импорт

2009

21,0833

Пропан_Импорт

2010

93,00000

Бутан_Импорт

2010

12,25000

Пропан_Импорт

2011

81,91667

Бутан_Импорт

2011

7,91667

Пропан_Импорт

2012

84,83333

Бутан_Импорт

2012

8,91667

Пропан_Импорт

2013

103,0833

Бутан_Импорт

2013

6,0833

Пропан_Импорт

2014

89,66667

Бутан_Импорт

2014

6,50000

Пропан_Импорт

2015

104,5000

Бутан_Импорт

2015

6,5000

Пропан_Импорт

2016

120,3333

Бутан_Импорт

2016

11,1667

Пропан_Импорт

2017

133,5000

Бутан_Импорт

2017

15,1667

Пропан_Импорт

2018

139,2500

Бутан_Импорт

2018

23,1667

Пропан_Импорт

2019

132,8333

Бутан_Импорт

2019

40,0833

Пропан_Импорт

2020

112,6667

Бутан_Импорт

2020

24,6667

Пропан_Импорт

2021

114,1667

Бутан_Импорт

2021

36,3333

Пропан_Импорт

2022

115,1667

Бутан_Импорт

2022

36,7500

Пропан_Импорт

2023

107,6667

Бутан_Импорт

2023

35,9167

Пропан_Импорт

2024

102,4286

Бутан_Импорт

2024

37,1429

Таблица 2. Результаты расчета среднего импорта пропана и бутана по годам

Переменная

Итоговые результатыОписательные статистики (fuel.gaz)

Месяц

Минимум

Максим.

Пропан_Импорт

январь

103,0000

305,0000

Бутан_Импорт

январь

5,0000

48,0000

Пропан_Импорт

февраль

88,00000

310,0000

Бутан_Импорт

февраль

3,00000

64,0000

Пропан_Импорт

март

81,00000

211,0000

Бутан_Импорт

март

2,00000

45,0000

Пропан_Импорт

апрель

48,00000

201,0000

Бутан_Импорт

апрель

3,00000

70,0000

Пропан_Импорт

май

43,00000

160,0000

Бутан_Импорт

май

3,00000

71,0000

Пропан_Импорт

июнь

35,00000

197,0000

Бутан_Импорт

июнь

5,00000

93,0000

Пропан_Импорт

июль

29,00000

203,0000

Бутан_Импорт

июль

3,00000

66,0000

Пропан_Импорт

август

37,00000

247,0000

Бутан_Импорт

август

2,00000

77,0000

Пропан_Импорт

сентябрь

53,00000

296,0000

Бутан_Импорт

сентябрь

6,00000

98,0000

Пропан_Импорт

октябрь

73,00000

364,0000

Бутан_Импорт

октябрь

6,00000

76,0000

Пропан_Импорт

ноябрь

70,00000

287,0000

Бутан_Импорт

ноябрь

8,00000

48,0000

Пропан_Импорт

декабрь

101,0000

277,0000

Бутан_Импорт

декабрь

6,0000

45,0000

Пропан_Импорт

Бутан_Импорт

Таблица 3. Результаты расчета минимального и максимального импорта пропана и бутана по месяцам

Вывод: В ходе данной лабораторной работы привели полученные результаты: таблицу с результатом вычисления описательных статистик для пропана и бутана, а также интерпретацию результатов вычисления описательных статистик для каждого из двух продуктов.