Статистика КУРСАЧ отредактированный
.docxМинистерство образования и науки Российской Федерации
Казанский государственный архитектурно-строительный университет
Кафедра ЭПС
Курсовая работа
По дисциплине: Статистика.
Выполнила:
студентка гр.2 ПМ 21з
Экономического факультета
Бурганова Э.Д.
Проверила:
Харисова Гузель Мансуровна
Казань 2014
Тема 1. Средние величины и показатели вариации
По имеющимся в следующей таблице данным по группе из 20 студентов заочного отделения необходимо:
1) построить интервальный ряд распределения признака и его график;
2) рассчитать модальное, медианное и среднее значение, установить его типичность с помощью коэффициентов вариации;
№ п/п |
|
2 |
|
Соотношение Рост/вес. |
|
1 |
3,533 |
2 |
2,623 |
3 |
2,875 |
4 |
3,375 |
5 |
3,000 |
6 |
2,828 |
7 |
3,255 |
8 |
2,726 |
9 |
2,429 |
10 |
2,361 |
11 |
2,342 |
12 |
2,672 |
13 |
2,356 |
14 |
2,559 |
15 |
2,173 |
16 |
2,095 |
17 |
2,342 |
18 |
2,011 |
19 |
2,619 |
20 |
2,021 |
Решение. Для построения интервального ряда из дискретного используется формула Стерджесса, с помощью которой определяется оптимальное количество интервалов (n):
n = 1 +3,322 lg N, (1)
где N – число величин в дискретном ряде.
В нашей задаче n = 1 + 3,322lg20 = 1 + 3,322*1,3= 5,32. Так как число интервалов не может быть дробным, то округлим его до ближайшего целого числа, т.е. до 5.
После определения оптимального количества интервалов определяем размах интервала по формуле:
h = H / n, (2)
где H – размах вариации, определяемый по формуле (3).
H = Хмах –Хmin, (3)
где Xмax и Xmin — максимальное и минимальное значения в совокупности.
В нашей задаче h = (3,533-2,011)/5 =1,522/5=0,304
Интервальная группировка данных приведена в первом столбце таблицы 1, которая содержит также алгоритм и промежуточные расчеты.
Таблица 1. Вспомогательные расчеты для решения задачи
Xi, |
fi |
Xi |
Xi*fi |
Xi-X |
(Xi-X)fi |
(Xi-X)2 |
(Xi-X)2fi |
(Xi-X)3fi |
(Xi-X)4fi |
до 2,315 |
4 |
2,163 |
8,652 |
- 0,502 |
-2,008 |
0,252 |
1,008 |
-0,506 |
0,254 |
2,315-2,619 |
6 |
2,467 |
14,802 |
-0,198 |
-1,188 |
0,039 |
0,234 |
-0,046 |
0,009 |
2,619-2,923 |
6 |
2,771 |
16,626 |
0,106 |
0,636 |
0,011 |
0,066 |
0,007 |
0,001 |
2,923-3,227 |
1 |
3,075 |
3,075 |
0,41 |
0,41 |
0,168 |
0,168 |
0,069 |
0,028 |
3,227 и более |
3 |
3,379 |
10,137 |
0,714 |
2,142 |
0,510 |
1,53 |
1,092 |
0,780 |
Итого |
20 |
- |
53,292 |
- |
39,2 |
- |
3,006 |
0,616 |
1,072 |
Мода () – это наиболее часто повторяющееся значение признака. Для интервального ряда с равными интервалами величина моды определяется по формуле (4):
Формула для вычисления:
, (4)
где – нижняя граница модального интервала; – величина модального интервала; – частоты в модальном, предыдущем и следующем за модальным интервалом соответственно.
Модальный интервал определяется по наибольшей частоте.
Используя формулу (4), определяем точное значение модального возраста:
Мо=2,315+0,304 * = 2,6
Медиана – варианта, которая находится в середине вариационного ряда.
Делит ряд на две равные (по числу единиц) части – со значениями признака меньше медианы и со значением признака больше медианы.
Вычисляется медиана по формуле:
(5)
где – нижняя граница медианного интервала;
– медианный интервал;
– половина от общего числа наблюдений;
– сумма наблюдений, накопленная до начала медианного интервала;
fMe – число наблюдений или объем взвешивающего признака в медианном интервале.
Используя формулу, определяем точное значение медианного возраста:
Ме 2,315+0,304* (10-4)/6 = 2,6
Средняя величина – это обобщающий показатель совокупности, характеризующий уровень изучаемого явления или процесса. Средние величины могут быть простыми и взвешенными. Простая средняя рассчитывается при наличии двух и более статистических величин, расположенных в произвольном (несгруппированном) порядке, по общей формуле (5). Взвешенная средняя величина рассчитывается по сгруппированным статистическим величинам с использованием общей формулы (6).
=; (5) =. (6)
При этом обозначено: Xi – значения отдельных статистических величин или середин группировочных интервалов; m - показатель степени, от значения которого зависят виды средних величин. Используя формулы (5) и (6) при разных показателях степени m, получаем частные формулы каждого вида (см. таблицу 2).
Таблица 2. Виды степенных средних и их применение
m |
Название средней |
Формула расчета средней |
Когда применяется |
|
простая |
взвешенная |
|||
1 |
Арифметическая |
= (7) |
= (8) |
Чаще всего, кроме тех случаев, когда должны применяться другие виды средних |
–1 |
Гармоническая |
ГМ = (9) |
ГМ = (10) |
Для осреднения величин с дробной размерностью при наличии дополнительных данных по числителю дробной размерности |
0 |
Геометрическая |
(11) |
(12) |
Для осреднения цепных индексов динамики |
2 |
Квадратическая |
= (13) |
= (14) |
Для осреднения вариации признака (расчет средних отклонений) |
3 |
Кубическая |
= (15) |
= (16) |
Для расчета индексов нищеты населения |
1 |
Хронологическая |
(17) |
(18) |
Для осреднения моментных статистических величин |
Выбор вида формулы средней величины зависит от содержания осредняемого признака и конкретных данных, по которым ее приходится вычислять. Показатель степени m в общей формуле средней величины оказывает существенное влияние на значение средней величины: по мере увеличения степени возрастает и средняя величина (правило мажорантности средних величин), то есть < < < < . Так, если , то , а если , то .
В нашей задаче, применяя формулу (8) и подставляя вместо середины интервалов веса ХИ, определяем среднее соотношение роста к весу студентов: = 53,292/20 = 2,665. Теперь осталось определить типичность или нетипичность найденной средней величины. Это осуществляется с помощью расчета показателей вариации. Чем ближе они к нулю, тем типичнее найденная средняя величина для изучаемой статистической совокупности. При этом критериальным значением коэффициента вариации служит 1/3.
Коэффициенты вариации рассчитываются как отношение среднего отклонения к средней величине. Поскольку среднее отклонение может определяться линейным и квадратическим способами, то соответствующими могут быть и коэффициенты вариации.
Среднее линейное отклонение определяется по формулам (19) и . (20):
– простое; (19) – взвешенное. (20)
Среднее квадратическое отклонение определяется как корень квадратный из дисперсии, то есть по формуле (21):
. (21)
Дисперсия определяется по формулам простая;(22) или взвешенная.(23):
– простая;(22) – взвешенная.(23)
В нашей задаче, применяя формулу, определим ее числитель и внесем в расчетную таблицу. В итоге получим среднее линейное отклонение: Л = 0,008/20 = 0,0004 (шт). Разделив это значение на средний возраст, получим линейный коэффициент вариации: =0,0004/2,665=0,00015 По значению этого коэффициента для рассмотренной группы студентов делаем вывод о типичности среднего возраста, т.к. расчетное значение коэффициента вариации не превышает критериального (0,160 < 0,333).
Применяя формулу взвешенная.(23), получим в итоге дисперсию: Д = 3,006/20 = 0,150. Извлечем из этого числа корень и получим в результате среднее квадратическое отклонение: = =0,388. Разделив это значение на средний возраст, получим квадратический коэффициент вариации:
= 0,388/2,665 = 0,146. По значению этого коэффициента для рассмотренной группы студентов можно сделать вывод о типичности среднего соотношения веса к росту, т.к. расчетное значение коэффициента вариации не превышает критериального (0,146 < 0,333).
Т.к. V=0,146<1/3 (0,146 < 0,333), то делаем вывод о типичности среднего соотношения веса к росту.
В качестве показателей асимметрии используются: коэффициент асимметрии – нормированный момент третьего порядка:
= = 0,616/20 = 0,031
=0,0313=0,058
= 0,031/0,058 = 0,534>0 (коэффициент асимметрии)
Значит соотношение с правосторонней асимметрией.
Для характеристики крутизны (заостренности) распределения используется центральный момент 4-го порядка:
=
Для образования безразмерной характеристики определяется нормированный момент 4-го порядка, который и характеризует крутизну (заостренность) графика распределения. При измерении асимметрии эталоном служит нормальное (симметричное) распределение. Поэтому для оценки крутизны данного распределения в сравнении с нормальным, вычисляется эксцесс распределения:
= 1,072 / 0,3884 – 3= 44,301
Ex>0, распределение - высоковершинное.
Тема 2. Ряды динамики.
Задача 1. Валовый сбор яиц за период 2000-2005 гг. характеризуется следующим рядом динамики (таблица 3):
Таблица 3. Валовый сбор яиц за период 2000-2005гг.
Год |
2000 |
2001 |
2002 |
2003 |
2004 |
2005 |
Валовый сбор яиц, млн.т. |
34,1 |
35,2 |
36,3 |
36,5 |
35,8 |
36,8 |
Вычислить: абсолютные, относительные, средние изменения и их темпы базисным и цепным способами. Проверить ряд на наличие в нем линейного тренда, на основе которого рассчитать интервальный прогноз на 2006 год с вероятностью 95%.
Решение. Любое изменение уровней ряда динамики определяется базисным (сравнение с первым уровнем) и цепным (сравнение с предыдущим уровнем) способами. Оно может быть абсолютным (разность уровней ряда) и относительным (соотношение уровней).
Базисное абсолютное изменение представляет собой разность конкретного и первого уровней ряда (1), а цепное абсолютное изменение представляет собой разность конкретного и предыдущего уровней ряда (2).
(1) (2)
По знаку абсолютного изменения делается вывод о характере развития явления: при > 0 — рост, при < 0 — спад, при = 0 — стабильность.
В нашей задаче эти изменения определены в 3-м и 4-м столбцах таблицы 3. Для проверки правильности расчетов применяется правило, согласно которому сумма цепных абсолютных изменений равняется последнему базисному. В нашей задаче это правило выполняется: =35,8 и =35,8
Базисное относительное изменение представляет собой соотношение конкретного и первого уровней ряда (3), а цепное относительное изменение представляет собой соотношение конкретного и предыдущего уровней ряда (4) .
(3) (4)
Относительные изменения уровней — это по существу индексы динамики, критериальным значением которых служит 1. Если они больше ее, имеет место рост явления, меньше ее — спад, а при равенстве единице наблюдается стабильность явления.
3. Вычитая единицу из относительных изменений, получают темп изменения уровней, критериальным значением которого служит 0. При положительном темпе изменения имеет место рост явления, при отрицательном — спад, а при нулевом темпе изменения наблюдается стабильность явления. В нашей задаче темпы изменения определены в 7-м и 9-м столбцах таблицы 3, а в 8-м и 10-м сделан вывод о характере развития изучаемого явления. Для проверки правильности расчетов применяется правило, согласно которому произведение цепных относительных изменений равняется последнему базисному. В нашей задаче это правило выполняется: =1,1 и =1,1.
Таблица 3. Вспомогательные расчеты для решения задачи.
Обобщенной характеристикой ряда динамики является средний уровень ряда . Способ расчета зависит от того, моментный ряд или интервальный (см. рис.3):
.
Рис.3. Методы расчета среднего уровня ряда динамики
В нашей задаче ряд динамики интервальный, значит, применяем формулу средней арифметической простой: = 214,7 / 6 = 35,7 (млрд.шт.). То есть за период 2000-2005, в среднем за год произведено яиц 35,7 млрд. шт.
Кроме среднего уровня в рядах динамики рассчитываются и другие средние показатели – среднее изменение уровней ряда (базисным и цепным способами), средний темп изменения.
Базисное среднее абсолютное изменение – это частное от деления последнего базисного абсолютного изменения на количество изменений уровней ((5). Цепное среднее абсолютное изменение уровней ряда – это частное от деления суммы всех цепных абсолютных изменений на количество изменений ( (6).
Б =(5) Ц = (6)
По знаку средних абсолютных изменений также судят о характере изменения явления в среднем: рост, спад или стабильность. Из правила контроля базисных и цепных абсолютных изменений следует, что базисное и цепное среднее изменение должны быть равными. В нашей задаче
= 2,7/5=0,54, то есть ежегодно в среднем величина валового сбора яиц увеличивается на 0,54 млрд. шт.
Наряду со средним абсолютным изменением рассчитывается и среднее относительное. Базисное среднее относительное изменение определяется по формуле (7), а цепное среднее относительное изменение – по формуле (8).
Б== (7) Ц= (8)
Естественно, базисное и цепное среднее относительное изменения должны быть одинаковыми и сравнением их с критериальным значением 1 делается вывод о характере изменения явления в среднем: рост, спад или стабильность. В нашей задаче = то есть ежегодно в среднем величина валового сбора яиц увеличивается в 1,015раза.
Вычитанием 1 из среднего относительного изменения образуется соответствующий средний темп изменения, по знаку которого также можно судить о характере изменения изучаемого явления, отраженного данным рядом динамики. В нашей задаче = 1,015 – 1 = 0,015, то есть ежегодно в величина валового сбора яиц растет на 1,5%.
Проверка ряда динамики на наличие в нем тренда (тенденции развития ряда) возможна несколькими способами, но наиболее простым является графическая модель, где на графике по оси абсцисс откладывается время, а по оси ординат – уровни ряда. Соединив полученные точки линиями, в большинстве случаев можно выявить тренд визуально. Тренд может представлять собой прямую линию, параболу, гиперболу и т.п. В итоге приходим к трендовой модели вида (9):
(9)
где – математическая функция развития; – случайное или циклическое отклонение от функции; t – время в виде номера периода (уровня ряда). Цель такого метода – выбор теоретической зависимости в качестве одной из
функций:
– прямая линия; (10) – гипербола; (11)
– парабола;(12) – степенная;(13)
– ряд Фурье.(14)
Для выявления тренда (тенденции развития ряда) в нашей задаче построим график Y(t) (рис.4):
Рис.4. График динамики производства яиц.
Из данного графика видно, что есть все основания принять уравнение тренда в виде линейной функции.
Определение параметров в этих функциях может вестись несколькими способами, но самые незначительные отклонения аналитических (теоретических) уровней дает метод наименьших квадратов – МНК. При этом методе учитываются все эмпирические уровни и должна обеспечиваться минимальная сумма квадратов отклонений эмпирических значений уровней от теоретических уровней (15):
(15)
В нашей задаче при выравнивании по прямой вида параметры и отыскиваются по МНК следующим образом. В формуле вместо записываем его конкретное выражение . Тогда Дальнейшее решение сводится к задаче на экстремум, т.е. к определению того, при каком значении и функция двух переменных S может достигнуть минимума. Как известно, для этого надо найти частные производные S по и , приравнять их к нулю и после элементарных преобразований решить систему двух уравнений с двумя неизвестными.