Артамонов статистика(конец)
.pdfОкончание табл. 9.3
Пред- |
Затраты на |
Кол-вопродан- |
Знак |
Знак |
Совпадение |
при- |
рекламу ( x1 ), |
ныхтелевизоров |
или несовпаде- |
||
ятие |
тыс. усл. ед. |
( y ), тыс. шт. |
x1i − x1 |
yi − y |
ние знака |
|
|
||||
16 |
|
|
|
|
|
17 |
|
|
|
|
|
18 |
|
|
|
|
|
19 |
|
|
|
|
|
20 |
|
|
|
|
|
Тогда
Кф =
Вычислите коэффициент парной корреляции
rx1, y =
Упражнение 9.3. Найдите коэффициенты линейного уравнения регрессии для затрат на рекламу и объемов продаж телевизоров. Определите коэффициент эластичности и сделайте вывод о связи затрат на рекламу с объемом продаж телевизоров.
Вычислите
b= x 2y−−(x)2y = x x
a = y −b x =
Запишите уравнение регрессии y = b · x+a =
Найдите коэффициент эластичности
Kэласт =
Запишите уравнение регрессии y = a0 +a1x =
Упражнение 9.4. По данным 10 предприятий (гр. 1, 2 табл. 9.4) с помощью коэффициентов корреляции рангов Спирмэна (ρ) и Кен-
дэлла ( τ) измерить тесноту зависимости между объемом выпуска продукции (у), млн р. и стоимостью основных производственных фондов (х), млн р.
163
|
|
|
|
|
|
|
|
Таблица 9.4 |
|
|
Расчет показателей ранговой корреляции |
|
|
|
|||||
|
|
|
|
|
|
|
|
||
х |
у |
N x |
N y |
d =Nx −Ny |
d 2 |
Подсчет баллов |
|||
|
+ |
|
– |
||||||
1 |
2 |
3 |
4 |
5 |
6 |
|
7 |
|
8 |
1,5 |
№ : 10 |
|
|
|
|
|
|
|
|
1,8 |
4,4 |
|
|
|
|
|
|
|
|
2,0 |
3,8 |
|
|
|
|
|
|
|
|
2,2 |
3,5 |
|
|
|
|
|
|
|
|
2,3 |
4,8 |
|
|
|
|
|
|
|
|
2,6 |
4,3 |
|
|
|
|
|
|
|
|
3,0 |
7,0 |
|
|
|
|
|
|
|
|
3,1 |
6,5 |
|
|
|
|
|
|
|
|
3,5 |
6,1 |
|
|
|
|
|
|
|
|
3,8 |
8,2 |
|
|
|
|
|
|
|
|
|
|
|
|
|
∑d 2 = |
P = |
|
|
Q = |
1. Для расчета коэффициента корреляции рангов Спирмэна (ρ)
вначале ранжируйте значения признаков в каждом ряду, т.е. каждому значению х и у в порядке их возрастания присвойте порядковый номер (ранг) N x и N y (гр. 3, 4 табл. 9.4), затем найдите разности рангов
(d), возведите их в квадрат (гр. 6) и суммируйте. Полученную сумму ∑d 2 подставьте в формулу
|
ρ =1 − |
6∑d 2 |
= |
|
|||
|
n(n2 −1) |
|
|||||
|
|
|
|
|
|
||
|
Судя по значению полученного коэффициента, связь между х и |
||||||
у ______________ ________________________. |
|
||||||
|
2. Для |
расчета коэффициента корреляции рангов |
Кендэлла |
||||
τ = |
2S |
|
определите S как сумму положительных (Р) |
и отрица- |
|||
n(n −1) |
|||||||
|
|
|
|
|
тельных (Q) баллов.
Вспомогательные расчеты этих баллов поместите в гр. 7, 8. Так как значения рангов x идут строго в возрастающем порядке, то следите лишь за поведением рангов у. Например, после первой пары значений рангов, где N y = 3, в семи случаях идут значения N y > 3, а в
двух случаях – значения N y < 3 ( N y = 2; 1); после второй пары, где N y = 5, наблюдается пять случаев рангов выше рассматриваемого, а три ( N y = 2; 1; 4) ниже и т. д.
164
По результатам подсчетов находите общую сумму баллов:
S = Р + Q =
Подставляя ее в формулу коэффициента корреляции рангов Кендэлла (τ), определите
τ=n(n2S−1) =
Сделайте вывод.
Коэффициент Кендэлла всегда ______________ по значению, чем коэффициент Спирмэна.
Упражнение 9.5. Пусть имеются данные по 10 предприятиям
(табл. 9.5).
Найдите коэффициент конкордации.
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Таблица 9.5 |
|
|
|
|
|
|
Расчет коэффициента конкордации |
|
|
|
||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||
|
При- |
|
|
Стои- |
|
|
Затраты |
Ранжирование |
Сумма |
Квадраты |
||||||||||||
Пред- |
быль |
|
|
|
|
факторов |
рангов |
суммы рангов |
||||||||||||||
|
|
мость |
|
|
на 100 р. |
|||||||||||||||||
прия- |
(y), |
|
|
|
|
|
|
|
|
|
|
3 |
|
3 |
2 |
|||||||
|
|
|
|
|
|
|
|
|
|
|||||||||||||
|
|
ОПФ(x), |
|
|
|
продук- |
Rx |
|
R |
|
|
Rz |
||||||||||
тие |
млн р. |
|
|
млнр. |
|
|
|
|
ции (z) |
|
y |
|
∑Rj |
∑R j |
||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
1 |
|
1 |
|
|||||
1 |
200 |
|
|
№ : 10 |
|
|
|
80 |
|
|
|
|
|
|
|
|
|
|
|
|||
2 |
250 |
|
|
4,2 |
|
|
|
67 |
|
|
|
|
|
|
|
|
|
|
|
|||
3 |
300 |
|
|
4,6 |
|
|
|
89 |
|
|
|
|
|
|
|
|
|
|
|
|||
4 |
360 |
|
|
5,3 |
|
|
|
23 |
|
|
|
|
|
|
|
|
|
|
|
|||
5 |
400 |
|
|
3,7 |
|
|
|
45 |
|
|
|
|
|
|
|
|
|
|
|
|||
6 |
480 |
|
|
3,8 |
|
|
|
78 |
|
|
|
|
|
|
|
|
|
|
|
|||
7 |
490 |
|
|
3,9 |
|
|
|
90 |
|
|
|
|
|
|
|
|
|
|
|
|||
8 |
500 |
|
|
5,8 |
|
|
|
43 |
|
|
|
|
|
|
|
|
|
|
|
|||
9 |
600 |
|
|
6,5 |
|
|
|
23 |
|
|
|
|
|
|
|
|
|
|
|
|||
10 |
700 |
|
|
4,4 |
|
|
|
45 |
|
|
|
|
|
|
|
|
|
|
|
|||
Итого |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Для решения задачи заполните табл. 9.5. |
|
|
|
|
||||||||||||||||||
Проведите расчет коэффициента по данным табл. 9.5. |
|
|||||||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
10 |
3 |
|
|
2 |
|
|
|
|
|
||
|
10 |
|
3 |
|
2 |
|
|
∑ ∑ |
R j |
|
|
|
|
|
|
|||||||
|
|
|
|
1 |
1 |
|
|
|
|
|
|
|
|
|||||||||
S = ∑ |
|
∑ R j |
|
|
|
− |
|
|
= |
|
|
|
|
|||||||||
|
|
10 |
|
|
|
|
|
|
|
|||||||||||||
|
1 |
|
1 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||
W = |
|
|
|
12 S |
|
|
|
|
= |
|
|
|
|
|
|
|
|
|
|
|
||
m 2 ( n 3 − n ) |
|
|
|
|
|
|
|
|
|
|
|
165
ГЛОССАРИЙ
Абсолютный прирост – разность между двумя уровнями ряда динамики. Имеет ту же размерность, что и уровни самого ряда динамики; может быть цепным и базисным, в зависимости от способа выбора базы для сравнения.
Абсолютный статистический показатель – показатель, выра-
жающий размер конкретного явления (стоимость, вес, объем, площадь и т.д.) в именованных числах (тыс. р., кг, м3, м2 и т. д.).
Аналитическая группировка – группировка, которая приме-
няется для исследования взаимосвязи между явлениями, с помощью которой определяют факторные и результативные признаки изучаемых явлений.
Анкетный способ – сбор данных, основанный на добровольном заполнении адресатами анкет.
Асимметрия или коэффициент асимметрии (термин был впервые введен Пирсоном в 1895 г.) – мера несимметричности распределения.
Атрибутивный признак – признак, не имеющий количественной меры, например: пол (мужской, женский), отрасль народного хозяйства, вид продукции, профессия рабочего и т.д.
Бимодальное распределение – статистическое распределение, имеющее две моды, т.е. два «пика».
Варианта – значение признака для различных наблюдаемых единиц совокупности.
Вариация – многообразие, изменяемость величины признака у отдельных единиц совокупности наблюдения.
Внутриклассовый коэффициент корреляции – мера однород-
ности наблюдений внутри классов случайного фактора относительно изменчивости наблюдений между классами.
Временной ряд – измерения значений признака наблюдаемого явления в последовательные моменты времени.
Выборка бесповторная – выборка, при которой отобранный объект не возвращается в генеральную совокупность.
Выборка повторная – выборка, при которой отобранный объект возвращается в генеральную совокупность.
166
Выборочное наблюдение – наблюдение, при котором характеристика всей совокупности фактов дается по некоторой их части, отобранной в случайном порядке.
Гауссовское распределение – нормальное распределение.
Генеральная совокупность – статистическая совокупность явлений, процессов или объектов, подлежащих изучению.
Гистограмма – примыкающие к друг другу прямоугольники, изображенные на координатной сетке.
Графический образ – символические знаки, с помощью которых изображаются статистические данные (линии, точки, прямоугольники, квадраты, круги и т. д.).
Группировка – процесс образования групп единиц совокупности, однородных в каком-либо отношении, а также имеющих одинаковые или близкие значения группировочного признака.
Двумерное нормальное распределение – совместное распре-
деление двух нормально распределенных случайных величин. Децильи – значения признака, которые делят вариационный ряд
на десять равных частей.
Децильный коэффициент – отношение девятой децили к первой.
Диаграмма – чертеж, на котором статистическая информация изображается посредством геометрических фигур или символических знаков.
Диаграмма динамики – диаграмма, которая показывает изменение явления во времени.
Диаграмма связи – диаграмма, которая показывает функциональную зависимость одного признака от другого (обычный график на координатной сетке).
Диаграмма сравнения – диаграмма, которая показывает соотношение признаков статистической совокупности.
Дискретный ряд распределения – ряд, в котором варианты выражены целыми числами.
Дисперсионный анализ – анализ с целью проверки значимости различия между средними с помощью сравнения дисперсий.
Дисперсия – средняя арифметическая квадратов отклонений каждого значения признака от общей средней.
167
Добавление наблюдений и/или переменных – действие, в ре-
зультате которого в конец набора данных добавляются соответственно новые наблюдения (строки) и/или переменные (столбцы).
Добыча данных – совокупность методов аналитической обработки больших массивов данных (часто связанных с деловой активностью или рыночными показателями) с целью выявления в них значимых закономерностей и/или систематических связей между переменными.
Доверительный интервал – интервал для некоторой статистики (например, среднего значения или линии регрессии), показывающий диапазон вокруг значения статистики, в котором находится истинное значение этой статистики (с определенным уровнем надежности или доверия).
Доверительный интервал для среднего – область вокруг сред-
него, в которой с заданным уровнем доверия содержится «истинное» среднее популяции.
Доверительный предел – то же самое, что и доверительный интервал.
Единовременное (разовое) наблюдение – наблюдение за объ-
ектом по мере надобности, время от времени, без соблюдения строгой периодичности; может проводиться единожды.
Единый государственный реестр предприятий и организа-
ций (ЕГРПО) – реестр, состоящий из четырех разделов: идентификационного, классификационного, справочного и экономического; характеризующий различные признаки предприятий и организаций.
Заголовок графика – выражение в краткой и четкой форме, поясняющее основное содержание изображаемых данных.
Индекс – частное от деления значения признака в текущих условиях на значения признака в других условиях.
Индивидуальный индекс – индекс, характеризующий изменения отдельных единиц статистической совокупности без учета ее структуры.
Интервальный ряд динамики – ряд динамики, который ото-
бражает итоги функционирования явления в течение определенного интервала времени.
168
Интервальный ряд распределения – ряд, в котором значения признака заданы в виде интервала. Например, распределение рабочих по разрядам можно представить в виде интервального ряда.
Квартили (термин впервые использован Гальтоном в 1882 г.) – значения признака, делящие вариационный ряд на четыре равные части.
Квартильный размах (термин был впервые использован Гальтоном в 1882 г.) – размах переменных, равный разности значений третьей и первой квартили.
Классификация – отнесение наблюдения к одному из нескольких, заранее известных классов (представленных значениями номинальной выходной переменной).
Кластерный анализ (термин впервые ввел Трион в 1939 г.) – набор различных алгоритмов классификации в группы схожих объектов.
Количественный признак – признак, имеющий количественное выражение у отдельных единиц совокупности (например: заработная плата рабочих, стоимость продукции промышленных предприятий, возраст людей, урожайность отдельных участков посевной площади и т. д.).
Комбинационная таблица – таблица, в которой подлежащее содержит группировку единиц совокупности по двум или более признакам, взятым в сочетании.
Корреляционная связь – статистическая связь, характерная тем, что одним и тем же значениям факторного признака может соответствовать сколь угодно различных значений результативного признака.
Корреляционно-регрессионный анализ – нахождение уравне-
ния связи, в котором результативный признак зависит только от интересующих нас факторов.
Корреляция (термин впервые ввел Гальтон в 1888 г.) – мера связи между двумя переменными. Коэффициент корреляции может изменяться от –1,00 до +1,00. Число –1,00 означает полностью отрицательную корреляцию, +1,00 – полностью положительную, 0,00 – отсутствие корреляции.
Корреляция Пирсона – линейная корреляция, которая измеряет степень линейных связей между переменными.
169
Корреспондентский способ – способ наблюдения, который заключается в том, что сведения в органы, ведущие наблюдение, сообщают их корреспонденты.
Косинус-сглаживание – рекомендуемое преобразование ряда, предшествующее спектральному анализу.
Коэффициент вариации – процентное отношение среднего квадратического отклонения к среднему значению признака.
Коэффициент детерминации – квадрат коэффициента корреляции Пирсона между двумя переменными. Он выражает количество дисперсии, общей между двумя переменными.
Коэффициент несогласия – оценка логистической регрессии, вычисляемая на основании таблицы 2 × 2, в ячейках которой показано количество наблюдаемых и предсказанных значений для бинарных зависимых переменных.
Коэффициент осцилляции – оценка относительной колеблемости крайних значений признака вокруг средней.
Коэффициент роста – относительный показатель, получающийся в результате деления двух уровней одного ряда друг на друга. Коэффициенты роста могут рассчитываться как цепные, когда каждый уровень ряда сопоставляется с предшествующим ему, и как базисные, когда каждый уровень ряда сопоставляется с базисным уровнем ряда.
Критерий согласия – мера расхождения между теоретическими и эмпирическими частотами, которая позволяет установить, является ли это расхождение случайным, т.е. несущественным, или неслучайным. Критерий согласия позволяет отвергнуть или подтвердить правильность гипотезы о виде кривой распределения.
Кумулята – график накопленных частот.
Линия n-точечного скользящего среднего – линия, каждая точка на которой представляет среднее соответствующей выборки из (n – 1) числа предыдущих выборок.
Логический контроль – контроль, который заключается в проверке ответов на вопросы программы наблюдения путем их логического осмысления или путем сравнения полученных данных с другими источниками по этому же вопросу.
Макет статистической таблицы – таблица, состоящая из строк и граф, которые еще не заполнены цифрами.
170
Малая выборка – несплошное статистическое обследование, при котором выборочная совокупность образуется из сравнительно небольшого числа единиц генеральной совокупности. Объем малой выборки обычно не превышает 30 единиц, может доходить до 4–5 единиц.
Масштаб графика – мера перевода численной величины в графическую (например, 1 см соответствует 100 тыс. р.). При этом чем длиннее отрезок линии, принятой за числовую единицу, тем крупнее масштаб.
Масштабная шкала – линия, отдельные точки которой читаются как определенные числа. Шкала, по которой отсчитываются уровни изучаемых показателей, как правило, начинается с 0.
Масштабный ориентир – показатель статистического графика, который придает графическому образу количественную значимость с помощью системы масштабных шкал.
Медиана выборки (термин впервые введен Гальтоном в 1882 г.) – значение, которое разбивает выборку на две равные части. Одна половина наблюдений лежит ниже медианы, другая половина – выше ее.
Метод максимума правдоподобия (термин впервые использо-
ван в работе Фишера в 1922 г.) – общий метод оценивания параметров генеральной совокупности с помощью максимизации функции правдоподобия (L) выборки.
Метод наименьших квадратов – оценивание по методу, кото-
рый заключается в минимизации суммы квадратов отклонений наблюдаемых значений зависимой переменной от значений, предсказанных моделью.
Механическая выборка – отбор единиц в выборочную совокупность производится из генеральной совокупности, разбитой на равные интервалы (группы). При этом размер интервала в генеральной совокупности равен обратной величине доли выборки.
Множественная регрессия – анализ связи между несколькими независимыми переменными (называемыми также регрессорами или предикторами) и зависимой переменной (откликом).
Множественный коэффициент корреляции R – положитель-
ный квадратный корень из R-квадрата (множественного коэффициента детерминации). Принимает значения от 0 до 1.
Мода – величина признака (варианта), наиболее часто встречающаяся в изучаемой совокупности.
171
Моментный ряд – ряд динамики, который отображает состояние изучаемого явления на определенную дату (момент) времени.
Накопленная частота – число единиц совокупности, у которых значение признака не больше данного. Накопленная частота для данного варианта или верхней границы данного интервала получается суммированием частот всех предшествующих интервалов, включая данный.
Натуральный показатель – характеристика объема, величины, меры длины, веса и т.д. В некоторых случаях применяют условные натуральные показатели, когда разновидность одной и той же потребительской стоимости принимают за единицу, а другую пересчитывают на эту единицу.
Непараметрическая статистика – методы, которые не осно-
вываются на оценках параметров, описывающих распределение выборки.
Неполный ряд динамики – ряд, в котором уровни зафиксированы в неравноотстоящие моменты или периоды времени.
Непрерывный признак – признак, который может принимать любые, сколь угодно близкие, значения из некоторого интервала.
Неравные интервалы – различные интервалы изменения признака.
Несплошное наблюдение – наблюдение, при котором обследованию подвергаются не все единицы изучаемой совокупности, а только заранее установленная их часть, например, изучение торговых оборотов и цен на городских рынках. Основным видом несплошного наблюдения является выборочное.
Нормальное распределение – распределение, имеющее форму колокола.
Обратная связь – такая связь, при которой с увеличением (уменьшением) значения факторного признака происходит уменьшение (увеличение) результативного признака.
Общий индекс – выражение сводных (обобщающих) результатов совместного изменения всех единиц, образующих статистическую совокупность с учетом ее структуры.
Объект наблюдения – исследуемая совокупность, о которой необходимо получить сведения.
Объем совокупности – число объектов в совокупности.
172