Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

Артамонов статистика(конец)

.pdf
Скачиваний:
51
Добавлен:
23.03.2015
Размер:
692.85 Кб
Скачать

Окончание табл. 9.3

Пред-

Затраты на

Кол-вопродан-

Знак

Знак

Совпадение

при-

рекламу ( x1 ),

ныхтелевизоров

или несовпаде-

ятие

тыс. усл. ед.

( y ), тыс. шт.

x1i x1

yi y

ние знака

 

 

16

 

 

 

 

 

17

 

 

 

 

 

18

 

 

 

 

 

19

 

 

 

 

 

20

 

 

 

 

 

Тогда

Кф =

Вычислите коэффициент парной корреляции

rx1, y =

Упражнение 9.3. Найдите коэффициенты линейного уравнения регрессии для затрат на рекламу и объемов продаж телевизоров. Определите коэффициент эластичности и сделайте вывод о связи затрат на рекламу с объемом продаж телевизоров.

Вычислите

b= x 2y(x)2y = x x

a = y b x =

Запишите уравнение регрессии y = b · x+a =

Найдите коэффициент эластичности

Kэласт =

Запишите уравнение регрессии y = a0 +a1x =

Упражнение 9.4. По данным 10 предприятий (гр. 1, 2 табл. 9.4) с помощью коэффициентов корреляции рангов Спирмэна (ρ) и Кен-

дэлла ( τ) измерить тесноту зависимости между объемом выпуска продукции (у), млн р. и стоимостью основных производственных фондов (х), млн р.

163

 

 

 

 

 

 

 

 

Таблица 9.4

 

Расчет показателей ранговой корреляции

 

 

 

 

 

 

 

 

 

 

 

х

у

N x

N y

d =Nx Ny

d 2

Подсчет баллов

 

+

 

1

2

3

4

5

6

 

7

 

8

1,5

№ : 10

 

 

 

 

 

 

 

 

1,8

4,4

 

 

 

 

 

 

 

 

2,0

3,8

 

 

 

 

 

 

 

 

2,2

3,5

 

 

 

 

 

 

 

 

2,3

4,8

 

 

 

 

 

 

 

 

2,6

4,3

 

 

 

 

 

 

 

 

3,0

7,0

 

 

 

 

 

 

 

 

3,1

6,5

 

 

 

 

 

 

 

 

3,5

6,1

 

 

 

 

 

 

 

 

3,8

8,2

 

 

 

 

 

 

 

 

 

 

 

 

 

d 2 =

P =

 

 

Q =

1. Для расчета коэффициента корреляции рангов Спирмэна (ρ)

вначале ранжируйте значения признаков в каждом ряду, т.е. каждому значению х и у в порядке их возрастания присвойте порядковый номер (ранг) N x и N y (гр. 3, 4 табл. 9.4), затем найдите разности рангов

(d), возведите их в квадрат (гр. 6) и суммируйте. Полученную сумму d 2 подставьте в формулу

 

ρ =1

6d 2

=

 

 

n(n2 1)

 

 

 

 

 

 

 

 

Судя по значению полученного коэффициента, связь между х и

у ______________ ________________________.

 

 

2. Для

расчета коэффициента корреляции рангов

Кендэлла

τ =

2S

 

определите S как сумму положительных (Р)

и отрица-

n(n 1)

 

 

 

 

 

тельных (Q) баллов.

Вспомогательные расчеты этих баллов поместите в гр. 7, 8. Так как значения рангов x идут строго в возрастающем порядке, то следите лишь за поведением рангов у. Например, после первой пары значений рангов, где N y = 3, в семи случаях идут значения N y > 3, а в

двух случаях – значения N y < 3 ( N y = 2; 1); после второй пары, где N y = 5, наблюдается пять случаев рангов выше рассматриваемого, а три ( N y = 2; 1; 4) ниже и т. д.

164

По результатам подсчетов находите общую сумму баллов:

S = Р + Q =

Подставляя ее в формулу коэффициента корреляции рангов Кендэлла (τ), определите

τ=n(n2S1) =

Сделайте вывод.

Коэффициент Кендэлла всегда ______________ по значению, чем коэффициент Спирмэна.

Упражнение 9.5. Пусть имеются данные по 10 предприятиям

(табл. 9.5).

Найдите коэффициент конкордации.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Таблица 9.5

 

 

 

 

 

Расчет коэффициента конкордации

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

При-

 

 

Стои-

 

 

Затраты

Ранжирование

Сумма

Квадраты

Пред-

быль

 

 

 

 

факторов

рангов

суммы рангов

 

 

мость

 

 

на 100 р.

прия-

(y),

 

 

 

 

 

 

 

 

 

 

3

 

3

2

 

 

 

 

 

 

 

 

 

 

 

 

ОПФ(x),

 

 

 

продук-

Rx

 

R

 

 

Rz

тие

млн р.

 

 

млнр.

 

 

 

 

ции (z)

 

y

 

Rj

R j

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1

 

1

 

1

200

 

 

: 10

 

 

 

80

 

 

 

 

 

 

 

 

 

 

 

2

250

 

 

4,2

 

 

 

67

 

 

 

 

 

 

 

 

 

 

 

3

300

 

 

4,6

 

 

 

89

 

 

 

 

 

 

 

 

 

 

 

4

360

 

 

5,3

 

 

 

23

 

 

 

 

 

 

 

 

 

 

 

5

400

 

 

3,7

 

 

 

45

 

 

 

 

 

 

 

 

 

 

 

6

480

 

 

3,8

 

 

 

78

 

 

 

 

 

 

 

 

 

 

 

7

490

 

 

3,9

 

 

 

90

 

 

 

 

 

 

 

 

 

 

 

8

500

 

 

5,8

 

 

 

43

 

 

 

 

 

 

 

 

 

 

 

9

600

 

 

6,5

 

 

 

23

 

 

 

 

 

 

 

 

 

 

 

10

700

 

 

4,4

 

 

 

45

 

 

 

 

 

 

 

 

 

 

 

Итого

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Для решения задачи заполните табл. 9.5.

 

 

 

 

Проведите расчет коэффициента по данным табл. 9.5.

 

 

 

 

 

 

 

 

 

 

 

 

10

3

 

 

2

 

 

 

 

 

 

10

 

3

 

2

 

 

∑ ∑

R j

 

 

 

 

 

 

 

 

 

 

1

1

 

 

 

 

 

 

 

 

S =

 

R j

 

 

 

 

 

=

 

 

 

 

 

 

10

 

 

 

 

 

 

 

 

1

 

1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

W =

 

 

 

12 S

 

 

 

 

=

 

 

 

 

 

 

 

 

 

 

 

m 2 ( n 3 n )

 

 

 

 

 

 

 

 

 

 

 

165

ГЛОССАРИЙ

Абсолютный прирост – разность между двумя уровнями ряда динамики. Имеет ту же размерность, что и уровни самого ряда динамики; может быть цепным и базисным, в зависимости от способа выбора базы для сравнения.

Абсолютный статистический показатель – показатель, выра-

жающий размер конкретного явления (стоимость, вес, объем, площадь и т.д.) в именованных числах (тыс. р., кг, м3, м2 и т. д.).

Аналитическая группировка – группировка, которая приме-

няется для исследования взаимосвязи между явлениями, с помощью которой определяют факторные и результативные признаки изучаемых явлений.

Анкетный способ – сбор данных, основанный на добровольном заполнении адресатами анкет.

Асимметрия или коэффициент асимметрии (термин был впервые введен Пирсоном в 1895 г.) – мера несимметричности распределения.

Атрибутивный признак – признак, не имеющий количественной меры, например: пол (мужской, женский), отрасль народного хозяйства, вид продукции, профессия рабочего и т.д.

Бимодальное распределение – статистическое распределение, имеющее две моды, т.е. два «пика».

Варианта – значение признака для различных наблюдаемых единиц совокупности.

Вариация – многообразие, изменяемость величины признака у отдельных единиц совокупности наблюдения.

Внутриклассовый коэффициент корреляции – мера однород-

ности наблюдений внутри классов случайного фактора относительно изменчивости наблюдений между классами.

Временной ряд – измерения значений признака наблюдаемого явления в последовательные моменты времени.

Выборка бесповторная – выборка, при которой отобранный объект не возвращается в генеральную совокупность.

Выборка повторная – выборка, при которой отобранный объект возвращается в генеральную совокупность.

166

Выборочное наблюдение – наблюдение, при котором характеристика всей совокупности фактов дается по некоторой их части, отобранной в случайном порядке.

Гауссовское распределение – нормальное распределение.

Генеральная совокупность – статистическая совокупность явлений, процессов или объектов, подлежащих изучению.

Гистограмма – примыкающие к друг другу прямоугольники, изображенные на координатной сетке.

Графический образ – символические знаки, с помощью которых изображаются статистические данные (линии, точки, прямоугольники, квадраты, круги и т. д.).

Группировка – процесс образования групп единиц совокупности, однородных в каком-либо отношении, а также имеющих одинаковые или близкие значения группировочного признака.

Двумерное нормальное распределение – совместное распре-

деление двух нормально распределенных случайных величин. Децильи – значения признака, которые делят вариационный ряд

на десять равных частей.

Децильный коэффициент – отношение девятой децили к первой.

Диаграмма – чертеж, на котором статистическая информация изображается посредством геометрических фигур или символических знаков.

Диаграмма динамики – диаграмма, которая показывает изменение явления во времени.

Диаграмма связи – диаграмма, которая показывает функциональную зависимость одного признака от другого (обычный график на координатной сетке).

Диаграмма сравнения – диаграмма, которая показывает соотношение признаков статистической совокупности.

Дискретный ряд распределения – ряд, в котором варианты выражены целыми числами.

Дисперсионный анализ – анализ с целью проверки значимости различия между средними с помощью сравнения дисперсий.

Дисперсия – средняя арифметическая квадратов отклонений каждого значения признака от общей средней.

167

Добавление наблюдений и/или переменных – действие, в ре-

зультате которого в конец набора данных добавляются соответственно новые наблюдения (строки) и/или переменные (столбцы).

Добыча данных – совокупность методов аналитической обработки больших массивов данных (часто связанных с деловой активностью или рыночными показателями) с целью выявления в них значимых закономерностей и/или систематических связей между переменными.

Доверительный интервал – интервал для некоторой статистики (например, среднего значения или линии регрессии), показывающий диапазон вокруг значения статистики, в котором находится истинное значение этой статистики (с определенным уровнем надежности или доверия).

Доверительный интервал для среднего – область вокруг сред-

него, в которой с заданным уровнем доверия содержится «истинное» среднее популяции.

Доверительный предел – то же самое, что и доверительный интервал.

Единовременное (разовое) наблюдение – наблюдение за объ-

ектом по мере надобности, время от времени, без соблюдения строгой периодичности; может проводиться единожды.

Единый государственный реестр предприятий и организа-

ций (ЕГРПО) – реестр, состоящий из четырех разделов: идентификационного, классификационного, справочного и экономического; характеризующий различные признаки предприятий и организаций.

Заголовок графика – выражение в краткой и четкой форме, поясняющее основное содержание изображаемых данных.

Индекс – частное от деления значения признака в текущих условиях на значения признака в других условиях.

Индивидуальный индекс – индекс, характеризующий изменения отдельных единиц статистической совокупности без учета ее структуры.

Интервальный ряд динамики – ряд динамики, который ото-

бражает итоги функционирования явления в течение определенного интервала времени.

168

Интервальный ряд распределения – ряд, в котором значения признака заданы в виде интервала. Например, распределение рабочих по разрядам можно представить в виде интервального ряда.

Квартили (термин впервые использован Гальтоном в 1882 г.) – значения признака, делящие вариационный ряд на четыре равные части.

Квартильный размах (термин был впервые использован Гальтоном в 1882 г.) – размах переменных, равный разности значений третьей и первой квартили.

Классификация – отнесение наблюдения к одному из нескольких, заранее известных классов (представленных значениями номинальной выходной переменной).

Кластерный анализ (термин впервые ввел Трион в 1939 г.) – набор различных алгоритмов классификации в группы схожих объектов.

Количественный признак – признак, имеющий количественное выражение у отдельных единиц совокупности (например: заработная плата рабочих, стоимость продукции промышленных предприятий, возраст людей, урожайность отдельных участков посевной площади и т. д.).

Комбинационная таблица – таблица, в которой подлежащее содержит группировку единиц совокупности по двум или более признакам, взятым в сочетании.

Корреляционная связь – статистическая связь, характерная тем, что одним и тем же значениям факторного признака может соответствовать сколь угодно различных значений результативного признака.

Корреляционно-регрессионный анализ – нахождение уравне-

ния связи, в котором результативный признак зависит только от интересующих нас факторов.

Корреляция (термин впервые ввел Гальтон в 1888 г.) – мера связи между двумя переменными. Коэффициент корреляции может изменяться от –1,00 до +1,00. Число –1,00 означает полностью отрицательную корреляцию, +1,00 – полностью положительную, 0,00 – отсутствие корреляции.

Корреляция Пирсона – линейная корреляция, которая измеряет степень линейных связей между переменными.

169

Корреспондентский способ – способ наблюдения, который заключается в том, что сведения в органы, ведущие наблюдение, сообщают их корреспонденты.

Косинус-сглаживание – рекомендуемое преобразование ряда, предшествующее спектральному анализу.

Коэффициент вариации – процентное отношение среднего квадратического отклонения к среднему значению признака.

Коэффициент детерминации – квадрат коэффициента корреляции Пирсона между двумя переменными. Он выражает количество дисперсии, общей между двумя переменными.

Коэффициент несогласия – оценка логистической регрессии, вычисляемая на основании таблицы 2 × 2, в ячейках которой показано количество наблюдаемых и предсказанных значений для бинарных зависимых переменных.

Коэффициент осцилляции – оценка относительной колеблемости крайних значений признака вокруг средней.

Коэффициент роста – относительный показатель, получающийся в результате деления двух уровней одного ряда друг на друга. Коэффициенты роста могут рассчитываться как цепные, когда каждый уровень ряда сопоставляется с предшествующим ему, и как базисные, когда каждый уровень ряда сопоставляется с базисным уровнем ряда.

Критерий согласия – мера расхождения между теоретическими и эмпирическими частотами, которая позволяет установить, является ли это расхождение случайным, т.е. несущественным, или неслучайным. Критерий согласия позволяет отвергнуть или подтвердить правильность гипотезы о виде кривой распределения.

Кумулята – график накопленных частот.

Линия n-точечного скользящего среднего – линия, каждая точка на которой представляет среднее соответствующей выборки из (n – 1) числа предыдущих выборок.

Логический контроль – контроль, который заключается в проверке ответов на вопросы программы наблюдения путем их логического осмысления или путем сравнения полученных данных с другими источниками по этому же вопросу.

Макет статистической таблицы – таблица, состоящая из строк и граф, которые еще не заполнены цифрами.

170

Малая выборка – несплошное статистическое обследование, при котором выборочная совокупность образуется из сравнительно небольшого числа единиц генеральной совокупности. Объем малой выборки обычно не превышает 30 единиц, может доходить до 4–5 единиц.

Масштаб графика – мера перевода численной величины в графическую (например, 1 см соответствует 100 тыс. р.). При этом чем длиннее отрезок линии, принятой за числовую единицу, тем крупнее масштаб.

Масштабная шкала – линия, отдельные точки которой читаются как определенные числа. Шкала, по которой отсчитываются уровни изучаемых показателей, как правило, начинается с 0.

Масштабный ориентир – показатель статистического графика, который придает графическому образу количественную значимость с помощью системы масштабных шкал.

Медиана выборки (термин впервые введен Гальтоном в 1882 г.) – значение, которое разбивает выборку на две равные части. Одна половина наблюдений лежит ниже медианы, другая половина – выше ее.

Метод максимума правдоподобия (термин впервые использо-

ван в работе Фишера в 1922 г.) – общий метод оценивания параметров генеральной совокупности с помощью максимизации функции правдоподобия (L) выборки.

Метод наименьших квадратов – оценивание по методу, кото-

рый заключается в минимизации суммы квадратов отклонений наблюдаемых значений зависимой переменной от значений, предсказанных моделью.

Механическая выборка – отбор единиц в выборочную совокупность производится из генеральной совокупности, разбитой на равные интервалы (группы). При этом размер интервала в генеральной совокупности равен обратной величине доли выборки.

Множественная регрессия – анализ связи между несколькими независимыми переменными (называемыми также регрессорами или предикторами) и зависимой переменной (откликом).

Множественный коэффициент корреляции R – положитель-

ный квадратный корень из R-квадрата (множественного коэффициента детерминации). Принимает значения от 0 до 1.

Мода – величина признака (варианта), наиболее часто встречающаяся в изучаемой совокупности.

171

Моментный ряд – ряд динамики, который отображает состояние изучаемого явления на определенную дату (момент) времени.

Накопленная частота – число единиц совокупности, у которых значение признака не больше данного. Накопленная частота для данного варианта или верхней границы данного интервала получается суммированием частот всех предшествующих интервалов, включая данный.

Натуральный показатель – характеристика объема, величины, меры длины, веса и т.д. В некоторых случаях применяют условные натуральные показатели, когда разновидность одной и той же потребительской стоимости принимают за единицу, а другую пересчитывают на эту единицу.

Непараметрическая статистика – методы, которые не осно-

вываются на оценках параметров, описывающих распределение выборки.

Неполный ряд динамики – ряд, в котором уровни зафиксированы в неравноотстоящие моменты или периоды времени.

Непрерывный признак – признак, который может принимать любые, сколь угодно близкие, значения из некоторого интервала.

Неравные интервалы – различные интервалы изменения признака.

Несплошное наблюдение – наблюдение, при котором обследованию подвергаются не все единицы изучаемой совокупности, а только заранее установленная их часть, например, изучение торговых оборотов и цен на городских рынках. Основным видом несплошного наблюдения является выборочное.

Нормальное распределение – распределение, имеющее форму колокола.

Обратная связь – такая связь, при которой с увеличением (уменьшением) значения факторного признака происходит уменьшение (увеличение) результативного признака.

Общий индекс – выражение сводных (обобщающих) результатов совместного изменения всех единиц, образующих статистическую совокупность с учетом ее структуры.

Объект наблюдения – исследуемая совокупность, о которой необходимо получить сведения.

Объем совокупности – число объектов в совокупности.

172