Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

TamogStat

.pdf
Скачиваний:
172
Добавлен:
27.05.2015
Размер:
2.04 Mб
Скачать

Для детального анализа эффективности товарообмена РФ целесооб- разно осуществлять расчёты индексов условий торговли по группам стран и по конкретным странам, а также по отдельным товарным группам и то- варам.

Результаты статистического анализа тенденций изменения показате- лей условий внешней торговли могут учитываться при выработке страте- гии и при определении приоритетов России в выборе стран партнёров по внешней торговле.

ТЕМА 7. СТАТИСТИЧЕСКИЕ МЕТОДЫ ИЗУЧЕНИЯ СТОХАСТИЧЕСКИХ СВЯЗЕЙ ВО ВНЕШНЕЙ ТОРГОВЛЕ

7.1. Понятие о статистической и корреляционной связи признаков

Современная наука изучает взаимосвязи всех явлений природы и общества. Невозможно управлять различными явлениями и процессами, предсказывать их развитие без изучения характера, силы и других особен- ностей связей. Данное положение полностью относится и к развитию внешней торговли страны и к развитию всей таможенной деятельности. Поэтому методы изучения и измерения связей составляют важную часть методологии статистического исследования.

Различают два типа связей между явлениями и их признаками: функциональную или жёстко детерминированную и статистическую или стохастически детерминированную.

Связь называется функциональной, если значению одной перемен- ной обязательно соответствует одно или несколько точно заданных значе- ний другой переменной. Например, если взаимосвязь признаков определя-

ется формулой y = 3x , то при x=3 у может быть только 9; если же y = x ,

то при x = 9 у может быть +3 и -3, т.е. одному значению x соответствуют два значения у.

70

Стохастически детерминированная связь не имеет ограничений и ус- ловий, присущих функциональной связи. При статистической связи раз- ным значениям одной переменной могут соответствовать с некоторыми вероятностями разные значения другой переменной, при этом её среднее значение или другие статистические характеристики изменяются по опре- делённому закону.

Корреляционной связью называется важнейший частный случай ста- тистической связи, состоящий в том, что разным значениям одной пере- менной соответствуют с разными вероятностями различные средние зна- чения другой переменной. То есть, с изменением значения признака x за- кономерным образом изменяется среднее значение признака y, в то время, как в каждом отдельном случае признак y (с разными вероятностями) мо- жет принимать множество различных значений.

Термин «корреляция» ввёл в статистику английский биолог и стати- стик Френсис Гальтон в конце 19 века. Это слово писалось correlation, т.е. не просто связь (relation), а «как бы связь» в непривычной в то время не функциональной форме.

Корреляционная связь между признаками может возникать разными путями. Важнейший из них - это причинная зависимость вариации резуль- тативного признака от вариации факторного признака.

7.2. Условия применения и задачи корреляционно- регрессионного анализа. Проблемы его использования для изучения связей во внешней торговле

Так как корреляционная связь это связь статистическая, то первым условием возможности её изучения является наличие данных по достаточ- но большой совокупности. Обычно считают, что число наблюдений долж- но быть не менее 6-7, а лучше 10 единиц.

71

Вторым условием является надёжное выражение закономерности в средней величине, а для этого необходима достаточная однородность со- вокупности.

Третьим условием применения корреляционного анализа является необходимость подчинения распределения единиц совокупности по значе- нию результативного и факторных признаков закону нормального распре- деления вероятностей. На практике это условие чаще всего выполняется приближённо, но и тогда метод даёт хорошие результаты.

В соответствии с сущностью корреляционной связи её изучение свя- зано с решением двух задач:

- измерения параметров уравнения, выражающего связь средних зна- чений зависимой переменной ( yˆ ) со значениями одной или нескольких не-

зависимых переменных (хi), т.е. одного или нескольких факторных призна- ков;

- измерения тесноты связи признаков между собой.

Первая задача решается оценкой параметров уравнения регрессии, вторая расчётом показателей тесноты связи.

Анализ влияния факторов на результаты внешнеторговой деятельно- сти наименее изученная проблема статистики внешней торговли. Изуче- ние стохастических связей во внешней торговле в настоящее время носит эпизодический характер. С одной стороны это связано с «молодостью» та- моженной статистики, как науки. С другой стороны причиной является от- сутствие специалистов-статистиков занимающихся изучением стохастиче- ских связей на местах. В-третьих, информационная база для изучения влияния разнообразных факторов на результаты внешнеторговой деятель- ности выходит за рамки базы данных ГТК-ФТС. Появляется необходи- мость в привлечении дополнительной информации, например информации Федеральной службы Государственной статистики России, что требует от- лаженных механизмов взаимообмена информацией, либо изыскания иных возможностей получения необходимых данных.

72

Одной из основных задач изучения стохастических связей во внеш- ней торговле является установление самой взаимосвязи признаков. Это значит, что показатели тесноты связи должны характеризовать её как тес- ную. При этом, полученное уравнение связи должно быть существенным и иметь хорошее приближение к реальной тенденции взаимосвязи результа- та и факторов.

7.3. Построение парного линейного уравнения связи показателей внешней торговли. Оценка его параметров

Корреляционный анализ позволяет оценить степень тесноты стохас- тической связи между признаками, которая может носить как линейный, так и нелинейный характер. В качестве меры тесноты линейной связи ис- пользуется линейный коэффициент корреляции, при нелинейной связи ис- пользуется либо теоретическое корреляционное отношение, либо индекс корреляции. При этом линейный коэффициент корреляции есть частный случай корреляционного отношения для линейной формы связи.

Показатели тесноты связи являются мерой соответствия вариации значений результативного признака и вариации значений признаков фак- торов. Если эти показатели оказываются достаточно большими по величи- не (в границах существования их значений), делается вывод об установле- нии связи и даётся характеристика её тесноты. В противном случае делает- ся вывод об отсутствии связи.

Регрессионный анализ позволяет получить статистическую модель изучаемого процесса, которая при определённых условиях может быть ис- пользована для его изучения и прогнозирования.

Термин «регрессия» ввели в статистику создатели корреляционного анализа Ф. Гальтон и К. Пирсон. Изучая связь между ростом отцов и сыно- вей, они обнаружили, что отклонение роста от средней величины в сле- дующем поколении уменьшается, т.е. регрессирует.

73

Регрессионная модель (уравнение) представляет зависимость резуль-

тата ( yˆ ) как функции одного или нескольких факторов (хi ) как линейного,

так и нелинейного вида:

yˆ = f (xi ).

Регрессионный анализ обеспечивает выбор из множества линий той линии, которая наиболее точно отражает тенденцию взаимосвязи результа- та и факторов. В основе регрессионного анализа лежит метод наименьших квадратов (МНК), который обеспечивает наименьшую сумму квадратов отклонений фактических значений результата (у )от его теоретических зна- чений ( yˆ ), полученных (вычисленных) по уравнению связи:

(yi yˆ i )2 → min .

Простейшей системой корреляционной связи является линейная связь между двумя признаками. Значение такой связи определяется тем, что среди всех факторов, влияющих на результат, как правило, есть один важнейший, который в основном и определяет вариацию результата. Вни- мание к линейным связям объясняется также и тем, что при нелинейных формах связей для выполнения расчётов их преобразуют к виду, схожему с линейной формой.

Уравнение парной линейной корреляционной связи называется урав- нением парной линейной регрессии. Оно имеет вид:

yˆ = a + bx ,

где yˆ - среднее значение результата при определённом значении факторного признака;

a- свободный член уравнения;

b- коэффициент регрессии.

Исходное условие МНК для прямой линии имеет вид:

f (a,b) = [y (a + bx)]2 → min .

Для определения значений параметров a и b , при которых f (a,b)

принимает минимальное значение, частные производные данной функции

74

по a и по b приравнивают нулю и преобразуют в систему нормальных уравнений:

na + bx = y

ax + bx2 = yx .

Если первое уравнение разделить на n , получим: a + bx = y , откуда a = y bx . Параметр b определяется из решения системы уравнений отно-

сительно b :

b = xy - x * y . x2 - x 2

Параметр b - коэффициент регрессии имеет смысл показателя си- лы связи между вариацией факторного признака x и вариацией результа- тивного признака y . Он измеряет среднее по совокупности отклонение y

от его средней величины при отклонении фактора x от своей средней ве- личины на принятую единицу измерения.

7.4. Показатели тесноты парной линейной зависимости. Их построение и интерпретация

Показателями тесноты парной линейной зависимости результата от фактора являются линейный коэффициент корреляции и коэффициент де- терминации.

Линейный коэффициент корреляции рассчитывается по формуле:

r = b

σ x

,

yx

σ y

 

 

 

где σ x = x2 - x 2 , а σ y = y2 - y2 .

Обычно считают связь признаков тесной (сильной), если ryx ³ 0,7 ;

средней (умеренной) при 0,5 £ ryx < 0,7, и слабой. Если ryx < 0,5 .

Говорить об установлении связи признаков можно, если ryx ³ 0,5 .

Квадрат линейного коэффициента корреляции называется коэффи- циентом детерминации и также является показателем тесноты связи при-

75

ryx2

знаков. Коэффициент детерминации оценивает долю вариации резуль-

тата, объяснённую вариацией рассматриваемого фактора, в общей вариа- ции результата.

Таким образом, проведя корреляционный анализ и рассчитав показа- тели тесноты связи, можно ответить на вопросы об установлении связи признаков, о характеристике тесноты связи и о доле вариации результата, объяснённой вариацией изучаемого фактора.

7.5. Оценка качества уравнения регрессии и существенности изучаемой связи

Качество построенного уравнения регрессии оценивается с помощью средней ошибки аппроксимации. Такая оценка отвечает на вопрос о воз- можности использования полученного уравнения для дальнейшего анализа и прогнозирования.

Средняя ошибка аппроксимации строится исходя из разности факти- ческих значений результата и его теоретических значений, полученных по уравнению регрессии. Если фактические значения (у) и теоретические зна-

чения ( yˆ ) близки по величине, ошибка будет маленькой, если различия (у)

и ( yˆ ) большие, ошибка будет большой. Средняя ошибка аппроксимации рассчитывается по формуле:

ε = 1n yi y yˆ i *100% .

Считается, что качество уравнения удовлетворительное и его можно использовать для анализа и прогнозирования, если ε ≤ 10% . Если средняя ошибка аппроксимации ещё меньше и не превышает 5%, то качество по- строенного уравнения считается очень хорошим.

Оценка существенности уравнения связи проводится с использова- нием F-критерия Фишера. Выдвигается гипотеза о несущественности изу- чаемой связи признаков, т.е. о её случайном характере. Такая гипотеза на- зывается нулевой и обозначается H0. Нулевую гипотезу необходимо про-

76

верить. Для этого рассчитывают фактическое значение критерия Фишера по формуле:

F

=

δ

фактор2 .

:

m − 1

=

 

ryx2

*

n m

,

 

 

 

 

 

 

 

факт.

 

σ 2

 

 

 

n m

 

 

1 − r 2

 

m − 1

 

 

 

 

остат.

 

 

 

 

yx

 

 

 

где

δфактор2

. - факторная дисперсия (бо´льшая);

 

σ остат2

. - остаточная дисперсия (меньшая);

 

n

число единиц совокупности;

 

m

число параметров уравнения регрессии;

 

m-1 –

 

число степеней свободы факторной дисперсии;

 

n-m

 

число степеней свободы остаточной дисперсии;

 

r 2

 

- коэффициент детерминации.

 

yx

 

 

 

 

 

 

 

 

 

 

 

 

Фактическое значение критерия Фишера сравнивается с табличным значением, которое называется критическим. Критическое значение F- критерия определяется по таблице значений F-критерия Фишера при уров- не значимости α = 0,05 (что соответствует вероятности P=95%) и соответст-

вующих степенях свободы факторной и остаточной дисперсий. Критиче- ское значение критерия Фишера это максимальное значение, при кото- ром принимается нулевая гипотеза H0. Затем фактическое значение крите- рия Фишера сравнивается с табличным (критическим). Если Fфакт. меньше Fкрит. – нулевая гипотеза принимается и связь признаков признаётся несу- щественной (случайной). Если же Fфакт. больше Fкрит., то нулевая гипотеза отвергается, не принимается и связь признаков признаётся существенной, носящей закономерный характер.

7.6. Построение парного нелинейного уравнения связи. Прием линеаризации переменных величин

В реальности гораздо чаще встречаются связи нелинейного характе- ра, которые могут быть отображены функциями разного вида:

- степенной yˆ = axb ;

77

- логарифмической yˆ

= a + bloqx или yˆ = a + b ln x ;

- показательной yˆ = abx ;

 

ˆ

 

1

 

= a + b

и другими.

- гиперболической y

x

Для построения нелинейного парного уравнения регрессии проводят его линеаризацию, т.е. нелинейное уравнение приводят к виду, схожему с линейным. Например, для гиперболической функции необходимо заменить

1 на z. Тогда функция будет иметь вид: yˆ = a + bz , т.е. вид, похожий на ли-

x

нейную форму уравнения. Для степенной функции линеаризация прово- дится следующим образом. Сначала выражение степенной функции лога- рифмируется, получаем: ln y = ln a + b ln x . Затем вводим обозначения, на-

пример, ln y = Y , ln a = A, ln x = X . В результате получаем уравнение регрессии

в виде: ˆ = + , похожем на линейную форму. К полученным выражени-

Y A bX

ям функций применяем формулы для расчёта параметров a и b , соответ- ствующие линейной форме, в которых вместо x будет стоять z (для ги-

перболического уравнения), либо Y , A, X (для степенного уравнения):

 

yz

 

 

 

*

 

 

 

 

 

YX

 

 

 

 

 

 

 

 

b =

 

 

 

 

 

;

b =

 

Y

* X

.

y

z

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

z2 − (

 

 

)2

X 2 − (

 

 

 

 

 

 

 

X

)2

 

 

 

z

Для нелинейных форм уравнений регрессии параметр b не является коэффициентом регрессии (кроме параболы второго порядка

yˆ = a + bx + cx2 ).

7.7. Показатели тесноты парной нелинейной зависимости. Их расчет и интерпретация

Показателями тесноты парной нелинейной зависимости результата и фактора являются теоретическое корреляционное отношение η yx или ин-

декс корреляции ρ yx , а также их квадраты, соответствующие коэффициен-

ту детерминации. Теоретическое корреляционное отношение определяется по формуле:

78

 

 

 

 

 

 

(yˆ −

 

)2

 

 

 

 

δ 2фактор.

 

 

 

 

 

η yx =

 

=

 

y

,

 

σ 2общ.

 

(y

 

)2

 

 

 

 

y

где

δ 2фактор.

- факторная дисперсия, т.е. объяснённая связью с факто-

ром дисперсия результативного признака;

σ 2общ. - общая дисперсия результата.

Индекс корреляции определяется по формуле:

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

(y yˆ )2

ρ yx =

 

σ 2остат.

 

 

1 −

 

 

=

1 − (y

 

)2 ,

σ 2

 

 

 

общ.

 

 

y

где

σ 2остат.

- остаточная дисперсия, т.е. необъяснённая связью с фак-

тором дисперсия результативного признака;

 

σ 2общ. - общая дисперсия результата.

Квадрат теоретического корреляционного отношения ηyx2 или индек-

са корреляции ρ yx2

является коэффициентом детерминации.

Следует отметить, что линейный коэффициент корреляции является частным случаем теоретического корреляционного отношения для линей- ной формы связи признаков.

Связь признаков считается тесной, если теоретическое корреляцион- ное отношение или индекс корреляции по значению будут не меньше 0,7 (см. 7.4.). Объяснение коэффициента детерминации также дано в разделе 7.4. данной темы.

7.8. Прогнозирование показателей внешней торговли по уравнению регрессии. Оценка прогноза

Чтобы получить прогнозное значение показателя внешней торговли, необходимо в построенное уравнение связи подставить ожидаемое, пред- полагаемое, ранее спрогнозированное или нормативное значение фактор- ного признака. В результате будет получен точечный прогноз, который бу- дет содержать ошибки. Поэтому прогноз показателя внешней торговли следует давать в виде доверительного интервала с заданной вероятностью.

79

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]