Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Ватник!.doc
Скачиваний:
10
Добавлен:
07.12.2018
Размер:
1.44 Mб
Скачать

Федеральное агентство по образованию

Государственное образовательное учреждение высшего и

профессионального образования

«Санкт-Петербургский государственный

инженерно-экономический университет»

Кафедра исследования операций в экономике

П. А. Ватник

СТАТИСТИЧЕСКИЕ МЕТОДЫ

АНАЛИЗА ЗАВИСИМОСТЕЙ

Методические указания

по дисциплине «Статистика»

Санкт-Петербург

2006

Допущено

редакционно-издательским советом СПбГИЭУ

в качестве методического издания

Автор

д.э.н., проф. П. А. Ватник

Рецензент

д.э.н., проф. Б. М. Генкин

Подготовлено на кафедре

исследования операций в экономике

Одобрено научно-методическим советом

Факультета информационных систем

в экономике и управлении

Отпечатано в авторской редакции с оригинал-макета,

представленного автором

© СПбГИЭУ, 2006

Содержание

Предисловие

4

§ 1. Функциональная и корреляционная зависимости

5

§ 2. Определение статистической взаимосвязи

9

§ 3. Эмпирическая регрессия

16

§ 4. Дисперсионное и корреляционное отношения

20

§ 5. Аналитическая регрессия. Метод наименьших квадратов

29

§ 6. Линейная регрессия

40

§ 7. Ковариация и коэффициент корреляции

47

§ 8. Линейное уравнение регрессии в стандартных масштабах

55

§ 9. Некоторые нелинейные функции регрессии

60

§ 10. Множественная корреляция и регрессия

65

§ 11. Замена переменных в уравнениях регрессии

80

ПРИЛОЖЕНИЯ

85

I. Теорема о разложении дисперсии

85

II. Теорема о среднем значении регрессии

86

III. Вторая теорема о разложении дисперсии

88

IV. Доказательство ограниченности ковариации

91

Предисловие

Дисциплина «Статистика» включена в учебные планы всех специальностей направлений «Экономика» и «Менеджмент», содержание дисциплины в рабочих программах для различных специальностей примерно одинаково. Одним из самых сложных разделов при этом является раздел, посвященный статистическим методам анализа взаимосвязей.

Предлагаемое пособие дополняет существующие учебники теоретической статистики в некоторых направлениях. В нем существенно шире излагаются содержательные подходы к построению статистических моделей взаимосвязанных процессов и большее внимание уделяется интерпретации параметров этих моделей. Кроме того, в данном пособии значительное место занимает обсуждение теоретических основ рассматриваемых методов анализа и, в частности, доказательство ряда утверждений. Более сложный материал приведен в приложениях: здесь дается точная формулировка и строгое доказательство теорем, весьма существенных при работе со статистическими моделями зависимостей. Материал приложений не является обязательным при изучении дисциплины, но он будет весьма полезен тем читателям, которые заинтересованы в освоении фундаментальных основ статистики сверх стандартной учебной программы.

За пределами предлагаемого издания остались вопросы, связанные с интерпретацией данных как выборочных: оценка точности параметров, проверка статистических гипотез о зависимостях. Эти вопросы включаются в программы по математической статистике и эконометрике.

Автор выражает глубокую благодарность А. В. Вангородской и В. В. Вангородскому за существенную помощь в подготовке издания.

§ 1. Функциональная и корреляционная зависимости

Прежде чем приступить к изучению статистических методов в анализе взаимосвязей, необходимо выяснить, в каком смысле здесь будут употребляться слова «взаимосвязь», «зависимость» и т. д. В математическом анализе слово «зависимость» означает функциональную зависимость, которая имеет следующий смысл. Переменная y называется функцией переменной x, если каждому значению x соответствует вполне определенное значение переменной y. Так, например, масса M и объем V изделий из одного определенного материала связаны между собой функциональной зависимостью

M = dV,

где d — плотность материала. Зная объем изделия, можно вполне однозначно определить его вес. Функциональную зависимость можно считать заданной, если известен способ определения значений зависимой переменной y для каждого значения аргумента x. Способ при этом может быть любым — расчетным, графическим, табличным, — важно лишь, что для каждого x он приводит к однозначному результату.

Однако функциональные зависимости не исчерпывают всех возможных видов взаимосвязи между явлениями. Так, например, на вопрос: «Связан ли вес человека с его ростом?» – мы, без сомнения, ответим утвердительно, хотя о функциональной связи в этом случае не может идти и речи. Если мы знаем, что рост человека равен, допустим, 174 см, мы не можем однозначно указать, какой величиной выражается его вес. Следовательно, хотя здесь и имеет место зависимость (высокие люди, как правило, тяжелее низких), но эта зависимость не является функциональной, а имеет иную природу.

Такую же не функциональную природу имеет большинство зависимостей, с которыми приходится сталкиваться в экономике. Выпуск продукции предприятием зависит от числа рабочих; затраты на производство продукции зависят от ее количества и т. д. Ясно, что зависимости такого рода носят неоднозначный, не функциональный характер. Такого рода зависимости носят название корреляционных, или стохастических. Более строгое определение корреляционной зависимости будет дано ниже.

Неоднозначный характер проявления корреляционных зависи­мостей определяется тем обстоятельством, что на изменение изучаемого явления влияет не только выделенный фактор, но и ряд других причин, многие из которых могут быть неизвестны исследователю. Так, люди с ростом 174 см могут иметь различный рацион, образ жизни, характер труда, различное состоя­ние здоровья и т. д. Все эти и многие другие факторы оказывают влияние на его вес и тем самым делают зависимость веса от рос­та неоднозначной.

В естественнонаучных исследованиях зависимость некоторо­го явления от одной определенной причины устанавливается путем проведения эксперимента, в ходе которого значения всех прочих факторов поддерживаются постоянными, и таким путем удается исключить их влияние. Постоянство этих факторов обычно является залогом успеха исследования, и поэтому в естественных науках такое большое значение придается чистоте эксперимента. При этом может быть установлена функциональная зависимость одного явления от другого. Графически это может быть представлено следующим образом. Если результаты всех наблюдений изобразить в виде точек в декартовых координатах, откладывая по оси абсцисс переменную x , а по оси ординат — переменную y, все точ­ки расположатся в виде некоторой цепочки; если число наблюдений увеличивать неограниченно, все точки заполнят некоторую кривую — график функциональной зависимости (рис. 1.1а).

В области социально-экономических явлений проведение «чистого эксперимента», как правило, не представляется возмож­ным, и связь между двумя величинами приходится наб­людать на фоне многочисленных влияний. Наглядное представление такой связи дает графическое построение, называемое в этих слу­чаях корреляционным полем. Для изучения связи между величинами x и y проводится статистическое наблюдение над некоторой совокупностью, в ходе которого фиксируются значения этих вели­чин. Затем все элементы совокупности (все отдельные наблюде­ния) изображаются точками в координатах (x, y) (рис. 1.1б). В силу неоднозначности зависимости точки корреляционного поля не располагаются вдоль какой-нибудь линии, а некоторым образом размещаются внутри некоторой области на плоскости.

Несмотря на то, что точки на рис. 1.1б не лежат на одной линии, можно заметить, что величина y зависит от x: чем больше x, тем, как правило, больше и y. Отметим, что для отдельных точек это соотношение может не выполняться. Если выделить точки 1 и 2, видно, что y1 < y2, в то время как x1 > x2. Таким образом, корреляционная зависимость проявляется лишь на совокупности в целом и может не выполняться для отдельных ее элементов.

Обращаясь к корреляционному полю, приведенному на рис. 1.1в, можно увидеть, что в этом случае также имеется зависимость между x и y; более того, характер этой зависимости такой же, как и в случае, изображенном на рис. 1.1б. Но имеется и существенное различие между этими двумя случаями. Точки на рис. 1.в размещаются в более широкой области, чем на рис. 1.1б. Это означает, что связь между переменными x и y в случае 1.1в является менее тесной, менее жесткой, чем в случае 1.1б.

Рис. 1.1

Рис. 1.1

Наконец, рассматривая корреляционное поле на рис. 1.1г, мы не замечаем никакого порядка в расположении его точек и можем сделать вывод о независимости признаков x и y.

Таким образом, при изучении корреляционных зависимостей необходимо решить следующие задачи:

а) установление факта зависимости. На начальном этапе исследования необходимо выяснить, существует ли какая-либо зависимость между рассматриваемыми признаками. Если зависимости не существует, исследование на этом заканчивается; если же зависимость существует, исследователь переходит к следующим задачам;

б) установление формы, характера зависимости и определение ее количественных характеристик. С возрастанием признака x признак y может возрастать либо убывать; это возрастание может быть быстрым или медленным; на различных интервалах характер зависимости может быть различным. При анализе взаимосвязи необходимо выявить и количественно измерить эти особенности каждой конкретной зависимости;

в) оценка тесноты связи. Если задачи а) и б) имеют смысл и для функциональной, и для корреляционной зависимости, то измерение тесноты связи специфично именно для анализа корреляционных связей. Для функциональных зависимостей само понятие «теснота связи» лишено смысла, так как там связь носит абсолютный, однозначный характер.

В зависимости от назначения анализа взаимосвязей и сферы использования его результатов при исследовании может потребоваться решение некоторых специальных вопросов.

Термины «аргумент» и «функция», применяемые при описании функциональных зависимостей, по отношению к корреляционным связям не используются. Признак, влияние которого на другие признаки исследуется, называется факторным, или признаком-фактором. Признак, испытывающий влияние факторного, называется результирующим (результативным), или признаком-результатом.