книги из ГПНТБ / Гинзбург Г.Л. Руководство по использованию метода наименьших квадратов в экономико-статистических расчетах учеб. пособие
.pdfм о с к о в с к и й
ОРДЕНА ТРУДОВОГО КРАСНОГО ЗНАМЕНИ ИНСТИТУТ НАРОДНОГО ХОЗЯЙСТВА ИМЕНИ Г. В. ПЛЕХАНОВА
Кафедра статистики
Г. Л. ГИНЗБУРГ
РУКОВОДСТВО П( ИСПОЛЬЗОВАНИЮ МЕТОДА
.АИМЕНЬШИХ КВАДРАТОВ В ; ЮНОМИКО-СТАТИСТИЧЕСКй>Х
РАСЧЕТАХ
Учебное 'пособие
Москва — |
_ |
Математическая статистика является одной из ведущих дисциплин, без знания которой немыслим образованный эко номист.
Методы математической статистики помогают экономисту проанализировать и осмыслить многие процессы, тесно свя занные с планированием и управлением народным хозяйст вом.
Важнейшим разделом математической статистики явля ется математическая обработка статистических и эксперимен тальных данных.
Одним из широко применяемых методов обработки экспе риментальных данных является метод наименьших квадра тов, которому посвящено много фундаментальных исследова ний. К сожалению, использование этого метода сопряжено с большими вычислительными трудностями. При наличии больших массивов информации целесообразно использовать ЭВМ. Однако очень часто в практической деятельности эко номиста возникают такие задачи, решение которых с по мощью ЭВМ не эффективно. В этих случаях необходимо при менять различные приемы, упрощающие ручной счет. Такие
приемы применяются в |
настоящем |
пособии, |
написанном |
|
Г. Л. Гинзбургом. |
будет полезным для |
практических |
||
Пособие, |
несомненно, |
|||
работников, |
аспирантов |
и студентов |
экономических специ |
альностей.
Студенты, не имеющие достаточной подготовки, могут ог раничиться изучением третьей главы. Однако это не осво бождает их от необходимости хорошо овладеть основными методами математического анализа, матричной и векторной алгебры, математической статистики и вычислительной мате матики.
В пособии, в качестве примеров, решено большое количест во задач, возникающих в экономической практике.
При необходимости экономист сможет подобрать подхо дящий из этих примеров и решить свою задачу за 1—2 часа, не обращаясь к ЭВМ и избавившись от излишних утомитель ных вычислений.
Я. К. Дружинин, заслуженный деятель наук РСФСР, доктор экономических наук, профессор.
з
В В Е Д Е Н И Е
Большой знаток статистики В. И. Ленин в 1921 году пи сал: «Дельный экономист, вместо пустяковых тезисов, зася дет за изучение фактов, данных, проанализирует .наш собст венный практический опыт и скажет: ошибка там-то, испра влять ее надо так-то». 1
За годы Советской власти статистиками была выполнена огромная работа: организована текущая статистика эконо мического и культурного строительства в нашей стране.
Советские статистики выполнили свой долг и в период первых пятилеток, и во время Великой Отечественной войны, и в послевоенный период. К ним можно отнести академиков В. С. Немчинова и С. Г. Струмилина, заслуженных деятелей науки и техники, профессоров Б. С. Ястремского, А. Я. Бояр ского, Н. К. Дружинина и других крупных ученых.
Советские математики также внесли огромный вклад в экономико-технический прогресс. Тем не менее математика и статистика продолжают оставаться в большом долгу перед экономикой. Особенно это относится к математической ста тистике, которая является разделом математики, посвящен ным математическим приемам систематизации, обработки и использования статистических данных и практическим выво дам на основе изучения этих данных.
Предметом математической статистики, как самостоятель ной научной дисциплины, является формальная математиче ская сторона статистического метода исследования, безраз личная к специфической природе изучаемых объектов. Отсю да большая универсальность ее методов и их научная беспри страстность. Однако на пути распространения методов мате матической статистики стоит одно чрезвычайно серьезное препятствие — сложность вычислений.
Задачи обработки результатов экспериментальных наблю
дений, |
выравнивания динамических |
рядов и вычисления |
1 В. |
И. Л е н и н. Поли. собр. соч., т. 42, |
стр. 343. |
4
корреляционных уравнений, с точки зрения автоматизации процесса решения, являются наиболее важными в экономи ко-статистическом анализе не только потому, что они слож ны, а главным образом потому, что на основе их решения проверяются гипотезы, делаются выводы и заключения о раз личных закономерностях в протекании сложных экономиче ских процессов.
Основной идеей данной работы является использование свойств сумм последовательных степеней натурального ряда чисел при решении систем нормальных уравнений с равноот стоящими узлами, получающихся при применении метода наименьших квадратов в экспериментальных исследованиях.
Теоретической основой работы является система формул, позволяющая определять элементы обратных матриц, нахо дить и оценивать параметры регрессионных уравнений двух факторных корреляционных моделей.
Практической целью работы является составление таблиц, позволяющих максимально упростить и облегчить труд вы числителя при аппроксимации параметров уравнений, связы вающих результаты опытных исследований.
На конкретных экономических примерах осуществляется сопоставление и оценка результатов, полученных с помощью различных методов аналитического выравнивания и даются практические рекомендации.
В пособии излагается метод, с помощью которого эконо мист-практик сможет определять параметры регрессионных уравнений и уравнений динамики не только без решения си стемы нормальных уравнений, но даже без составления и выписывания этой системы. Для этого на ЭВМ были состав лены таблицы, с помощью которых можно аппроксимировать некоторыми функциями до 100 экспериментальных точек.
Эти функции могут иметь следующий вид:
1. Полиномы
y — a0 + aix+... + am-i х т~1 .
2. Суперпозиция полинома и экспоненты
у — 10а° + а'х + • ■ • + ат -1 хП *
3. Дробно-рациональная функция
, а\ I |
ат- 1 |
y — a.Q-\-----+ ... |
Хт-1 |
X |
4. Логарифмическо-линейная функция
y = a0+ ailgx.
5
5. Логарифмическо-полиномиальная функция y=ao-\-a\X+a,2\gx.
6. Степенная функция
у= аоХа' .
7.Произведение степенной и показательной функции
у—аоХа' ахз .
8.Линейная функция двух независимых переменных
f(x, у) =aoo-t-au,x+aoiy.
9. Квадратическая функция двух независимых переменных f(X>у) —в\оХ + во\у-^-в цху + в2оХ2+ во2У2 воо-
Г Л АВ А 1
ОСНОВНЫЕ МЕТОДЫ АППРОКСИМАЦИИ ФУНКЦИЙ, ПРИМЕНЯЕМЫЕ В ЭКОНОМИКО-СТАТИСТИЧЕСКОМ АНАЛИЗЕ
§ 1. Выравнивание статистических рядов
Пусть производится наблюдение множества однородных объектов, так называемое статистическое наблюдение. Мно жество однородных объектов называется статистической со вокупностью. Каждый из этих объектов характеризуется не которым признаком, изменение которого (вариацию) мы будем рассматривать.
Первичным результатом статистического наблюдения яв ляется перечень членов совокупности и соответствующих им значений признака (вариант). Такой перечень называется рядом вариант или простым статистическим рядом.
Простой статистический ряд подвергают первичной обра ботке, т. е. группируют члены совокупности, принимающие либо одни и те же значения признака, либо значения внутри определенного интервала. Результат группировки, представ ленный двумя рядами чисел — значениями признака (или ин тервалами) и соответствующими им частотами, называют ста тистическим (вариационным) рядом.
В случае группировок по интервалам ряд называется ин тервальным, а в случае группировок по отдельным вариан там — дискретным.
Интервальные ряды часто встречаются при экономических и демографических исследованиях, например при изучении
6
распределения работающих по размеру заработной платы, распределения мигрирующего населения по возрастным груп пам, вступивших в брак по группам возрастов и т. д.
Дискретные ряды часто используются при экономическом анализе таких процессов, как распределение рабочих по чис лу обслуживаемых станков, распределение учащихся средних школ по классам и т, д.
При анализе статистических рядов находят уравнение регрессии, т. е. уравнение линии, показывающей плавное из менение зависимой переменной под влиянием изменений не зависимой переменной, освобожденной от действия всех по сторонних, не учтенных в данных условиях причин.
Кроме того, большое значение в экономике имеют ряды динамики. Рядом динамики называется ряд чисел, характери зующих изменение величины общественного явления во вре мени. Примерами рядов динамики могут служить данные о произведенном национальном доходе СССР по годам, данные
оросте выплавки стали, о жилищном строительстве в СССР
ит. д. Ряды динамики могут быть интервальными и момент-
ными.
Примером интервального ряда могут служить данные об общем объеме капитальных вложений в .нашей стране но го дам, а примером моментного ряда — данные об объеме не завершенного строительства на государственных предприя тиях.
При помощи построения и анализа рядов динамики вы являются закономерности и особенности развития обществен ных явлений (периодические и сезонные колебания и др.). При анализе рядов динамики находят общую тенденцию в изменениях показателей ряда — ось кривой или тренд, ко
торый характеризует плавное изменение явлений во времени,!/ освобожденное от действия посторонних факторов.
Статистический ряд показывает изменение явления во времени или в пространстве. Выравнивание статистических рядов дает возможность производить сравнение явлений как в процессе их развития во времени, так и по различным фор мам и видам процессов, обнаружить взаимную зависимость явлений.
Термин «выравнивание» означает приведение в соответ-' ствие с данными, непосредственно полученными из наблюде ния, ряда чисел, изменяющихся по определенному закону. Математически выравнивание заключается в изыскании фор мулы, связывающей выровненные значения со значениями аргумента, по которому .производится выравнивание.
К аналитическим методам выравнивания относятся: вы равнивание по прямой и выравнивание полиномами различ ных порядков. При использовании полиномов высоких сте-
7
пеней применяются различные способы, сокращающие свя занный с этим труд. Эти способы, сводящие процесс отыска ния параметров к серии операций на суммирующих машинах, являются весьма полезными при проведении обширных эко номических исследований. Их применение облегчается созда нием специальных таблиц.
Стремление максимально приблизиться к описанию иссле дуемых процессов привело к необходимости проверки все более сложных видов зависимостей. Разработаны различные математические методы анализа статистических рядов, мно гие из которых созданы для оценки регрессий и трендов, воз никающих при усреднениях, причем вид этих кривых бывает довольно сложным, а степень полиномов весьма высокой.
Выравнивание непосредственно связано с аппроксима цией функций, что означает приближенное выражение одних функций другими. Математическая статистика использует аппроксимацию функций для оценки близости эмпирических распределений к теоретическим и во многих других задачах.
Классические методы обработки экспериментальных дан ных, используемые в точных науках вполне пригодны к оцен ке и переработке экономической информации.
|
§ 2. |
Краткие |
исторические сведения |
1 |
января 1801 года Иосиф Пиацци в Палермо открыл пла |
||
нету— астероид |
Цереру |
(первую малую планету между |
Марсом и Юпитером). Наблюдения Пиацци охватывали толь ко 9° орбиты планеты. Об этом открытии астрономы Европы узнали только через несколько месяцев, когда планета скры лась в лучах солнца.
Чтобы найти планету, нужно было |
вычислить |
элементы |
|
ее орбиты, а |
в .наблюдения Пиацци |
вкрались |
случайные |
ошибки, что |
затрудняло вычисления. |
Поэтому и |
обратили |
внимание на удивительную точность эфемерид, вычисленных немецким математиком Карлом Фридрихом Гауссом. Гаусс по небольшому числу наблюдений Пиацци весьма точно ука зал положение Цереры на небе и она была сразу обнаруже на. Теоретической основой для этих вычислений явился «ме тод наименьших квадратов», разработанный и примененный им в 1794 году.
К- Ф. Гаусс обычно не торопился с опубликованием своих трудов, поэтому случилось так, что первой печатной работой по методу наименьших квадратов была книга французского математика А. М. Лежандра «Новые методы для определе ния орбит комет», выпущенная в свет в 1806 году, в которой он дал первое изложение метода наименьших квадратов, найденного им самостоятельно и независимо от К- Ф. Гаусса.
8
К. Ф. Гаусс опубликовал свою первую работу по методу наименьших квадратов в 1809 г., где дал ему вероятностное обоснование.
Второе, принципиально отличное от Гаусса, вероятност ное обоснование метода наименьших квадратов дано Лапла сом в «Аналитической теории вероятности», изданной в 1812 году.
Однако оба эти обоснования имели принципиальные не достатки, поэтому К. Ф- Гауссом в 1826 году было опублико вано совершенно новое решение задачи о комбинации наблю дений, которое опять привело к методу наименьших квад ратов.
Недостатки обоснований Гаусса и Лапласа были устране ны работами русских математиков-академиков П. Л. Чебы шева, А. А. Маркова и А. М. Ляпунова, превративших метод наименьших квадратов в строгую последовательную теорию, одним из приложений которой является математическая об
работка наблюдений. |
|
|
В 1859 г. П. Л. Чебышев (1821— 1894 |
г.г.) опубликовал |
|
теорию интерполирования по методу |
наименьших квадратов. |
|
Бго ученик академик А. А. Марков |
(1856— 1922 гг.) внес |
|
в эту работу ряд весьма важных |
идей, |
поясняющих суть |
метода наименьших квадратов, а в |
1913 |
г. создал классиче |
ский труд «Исчисление вероятностей», в VI главе которого с исчерпывающей глубиной изложен метод наименьших квад ратов.
Много работал в области метода наименьших квадратов проф. А. С. Чеботарев, перу которого принадлежит более 150 работ, в том числе фундаментальный учебник по методу наименьших квадратов [14].
Создателями оригинальных руководств и учебников по ме тоду наименьших квадратов являются проф. Н. Н. Идельсон [8], проф. П. И. Шилов [181, чл. корр. АН СССР Ю. В. Линник [9] и др.
Теория ошибок и метод наименьших квадратов в настоя щее время являются самостоятельной научной дисциплиной. Методом наименьших квадратов можно пользоваться для установления эмпирических формул на основании материа ла, добытого с помощью наблюдения или эксперимента.
Специальный математический аппарат-теорию наилучше го приближения функций впервые глубоко разработал крупнейший русский ученый П. Л. Чебышев. Эта теория при жизни Чебышева и после его смерти разрабатывалась уче ными всего мира. Затем она разрослась в большой самосто ятельный раздел математики: почти все наиболее существен ные результаты в этой области принадлежат русской мате-
9
матичеокой школе, основоположником и создателем которой является Чебышев.
Теория нанлучшего приближения функций в настоящее время нашла широкое практическое применение в экономике и технике. Круг конкретных задач, для разрешения которых Чебышев ее создал, значительно расширился, а эффективные практические методы неустанно разрабатываются.
В связи с появлением ЭВМ ученые, работающие в этой области, начинают все чаще и чаще обращаться к работам Чебышева. На праздновании 200-летнего юбилея Академии наук СССР, а также на заседании, посвященном 50-летию со дня смерти Чебышева, многие ученые говорили о настоятель ной необходимости самого полного и тщательного изучения научного .наследия этого выдающегося математика (акаде мики Н. Г. Бруевич, И. И. Артоболевский и др.).
Основная установка Чебышева состоит в следующем: «Практическая деятельность человека представляет чрезвы чайное разнообразие и для удовлетворения ее требований, разумеется, недостает науке многих и различных метод. Но из них особенную важность имеют те, которые необходимы для решения различных видоизменений одной и той же за дачи, общей для всей практической деятельности человека: как располагать средствами своими для достижения по воз можности большей выгоды». [15]
Из этой оснозной установки вытекает лейтмотив всех ра бот Чебышева в области теории наилучшего приближения функций — заменить точное решение задачи приближенным так, чтобы погрешность, получающаяся при этой замене, бы ла наименьшей.
В 1946 году академик В. С. Немчинов изложил систему статистическо-математических вычислений в полиномах Че бышева, позволяющую производить все расчеты на ЭВМ. [10]
Необходимо упомянуть и работу В. И. Хотимского [13], в которой даются весьма удобные таблицы для нахождения уравнений параболических кривых.
Та же задача — упрощения вычислений при использовании метода наименьших квадратов — рассматривалась в работе «О связном анализе статистических рядов», написанной груп пой авторов — бывших студентов статистического отделения МГУ: Боярским, Писаревым, Старовским под руководством профессора Б. С. Ястремского. [19].
Весьма значительными представляются работы советских ученых Н. С. Четверикова — представителя «чупровской» школы и В. Д. Пирятина из Харьковского университета.
М. В. Игнатьев и Н. С. Четвериков составили и опубликова
10