- •Волков Сергей Николаевич землеустройство экономико-математические методы и модели
- •Раздел I
- •Глава 1
- •1.2. Математические методы, применяемые в экономических расчетах
- •Глава 2
- •1. Классификация математических моделей, применяемых в землеустройстве
- •Вычислении площадей треугольников и четырехугольников
- •4.3. Метод решения задачи на условный экстремум лагранжа
- •Глава 5
- •4. Годовые затраты на 1 га пашни в зависимости от размера территории (зерно-свекловичный тип хозяйства с развитым молочно-мясным скотоводством)
- •5.3. Определение оптимальных размеров полей севооборотов
- •5. Расчет оптимального размера поля севооборота
- •Глава 6 итерационные методы
- •6.1. Постановка и математическая формулировка
- •8. Расчет координат оптимального размещения ферм методом последовательных приближений
- •9. Расчет координат животноводческих комплексов
- •10. Расчет оптимальных координат молочного комплекса при селешш Большая Вруда (итерационный метод)
- •11. Анализ эффективности размещения животноводческих комплексов (тыс. Руб., в ценах 1990 г.)
- •12. Расчет значения предельной ошибки целевой функции
- •Раздел III
- •Глава 7
- •Глава 8 расчет параметров производственных функций
- •13. Исходные данные к задаче 8.1
- •8.2. Принцип наименьших квадратов
- •8.3. Системы нормальных уравнений
- •16. Исходные данные к задаче 8.2
- •18. Исходные данные к задаче 8.3
- •8.5. Применение линейных моделей регрессии
- •22. Исходные данные к задаче 8.5
- •Глава 9
- •9.2. Оценка погрешностей определения коэффициентов корреляции
- •25. Корреляционные и дисперсионные характеристики демонстрационных задач
- •26. Формулы для расчета экономических характеристик некоторых однофакторных производственных функций
- •27. Формулы для расчета предельных норм заменяемости для некоторых двухфакторных производственных функций
- •10.2. Примеры расчета экономических характеристик
- •28. Зависимость коэффициента эластичности Ег от стоимости животноводческих построек (х2)
- •Раздел IV
- •Глава 11
- •33. Расчет бета-коэффициентов уравнения регрессии
- •11.3. Обоснование укрупнения (разукрупнения)
- •Контрольные вопросы и задания
- •Глава 12
- •35. Расчет урожайности зерновых культур на землях различных категорий с учетом изменения факторов интенсификации
- •36. Динамика урожайности сельскохозяйственных культур в совхозе «40 лет Октября»
- •38. Планируемая урожайность, рассчитанная с использованием производственных функций, ц с 1 га
- •39. Основные показатели эффективности внесения минеральных удобрений на черноземных почвах
- •40. Расчет планируемой урожайности основных сельскохозяйственных культур по факторам интенсификации расчетпо конструктивным методом
- •41. Возможные урожаи полевых культур при 3 % использования фар
- •42. Сводные данные по планированию урожайности в совхозе «40 лет Октября»
- •Глава 13
- •43. Зависимость между размерами молочной фермы и удельными капиталовложениями
- •44. Расчет параметров уравнения гиперболы
- •46. Влияние механического состава почв на величину удельного сопротивления, кг/см2
- •47. Расчет значений коэффициента а2
- •54. Потери на холостые повороты агрегатов при поперечных работах и от недобора продукции пропашных культур в полосе поворотов при различной густоте лесных полос
- •55. Экономическая эффективность продольных (основных) полезащитных лесных полос при различной густоте посадок
- •57. Чистый доход в расчете на 1 га полевого севооборота
- •58. Влияние густоты сети полевых дорог на общую величину транспортных затрат и потерь от недобора продукции
- •1 Га пашни,
- •1 Га пашни,
- •60. Определение коэффициентов значимости факторов производственной функции
- •Раздел V
- •Глава 14 общая модель линейного программирования
- •63. Исходные данные к задаче 14.2
- •64. Исходные данные к задаче 14.3
- •65. Исходные данные к задаче 14.4
- •67. Характеристика вершин области допустимых значений задачи 14.5
- •68. Первая симплекс-таблица задачи 14.5
- •69. Вторая симплекс-таблица задачи 14.5
- •70. Третья симплекс-таблица задачи 14.5
- •71. Четвертая симплекс-таблица задачи 14.5
- •72. Пятая (последняя) симплекс-таблица задачи 14.5
- •74. Исходные данные к задаче 14.6
- •75. Исходные данные к задаче 14.7
- •76. Оптимальное решение прямой задачи 4.6
- •78. Оптимальное решение прямой задачи 4.7
- •79. Оптимальное решение двойственной задачи
- •Глава 15 распределительная (транспортная) модель
- •80. Исходные данные к задаче 15.1
- •81. Исходные данные к задаче 15.2
- •82. Исходные данные к задаче 15.3
- •83. Исходные данные к задаче 15.4
- •84. Табличная форма представления транспортной модели
- •85. Исходные данные к задаче 15.5
- •86. Нахождение опорного решения задачи 15.5 методом минимального
- •87. Нахождение опорного решения задачи 15.5 методом аппроксимации*
- •15.3. Метод потенциалов
- •88. Цикл испытуемой клетки (3,5)
- •89. Цикл испытуемой клетки (2,5)
- •90. Потенциалы и оценки* для опорного решения задачи 15.5, полученного методом аппроксимации
- •91. Потенциалы и оценки* для опорного решения задачи 15.5, полученного методом минимального элемента
- •92. Потенциалы и оценки на втором шаге решения задачи 15.5
- •93. Потенциалы и оценки на третьем шаге решения задачи 15.5
- •94. Оптимальный план закрепления источников кормов за фермами
- •15.4. Особые случаи постановки и решения распределительных задач
- •95. Исходные данные к задаче 15.6
- •96. Сбалансированная исходная транспортная таблица задачи 15.6
- •97. Исходная транспортная таблица задачи 15.6, в которой учтены требование сбалансированности задачи и первые три дополнительных условия*
- •101. Оптимальный план распределения кормовых культур по участкам
- •102. Исходные данные к задаче 15.7
- •103. Опорный план задачи 15.7
- •104. Второй (оптимальный) план задачи 15.7
- •106. Опорный план задачи 15.3
- •107. Оптимальный план задачи 15.3
- •108. Средние значения коэффициентов урожайности культур в зависимости
- •Глава 16
- •109. Последняя симплекс-таблица для задачи 14.4
- •16.2. Коэффициенты замещения
- •16.3. Использование коэффициентов замещения
- •113. Исходные данные к задаче 16.1
- •114. Оптимальное решение прямой задачи 16.1
- •115. Оптимальное решение двойственной задачи 16.1*
- •16.6. Альтернативные решения распределительных задач
- •117. Исходные данные к задаче 16.2
- •121. Оптимальное решение задачи 16.2 с дополнительным условием (пример 1)*
- •Глава 17
- •122. Исходные данные к задаче 17.1
- •123. Исходная симплекс-таблица задачи 17.1
- •124. Первая расчетная симплекс-таблица 17.1
- •17.3. Роль ограничений в формировании облика
- •Глава 18
- •130. Исходная таблица
- •131. Оптимальный план
- •132. Исходная таблица
- •133. Первый оптимальный план
- •134. Промежуточный опорный план
- •135. Последний оптимальный план
- •136. Вероятностный и детерминированный планы
- •139. Исходные и расчетные данные для вычисления значений ресурсов в ограничениях
- •140. Исходные данные для вычисления коэффициентов целевой функции
- •141. Исходные данные для расчета гц
- •142. Схема двухэтапной стохастической задачи
- •143. Схема числовой стохастической модели оптимизации производственной структуры
- •Контрольные вопросы и задания
- •Раздел VI
- •Глава 19 информационное обеспечение моделирования
- •19.3. Построение матрицы экономико-математической
- •Контрольные вопросы и задания
- •Глава 20
- •146. Баланс гумуса в почве под посевами различных сельскохозяйственных культур
- •Глава 21
- •147. Вычисление значений ак1
- •148. Числовые значения ак1*
- •Раздел VII
- •152. Сведения о максимально возможных объемах и эффективности различных мероприятий по освоению и интенсификации использования земель
- •153. Матрица экономико-математической модели задачи оптимизации мероприятий по освоению и интенсификации использования
- •Контрольные вопросы и задания
- •Глава 23
- •154. Основные переменные
- •155. Исходные данные
- •23.2. Оптимизация трансформации
- •157. Качественная характеристика участков
- •158. Расчет значения Сд для полевого севооборота № 1 по 1-му участку
- •159. Оптимизация трансформации угодий
- •161. Расчет капитальных затрат на трансформацию угодий
- •162. Сводная таблица оценки вариантов, тыс. Руб.
- •Глава 24
- •163. Исходные данные для системы ограничений
- •164. Ориентировочные коэффициенты изменения урожайности культур в зависимости от их предшественников по отношению к средней урожайности хозяйства (зона неустойчивого увлажнения)
- •165. Расчет с,- по полевому севообороту
- •166. Доля сельскохозяйственных культур в рекомендуемых к освоению севооборотах
- •167. Исходные данные для построения экономико-математической модели задачи
- •168. Матрица задачи по проектированию системы севооборотов хозяйства
- •24.2. Размещение севооборотов и сельскохозяйственных
- •170. Фрагмент матрицы оптимального размещения культур (севооборотов) по участкам с различным плодородием
- •171. Фактическое размещение посевов сельскохозяйственных культур
- •172. Оценка предшественников сельскохозяйственных культур
- •173. Матрица задачи по оптимизации плана перехода к запроектированным севооборотам
- •174. Корректировка плана перехода к запроектированным севооборотам
- •175. Структура посевов после корректировки, га
- •176. Окончательный план перехода к запроектированным севооборотам
- •Глава 25
- •25.2. Особенности подготовки исходной информации и пример решения
- •178. Состав и площадь сельскохозяйственных угодий на год землеустройства и по проекту
- •179. Число работников и общий объем трудовых ресурсов
- •Глава 26
- •181. Матрица экономико-математической модели задачи проектирования противоэрозионных мероприятий
- •182. Результаты решения задачи проектирования противоэрозионных мероприятий
- •184. Расчет допустимого слоя стока
- •185. Зависимость площадей линейных элементов организации территории
- •26.3. Оптимизация размещения посевов
- •188. Исходная матрица задачи
- •Глава 27
- •27.2. Особенности подготовки
- •191. Результаты решения задачи организации территории плодовых и ягодных многолетних насаждений
- •Глава 28
- •28.2. Особенности подготовки исходной информации и пример решения
- •192. Допустимые площади кормовых культур и пастбищ*
- •193. Расчет потребности в зеленом корме
- •194. Расчет потребности в кормах с пашни
- •Контрольные вопросы и задания
- •Глава 29
- •199. Результаты решения экономико-математической задачи
- •Контрольные вопросы и задания
- •Раздел VIII
- •Глава 30
- •30.2. Особенности подготовки исходной информации и пример решения
- •200. Продолжительность рабочего периода в крестьянском хозяйстве
- •201. Нормы внесения минеральных удобрений под сельскохозяйственные культуры, кг д. В. На 1 т продукции*
- •202. Технико-экономические характеристики животноводческих хозяйств*
- •204. Математическая модель молочно-картофелеводческого крестьянского хозяйства
- •205. Выход кормов с 1 га культурных пастбищ
- •206. Оптимальные размеры землевладений и структура производства в крестьянском хозяйстве молочно-картофелеводческого направления
- •30.3. Автоматизация расчетов модели на эвм
- •207. Значения переменных задачи
- •31.2. Особенности подготовки
- •209. Состав земельных угодий до и после перераспределения земель
- •Глава 32
- •32.1. Экономико-математическая модель
- •32.2. Экономико-математическая модель
- •210. Исходная матрица задачи
- •211. Оптимальный план формирования сырьевых зон перерабатывающих предприятий
- •Контрольные вопросы и задания
- •Литература
- •Раздел I. Общие сведения об экономико-математических методах и моделировании в землеустройстве 9
- •Глава 1. Моделирование и современные методы вычислений 9
- •Глава 2. Основные этапы развития математического моделирования в аграрно- экономической и землеустроительной науке 32
- •Глава 3. Классификация математических моделей, применяемых в земле устройстве 57
- •Раздел II. Аналитическое моделирование в земле устройстве 72
- •Глава 4. Построение и исследование аналитических моделей 72
- •Глава 5. Применение дифференциального и интегрального исчисления при построении оптимизационных аналитических моделей 92
- •Глава 9. Оценка производственных функций с использованием методов корре ляционно-регрессионного анализа 161
- •Глава 10. Экономические характеристики производственных функций и
- •Раздел IV. Применение производственных функций
- •Глава 11. Оптимизация интенсивности использования земли при землеуст ройстве 197
- •Глава 12. Планирование урожайности сельскохозяйственных культур 209
- •Глава 13. Разработка землеустроительных нормативов и решение нестан дартных задач 234
- •Раздел V. Методы математического программирования
- •Глава 14. Общая модель линейного программирования 261
- •Глава 15. Распределительная (транспортная) модель 303
- •Глава 16. Анализ и корректировка оптимальных решений 344
- •Глава 17. Дополнительные аспекты решения задач линейного программиро вания 383
- •Глава 18. Некоторые виды задач математического программирования 398
- •Раздел VI. Основы экономико-математического моделирования 436
- •Глава 19. Информационное обеспечение моделирования 436
- •Глава 20. Выбор переменных и построение ограничений задачи 451
- •Глава 21. Критерии оптимальности при решении землеустроительных задач 474
- •Раздел VII. Экономико-математические модели
- •Глава 22. Экономико-математическая модель оптимизации мероприятий
- •Глава 23. Экономико-математическая модель трансформации угодий 506
- •Глава 24. Экономико-математическая модель организации системы сево оборотов хозяйства 519
- •Глава 25. Экономико-математическая модель оптимизации структуры посевных площадей при агроэкономическом обосновании проектов внутрихо зяйственного землеустройства 553
- •Глава 26. Экономико-математическая модель проектирования комплекса противоэрозионных мероприятий в условиях развитой водной эрозии почв 566
- •Глава 31. Экономико-математическая модель оптимизации перераспреде ления земель сельскохозяйственных предприятий 614
- •Глава 32. Экономико-математические модели в схемах землеустройства 659
9.2. Оценка погрешностей определения коэффициентов корреляции
Коэффициенты корреляции рассчитываются по выборкам и соответственно имеют статистический характер. Фактически они являются функциями случайных величин .у, хь...,л;#. В связи с этим правомерен вопрос о достоверности расчета коэффициентов по приведенным соотношениям. Ниже приводится ряд формул, позволяющих оценить указанную достоверность. Формулы
164
получены методами математической статистики на основе ряда весьма существенных допущений, основным из которых является предположение о нормальности частных распределений величин у, х{,...,хкв генеральной совокупности. Несмотря на грубость такого допущения в большинстве реальных ситуаций, получаемые на его основе выводы относительно достоверности выборочных оценок коэффициентов корреляции приемлемы с практической точки зрения.
Стандартная (среднеквадратическая) ошибка определения выборочного значения коэффициента парной корреляции при достаточно большой выборке (Л^> 50) может быть оценена по формуле
1-/-2 При малых выборках (Л"< 30)
Стандартные ошибки определения коэффициента множественной корреляции г у, х\, ..., хкн корреляционного отношения Л могут быть оценены по формулам
в случае #> 50
ад:
1-^2
в случае #00
| 1-Л2
где Ы— объем выборки; К— число факторов.
Значение стандартной ошибки позволяет оценить достоверность расчета коэффициентов корреляции. Грубая оценка может быть получена в соответствии с «правилом трех сигм»: если \)\ » Зо>, то выборочная оценка коэффициента корреляции приемлема. Для более полных оценок погрешностей необходим учет закона распределения коэффициентов корреляции.
При больших выборках (7У> 50) можно приближенно полагать, что выборочный коэффициент парной корреляции г распределен по нормальному закону. При таком предположении до-
165
верительный интервал для оценки коэффициента корреляции г0 в генеральной совокупности определяется из соотношения
г-{рсг<г0<г + 1роп где р — уровень доверительной вероятности.
Величина 1Р определяется из уравнения:
Ф(0 =р, (9.2)
где Ф(?) — функция Лапласа (интеграл вероятностей):
х2
Ф(')=-7=/'~ТЛ-
л/2я о
Решение уравнения (9.2) находится с помощью таблиц значений функции Лапласа (см. Приложение к данной главе).
Приведенные соотношения могут быть использованы для ориентировочной оценки доверительных интервалов для г0 в случае Л"< 50, а также для грубых оценок доверительных интервалов для сводного коэффициента корреляции и корреляционного отношения из генеральной совокупности.
Для некоторых частных случаев могут быть получены более точные соотношения.
При малом объеме выборки (ЛК 30) и достаточно сильной корреляции (|а) > 0,7) закон распределения выборочного коэффициента парной корреляции существенно отличается от нормального. В этом случае может быть использована статистика вида
2=-Ы
2
1+г 1-г
Р. Фишером установлено, что статистика ^подчиняется закону, близкому к нормальному, со следующими параметрами: математическое ожидание:
М(2)=±Ы
>о
\-г0) 2(ЛГ-1)'
дисперсия:
В{2)=а]~ 1
где г0 — коэффициент корреляции в генеральной совокупности.
166
С учетом сказанного доверительный интервал для коэффициента /о определяется из соотношения (при Ж 30, \г\ > 0,7)
г 1 _ г 1
где т11~^у_1 +(р дг_з' г,2-^у_1 ~1р~]у^Т> /• —выборочный коэффициент корреляции; /,, —величина, определяемая по уравнению (9.2).
Помимо приведенных выше соотношений для определения доверительного интервала, с вероятностью р содержащего значение коэффициента корреляции из генеральной совокупности, в математической статистике выведены формулы для проверки значимости тех или иных гипотез.
Например, для проверки гипотезы о коэффициенте парной корреляции г0 = 0 (то есть предположения о том, что коэффициент корреляции из генеральной совокупности с доверительной вероятностью р не отличается значимо от нуля) в случае большого объема выборки (И> 50) используется критерий вида
где 1р имеет тот же смысл, что и в соотношении (9.2).
При выполнении неравенства сформулированная гипотеза считается верной. В противном случае она отвергается, то есть считается, что коэффициент корреляции значимо отличается от нуля.
При объеме выборки Ы< 30 для проверки той же гипотезы строится статистика
V1-'-2
распределенная по закону Стьюдента с числом степеней свободы ^ = N-2.
Критерий подтверждения гипотезы г0 = 0 имеет вид
где 1р и — Р-процентное (Р— 100/)) значение статистики I, определяемое по соответствующим таблицам для распределения Стьюдента с заданной доверительной вероятностью р и числу степеней свободы у (см. Приложение к данной главе).
167
9.3. ОЦЕНКА ЗНАЧИМОСТИ ПРЕДСТАВЛЕНИЯ ПРОИЗВОДСТВЕННОЙ ФУНКЦИИ, ПОЛУЧЕННОГО ПО РЕЗУЛЬТАТАМ ВЫБОРОЧНЫХ НАБЛЮДЕНИЙ
Обобщенно задачу, указанную в заголовке данного подраздела, можно понимать как оценку соответствия сглаженной зависимости у=/{х\,...,х%), используемой в качестве производственной функции, реальной стохастической зависимости результата производства у от производственных факторов хъ...,хК. Частично этот' вопрос мы уже затронули выше, дав содержательную интерпретацию коэффициентов корреляции и корреляционного отношения. Рассмотрим теперь его более подробно.
•Анализ выборочных коэффициентов корреляции позволяет сделать некоторые выводы относительно целесообразности использования сглаженных регрессионных зависимостей результата производства у от производственных факторов хи...,хк. Сначала целесообразно совместно оценить корреляционное отношение К и сводный коэффициент корреляции гу,х\,.-,хк' Если К<0,3 и гу;Х\,...,хк <0,3 (см. приведенную выше градацию тесноты связи по значению коэффициента корреляции), констатируется либо отсутствие значимой связи у с хь...,х^, либо неполнота исходной информации (малость выборки). В противном случае далее отдельно оценивается коэффициент множественной корреляции гу;х\,-,хк' При достаточной его величине (например, гу;х\,...,хк -0)8) можно предположить, что зависимость у от хь...,хк близка к линейной и, следовательно, производственную функцию можно представить в форме линейной регрессии; при
этом, однако, уровень «достаточности» величины гу;Х\,-,хк опРе" деляется чисто произвольно. При промежуточных значениях коэффициента корреляции О^г^ Хл,<0,8 признаком линейного характера регрессии может служить близость значений К и
гу\х\,-,хк'
При использовании приведенных рекомендаций следует учесть, что в случае сравнительно большого числа производственных факторов (К> 3) реальный нелинейный характер влияния одного из них на у при расчете коэффициента множественной корреляции может быть замаскирован линейным характером влияния других. В этом случае дополнительную информацию может дать анализ всей матрицы коэффициентов парной корреляции.
Последнее замечание подчеркивает вспомогательный характер рассмотренной процедуры определения допустимого класса функций при построении регрессии у на хи...,хк.
Рассмотрим теперь вопрос о степени влияния производствен-
168
пых факторов Хх,...,хк на результат производства у. При этом случайной будем считать только величину у, а величины х\,...,хк— неслучайными независимыми переменными.
В математической статистике указанный вопрос решается на основе анализа дисперсий отклонений сглаженных значений
У3 =/[х(>■••>хк) от среднего наблюдаемого у[Х>реГ), а также отклонений наблюдаемых величин у-1' от сглаженных значений, то есть от линии регрессии (Д,ст):
Помимо указанных дисперсий вводится их сумма:
В случае линейной регрессии указанная сумма равна выборочной дисперсии величины у:
По смыслу введенных дисперсий чем больше отношение /Ррег/Аэбщ. тем большую роль в изменении наблюдаемых значений у играет зависимость результатов производства от факторов х\,...,хк. В пределе при 1\>ег/А>бщ = 1, Т0 есть при Дзст = О, все наблюдаемые точки лежат на линии (поверхность) регрессии — отклонения [у3-У3) равны нулю и, значит, линия (поверхность) регрессии полностью описывает зависимость у от х{,...,хк. В противном случае величина
п -°рег
7)—'
называемая коэффициентом детерминации, характеризует, какая доля изменений величины у обусловлена изменением факторов хи...,хк. Соответственно отношение В0С1/Оо6щ = 1 — В характеризует долю изменений величины у, обусловленных действием неучтенных факторов. Если, например, 5=0,9, то говорят, что порядка 90 % изменений величины у вызвано изменением производственных факторов хь...,хк, а около 10 % — влиянием неучтенных факторов.
Из определения суммы дисперсий 2)общ следует, что в случае линейной регрессии коэффициент детерминации равен квадрату
169
корреляционного отношения, то есть В = К2. Более того, можно показать, что в этом случае
В=К2=г2
у;х\,...,хк>
где величина гу;х\,...,хк формально рассчитывается по соотношению для выборочного коэффициента множественной корреляции, хотя при принятом выше предположении (хи...,хк — неслучайные независимые переменные) таковым не является.
Сохраняя указанное предположение, рассмотрим вопрос о доверительных границах, в которых расположены истинные (из генеральной совокупности) значения у с учетом разброса наблюдаемых значений у относительно линии регрессии и ошибок определения положения самой линии. Ограничимся случаем линейной регрессии для однофакторной зависимости у= а{ + а2х. В этом случае доверительные границы для у при заданном уровне доверительной вероятности р определяются соотношением
у{х)-^5^х)-1р^йу{х)< у(х)+ру(х)-(р^,
где 4, „ — значение случайной величины I, имеющей распределение Стьюдента с V = N — 2 степенями свободы, соответствующее заданному уровню р доверительной вероятности; Оу(х) —дисперсия у при заданном значении х.
Дисперсия Ву является функцией независимой переменной х и определяется соотношением
пу(х)=5у
N , . ^
1 (х-х)
где выборочная оценка $у дисперсии отклонения случайной независимой величины у от линии регрессии по определению равна:
при у-1=а1+а2х-'.
Соотношение для дисперсии получено с учетом погрешностей определения коэффициента регрессии а{ и свободного члена а2 в уравнении регрессии (у = щ + а2х).
170
20 I с!
25 30 35 40 45 50
Рис. 10. Доверительные границы для функции регрессии у (задача 8.1)
Для иллюстрации на рисунке 10 показаны доверительные границы для у при уровне доверительной вероятности р = 0,9, построенные по данным задачи 8.1.
Остановимся кратко на проблеме достаточности числа наблюдений N.
С формальной точки зрения при построении регрессионной
зависимости у=/(а1,...,а^;х1,...,х^) с Мпараметрами число наблюдений УУ должно быть не менее М. В противном случае система нормальных уравнений (при сведении их к линейным алгебраическим) будет вырожденной. Таким образом, минимальное ограничение на N таково: N> М. Однако с учетом требования статистической достоверности получаемых результатов ограничения на N существенно жестче. Действительно, несмещенная выборочная оценка для дисперсии отклонений случайной величины у от поверхности регрессии определяется соотношением
Следовательно, при N-* М дисперсия стремится к бесконечности, что говорит о статистической недостоверности регрессионной зависимости. Для получения достаточно надежных оценок параметров уравнения регрессии желательно выполнение неравенства N>М+ 50. На практике (в случае малых выборок) стремятся хотя бы обеспечить выполнение условия N>М+ 10.
171
Более строго вопрос о достаточном числе наблюдений N должен решаться с учетом содержания конкретной статистической задачи, так как оно зависит от вида выборки и от того, для оценки какой характеристики случайной величины она используется. Приведем формулы для расчета Я, если оценивается среднее значение у наблюдаемой случайной величины у. При этом предполагается, что уже проведена серия Яш пробных наблюдений над величиной у, которые позволяют оценить ее среднеквадрати-ческий разброс:
В этом случае требуемое число наблюдений N задается следующими соотношениями: для бесповторной выборки
^А2+<2рс2у'
для повторной выборки
,2„2
д2
где !р — величина, определяемая из уравнения (9.2) по заданной доверительной вероятности р; А — допустимая ошибка определения у с доверительной вероятностью, р; Л^ — число возможных значений величины у в генеральной совокупности.
Последняя из приведенных формул может использоваться, в частности, если случайная величина у может принимать любое значение в заданном интервале (то есть Л^ = °°).
Рассмотрим следующий пример: используя данные, приведенные в последнем столбце таблицы 13 в качестве результатов пробных наблюдений (Л^, = 12), оценить число наблюдений, при котором ошибка определения средней урожайности пшеницы в хозяйстве с доверительной вероятностью р = 0,95 не превысит А = 1 ц с 1 га. В данном случае среднеквадратический разброс урожайности в пробных наблюдениях а\,= 3,65 ц с 1 га; величина 1р, соответствующая вероятности р = 0,95, равна 1,96 (см. приложение). По формуле для бесповторной выборки имеем
^(■,96)'.(3,65)^5о
(О2
172
Таким образом, для достижения заданной точности оценки средней урожайности пшеницы число наблюдений должно быть не менее 50.
9.4. ПРИМЕРЫ КОРРЕЛЯЦИОННОГО АНАЛИЗА
Основываясь на приведенной выше методике, проведем корреляционный анализ исходных данных и результатов решения рассмотренных выше задач, а также оценим ряд дисперсионных характеристик. Основные результаты расчетов представлены в таблице 25; их анализ показывает следующее.
