- •Основы юридической статистики
- •1. Понятие юридической статистики
- •2. Первичная обработка материалов массовых статистических наблюдений
- •3. Графическое представление статистического распределения
- •4. Числовые характеристики статистического распределения
- •5. Ряды динамики
- •5.1. Понятие о рядах динамики и их виды
- •5.2. Показатели, характеризующие тенденцию динамики
- •5.3. Расчет параметров тренда
- •5.4. Показатели колеблемости
- •5.5. Прогнозирование на основе тренда и колеблемости
- •6. Статистические взаимосвязи
- •6.1. Функциональная и корреляционная зависимости
- •6.2. Условия применения корреляционно-регрессионного анализа
- •6.3. Задачи корреляционно-регрессионного анализа
- •6.4. Парная линейная корреляция
6.2. Условия применения корреляционно-регрессионного анализа
Первым условием возможности изучения корреляции является общее условие всякого статистического исследования - наличие данных по достаточно большой совокупности явлений. Какое именно число явлений достаточно для анализа корреляционной связи, зависит от цели анализа, требуемой точности и надежности параметров связи, от числа факторов, корреляция с которыми изучается. Обычно считают, что число наблюдений должно быть не менее, чем в 5-6, а лучше - не менее, чем в 10 раз больше числа факторов7. При большом числе наблюдений вступает в действие закон больших чисел, обеспечивающий взаимное погашение случайных отклонений от закономерного характера исследуемой связи.
Вторым условием возможности изучения корреляционной связи служит условие, обеспечивающее достоверное выражение закономерности в средней величине, для чего необходима качественная однородность исследуемой совокупности. Например, не следует объединять в одну совокупность преступления, совершаемые обычными гражданами, с преступлениями, совершаемыми лицами, отбывающими наказание в исправительно-трудовых учреждениях, поскольку указанные преступления имеют существенные отличия.
Третьим условием корреляционного анализа является необходимость подчинения распределения совокупности по результативному Y и факторному X признакам нормальному закону распределения. Это условие связано с используемым при корреляционном анализе математическим аппаратом, дающим достоверную оценку параметров корреляции только при нормальном распределении. Однако на практике это условие чаще всего выполняется приближенно, но и в этом случае получаемые результаты обладают достаточной надежностью8. При значительном отклонении распределений признаков от нормальных нельзя оценивать надежность корреляции, используя параметры данного распределения или распределения Стьюдента9.
6.3. Задачи корреляционно-регрессионного анализа
Изучение корреляционной связи преследует две цели:
1) Определение параметров уравнения, выражающего связь средних значений зависимой переменной со значениями независимой переменной.
2) Измерение тесноты связи двух признаков между собой.
Основным методом достижения первой цели является метод наименьших квадратов, разработанный К.Ф.Гауссом10. Он состоит в минимизации суммы квадратов отклонений фактически измеренных значений зависимой переменной Y от ее значений, вычисленных по уравнению связи с факторным признаком X.
Для измерения тесноты связи могут применяться различные показатели, основным из которых является коэффициент детерминации. Данный коэффициент вычисляется как отношение межгрупповой дисперсии результативного признака (характеризует влияние различий группировочного факторного признака на среднюю величину результативного признака) к общей дисперсии результативного признака (характеризует влияние на него всех причин и условий) и позволяет оценить влияние факторного признака на результативный.
,
где k - число групп по факторному признаку;
N - число единиц совокупности;
yi - индивидуальные значения результативного признака;
fi - частота в j-ой группе;
-
средние групповые значения результативного
признака;
-
среднее значение результативного
признака;
Корреляционный анализ позволяет с одной стороны, используя уравнение корреляционной связи, измерить зависимость между вариацией результативного признака и вариацией факторного признака, а с другой - используя меры тесноты связи, измерить долю вариации результативного признака, которая связана корреляционно с вариацией факторного признака.
К задачам, традиционно решаемым с помощью корреляционно-регрессионного метода, относятся:
1. Задача выделения важнейших факторов, влияющих на результативный признак (т.е. на вариацию его значений в совокупности). Эта задача решается в основном на базе тех или иных мер тесноты связи факторных признаков с результативным признаком.
2. Задача оценки деятельности по эффективности использования имеющихся ресурсов. Эта задача решается путем расчета для каждой единицы совокупности тех величин результативного признака, которые были бы получены при средней по совокупности эффективности использования факторов и сравнения их с фактическими результатами деятельности.
3. Задача прогнозирования возможных значений результативного признака при задаваемых значениях факторных признаков. Такая задача решается путем подстановки ожидаемых значений факторных признаков в уравнение связи и вычисления ожидаемых значений результативного признака. Приходится решать и обратную задачу - вычисление необходимых значений факторных признаков для обеспечения планового или желаемого значения результативного признака в среднем по совокупности. Эта задача обычно не имеет единственного решения в рамках данного метода и должна дополняться постановкой и решением оптимизационной задачи на нахождение наилучшего по определенному критерию варианта из множества возможных решений.
4. Задача подготовки данных, необходимых в качестве исходных для решения оптимизационных задач. Например, при разработке критериев оценки деятельности основных служб органов внутренних дел.
При решении каждой из названных задач нужно учитывать особенности и ограничения корреляционно-регрессионного метода. К числу таких особенностей относятся проблемы разделения влияния каждого из действующих факторов на результативный признак, необходимость специально обосновывать возможность причинной интерпретации уравнения как объясняющего связь между вариацией фактора и результата и некоторые другие. Следует так же помнить, что метод корреляционно-регрессионного анализа не может объяснить роли факторных признаков в создании результативного признака.
