- •Основные условные обозначения в математической статистике
- •Содержание
- •Введение
- •Основы теории вероятностей
- •1Предмет и метод математической статистики
- •2Понятие случайного события
- •3Вероятность случайного события
- •4Основные теоремы теории вероятностей
- •4.1Сложение вероятностей
- •4.2Умножение вероятностей
- •4.3Вычисление вероятностей
- •Случайные переменные
- •5Понятие случайной переменной
- •5.1Дискретные случайные переменные
- •5.2Непрерывные случайные переменные
- •6Математическое ожидание и дисперсия
- •7Моменты
- •Дискретные распределения
- •8Биномиальное распределение и измерение вероятностей
- •9Распределение редких событий (Пуассона)
- •Основные модели теоретических распределений
- •10Прямоугольное (равномерное) распределение
- •11Нормальное распределение
- •12Логарифмически нормальное распределение
- •Распределения параметров выборки
- •13.1Проблема Беренса–Фишера
- •15Χ2–распределение
- •Основы математической статистики
- •16Средние величины
- •16.1Общие свойства средних величин
- •17Средняя арифметическая
- •17.1Средний ранг (непараметрическая средняя)
- •17.2Взвешенная средняя арифметическая
- •17.3Средняя квадратическая
- •17.4Мода
- •17.5Медиана
- •18Средняя геометрическая
- •19Средняя гармоническая
- •Разнообразие значений признака
- •20Стандартное (среднеквадратическое) отклонение
- •20.1Число степеней свободы
- •20.2Коэффициент вариации
- •20.3Лимиты и размах
- •20.4Приближенные значения μ и
- •20.5Нормированное отклонение
- •21Проверка выпадов (артефактов)
- •22Средняя и сигма суммарной группы
- •23Скошенность (асимметрия) и крутизна (эксцесс) кривой распределения
- •Графическое представление распределений
- •24Вариационный ряд
- •25Гистограмма и вариационная кривая
- •26Кумулята
- •27Достоверность различия распределений
- •27.1Критерий χ2 (хи квадрат)
- •27.2Критерий λ (лямбда)
- •27.3Критерий по асимметрии и эксцессу
- •Нормальное распределение
- •28Генеральная совокупность и выборка
- •29Репрезентативность
- •30Ошибки репрезентативности и другие ошибки исследований
- •31Доверительные границы
- •Оценка генеральных параметров
- •32Общий порядок оценки
- •32.1Оценка средней арифметической
- •32.2Оценка средней разности
- •32.3Недостоверная и достоверная оценка средней разности
- •32.4Оценка разности генеральных средних
- •33Критерий достоверности разности
- •34Репрезентативность при изучении качественных признаков
- •35Достоверность разности долей
- •Парная корреляция
- •36Коэффициент корреляции
- •37Ошибка коэффициента корреляции
- •37.1Достоверность выборочного коэффициента корреляции
- •37.2Доверительные границы коэффициента корреляции
- •37.3Достоверность разности двух коэффициентов корреляции
- •38Уравнение прямолинейной регрессии
- •39Ошибки элементов уравнения прямолинейной регрессии
- •Частная и множественная линейные корреляции и регрессии
- •40Частный коэффициент корреляции
- •41Множественный коэффициент корреляции
- •42Линейное уравнение множественной регрессии
- •Криволинейная корреляция и регрессия
- •43Корреляционное отношение
- •44Свойства корреляционного отношения
- •45Ошибка репрезентативности корреляционного отношения
- •46Критерий линейности корреляции
- •Однофакторный дисперсионный анализ
- •47Сущность и метод дисперсионного анализа
- •47.1Результативный признак
- •47.2Фактор
- •47.3Градации факторов
- •47.4Градации комплекса
- •47.5Дисперсионный комплекс
- •47.6Статистические влияния
- •47.7Факториальное влияние
- •47.8Случайное влияние
- •47.9Общее влияние
- •48Однофакторный дисперсионный комплекс
- •Многофакторный дисперсионный анализ
- •49Многофакторный дисперсионный комплекс
- •50Преобразования
- •51Универсальное использование дисперсий
- •51.1Показатели силы влияний
- •51.2Ошибка репрезентативности основного показателя силы влияния
- •51.3Предельные значения показателей силы влияния
- •51.4Достоверность влияний
- •Классификация
- •52Дискриминантный анализ
- •52.1Постановка задачи, методы решения, ограничения
- •52.2Предположения и ограничения
- •52.3Алгоритм дискриминантного анализа
- •53Кластерный анализ
- •53.1Методы кластерного анализа
- •53.2Алгоритм кластерного анализа
- •Литература
- •Приложение. Основные формулы и определения
- •2 46019, Г. Гомель, ул. Советская, 104
40Частный коэффициент корреляции
Частный коэффициент корреляции – это показатель, измеряющий степень сопряженности двух признаков при постоянном значении третьего.
Математическая статистика позволяет установить корреляцию между двумя признаками при постоянном значении третьего, не ставя специального эксперимента, а используя парные коэффициенты корреляции rxy, rxz и ryz. Частные коэффициенты корреляции рассчитывают по формулам:
; (12.1)
; (12.2)
. (12.3)
Здесь в индексах буквы перед тире указывают, между какими признаками изучается зависимость, а буква после тире – влияние какого признака исключается (элиминируется). Ошибку и критерий значимости частной корреляции определяют по тем же формулам, что и парной корреляции (11.8):
; (12.4)
(12.5)
Теоретические значения t берут из таблицы приложения критерия Стьюдента для принятого уровня значимости и n–3 степеней свободы.
Подобно парным коэффициентам корреляции частные коэффициенты могут принимать значения, заключенные между –1 и +1. Частные коэффициенты детерминации находят путем возведения в квадрат частных коэффициентов корреляции.
Определение степени частного воздействия отдельных переменных на результативный признак при исключении (элиминировании) связи его с другими признаками, искажающими эту корреляцию, часто представляет большой интерес. Например, тесноту связи урожаев с осадками может сильно искажать варьирование температуры, и поэтому целесообразно изучить связь между первыми двумя признаками при постоянных значениях третьего. С чисто внешней стороны (а не внутренней) при постоянном значении элиминируемого признака нельзя подметить его статистического влияния на изменчивость других признаков: он удерживается на постоянном уровне, а другие признаки варьируют и находятся в корреляционном отношении друг с другом.
Чтобы уяснить технику расчета и смысл частного коэффициента корреляции, рассмотрим данные по определению парной корреляции между окружностями початка кукурузы (X), окружностью его стержня (Y) и количеством рядков зерен (Z) на основании измерения 9000 початков:
rxy = 0,799; rxz = 0,570; ryz = 0,507.
По приведенным выше соотношениям 12.1 – 12.3 определим частные коэффициенты корреляции:
;
;
Частный коэффициент корреляции между окружностью початка и его стержня у початков с одинаковым числом рядков зерен (rxy-z =0,720) показывает, что лишь незначительная часть взаимосвязи этих признаков в общей корреляции (rxy=0,799) обусловлена влиянием третьего признака. Аналогичное заключение необходимо сделать и в отношении частного коэффициента корреляции между окружностью початка и количеством рядков зерен у початков с одинаковой окружностью стержня (rxz-y = 0,55 и rxz = 0,57). Напротив, частный коэффициент корреляции между окружностью стержня и количеством рядков зерен у початков с одинаковой окружностью ryz-x = 0,105 значительно отличается от общего коэффициента корреляции ryz = 0,507. Из этого видно, что если подобрать початки с одинаковой окружностью, то связь между этими признаками у них будет очень слабой, так как значительная часть в этой взаимосвязи обусловлена варьированием окружности початка.
При некоторых обстоятельствах частный коэффициент корреляции может оказаться противоположным по знаку парному. Например, при изучении взаимосвязи между морфологическими признаками стеблей льна массой (X), длиной (Y) и диаметром (Z) – были получены следующие коэффициенты (n = 100): между массой и длиной rxy = 0,6; между массой и диаметром rxz = 0,9; между длиной и диаметром ryz = 0,4.
Частные коэффициенты корреляции при исключении влияния третьего признака:
;
;
Частные коэффициенты корреляции между массой и длиной и массой и диаметром при статистическом исключении влияния третьего признака не вызывают никаких недоумений. Выявилась очень высокая частная корреляция массы и диаметра при исключении влияния длины стебля rxz-y и слабая корреляция между массой и длиной rx-yz для растений с одинаковым диаметром. Частная корреляция между длиной стебля при постоянном значении массы получилась отрицательной: при увеличении длины диаметр стебля уменьшается, тогда, как общий коэффициент корреляции указывает на положительную взаимосвязь между этими признаками. На первый взгляд этот результат кажется невероятным, он противоречит обычным представлениям о росте растений: если увеличивается высота, то, конечно, увеличивается и диаметр стебля. Однако это мнимое противоречие объясняется основным условием частной корреляции – постоянством исключаемого признака. Если взять стебли льна одной и той же массы, то среди таких стеблей увеличение длины может происходить только за счет уменьшения диаметра. При увеличении обоих признаков не могла бы оставаться постоянной масса стебля.