Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Компьютерный анализ.docx
Скачиваний:
0
Добавлен:
01.07.2025
Размер:
284.91 Кб
Скачать

15. Корреляционный момент и коэффициент корреляции

  • Корреляция

    • Корреляционный момент и коэффициент корреляции

    • Коррелированность и зависимость случайных величин

    • Нормальный закон распределения на плоскости

    • Линейная регрессия. Прямые линии среднеквадратической регрессии

    • Линейная корреляция. Нормальная корреляция

    • Коэффициент корреляции Пирсона

      • Коэффициент корреляции Пирсона: пример решения задачи

    • Коэффициент ранговой корреляции Спирмена

      • Коэффициент корреляции Спирмена: пример решения задачи

 

Случайная величина описывается двумя числовыми характеристиками: математическим ожиданием и дисперсией. Чтобы описать систему из двух случайных величин кроме «основных» характеристик используют так же корреляционный момент и коэффициент корреляции. Корреляционным моментом µxy случайных величин X и У называют математическое ожидание произведения отклонений этих величин:

µxy = M { [ X - M(X) ] [ Y - M(Y) ] }

Для нахождения корреляционного момента дискретных величин используют формулу:

 ,

а для непрерывных величин — формулу :

Корреляционный момент характеризует наличие (отсутствие) связи между величинами X и У. Ниже будет доказано, что корреляционный момент равен нулю, если X и У независимы; Если же корреляционный момент для случайных величин X и Y не равен нулю, то между ними имеется зависимость.

Коэффициентом корреляции гху случайных величин X и У называют отношение корреляционного момента к произведению средних квадратических отклонений этих  величин: rxy= µxyxσy

16. Регрессия.

Регре́ссия, в теории вероятностей и математической статистике, зависимость среднего значения какой-либо величины от некоторой другой величины или от нескольких величин. В отличие от чисто функциональной зависимости y=f(x), когда каждому значению независимой переменной x соответствует одно определённое значение величины y, при регрессионной связи одному и тому же значению x могут соответствовать в зависимости от случая различные значения величины y. Если при каждом значении x=xi наблюдается ni значений yi1yin1величины y, то зависимость средних арифметических  =(yi1+…+yin1)/ni от x=xi  и является регрессией в статистическом понимании этого термина.

17. Вариация и ее отклонение от среднего, дисперсия

Вариация – это изменение значения признака у отдельных единиц совокупности.

Вариация обусловлена действием различных факторов на развитие отдельных единиц совокупности. Чем более разнообразно условие, тем больше его вариация.

Наиболее простой характеристикой вариации признака является размах вариации (R). Размах вариации – это разность между наибольшим и наименьшим значением признака в изучаемой совокупности.

Среднее линейное отклонение — это средняя арифметическая из абсолютных отклонений отдельных значений признака от средней.

Среднее линейное отклонение простое:

Среднее линейное отклонение взвешенное применяется для сгруппированных данных:

Дисперсия  - представляет собой средний квадрат отклонений индивидуальных значений признака от их средней величины.

Дисперсия простая:

Дисперсия взвешенная:

Более удобно вычислять дисперсию по формуле:

которая получается из основной путем несложных преобразований. В этом случае средний квадрат отклонений равен средней из квадратов значений признака минус квадрат средней.