Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
statistika_docx2.docx
Скачиваний:
2
Добавлен:
01.07.2025
Размер:
486.4 Кб
Скачать

25. Линейная регрессия

Взаимосвязь между переменными может быть описана разными способами. Например, с помощью нахождения коэффициентов корреляции. В то же время эту связь можно выразить как зависимость между двумя переменными, нахождение которой можно свести к нахождению функции y=f(x).

Графическое выражение уравнения регрессии (так называется приведённое выше уравнение) называется линией регрессии. Если регрессия представляет собой линейную зависимость, то она называется линейной регрессией.

Рассмотрим линейную регрессию, выраженную с помощью двух уравнений:

(*)

(**)

В уравнении (*) – зависимая переменная, – независимая, –коэффициент регрессии.

В уравнении (**) – зависимая переменная, y независимая, – коэффициент регрессии.

Коэффициенты регрессии рассчитываются по формулам:

;

.

– коэффициент корреляции

и – стандартное отклонение.

Коэффициент корреляции рассчитывается по формулам коэффициента корреляции Пирсона.

Коэффициенты регрессии и показывают, на сколько в среднем величина первой переменной изменяется при изменении на единицу значения другой.

Коэффициенты и находятся по формулам:

и – средние значения по x по y.

26. Множественная линейная регрессия

Зависимость между несколькими переменными величинами выражается уравнением множественной регрессии. Это уравнение может быть линейным или нелинейным.

В простейшем случае, например, множественная линейная регрессия может быть выражена уравнением с двумя переменными независимыми и одной зависимой:

y=ax+bz

x и z – независимые переменные,

y – зависимая,

a, b, c – параметры уравнения.

При проведении конкретных расчётов выбор зависимых и независимых переменных определяется задачами эксперимента.

Решение уравнения состоит в нахождении параметров a, b, c на основе решения систем их трёх уравнений; например, такого вида:

и – значения независимых переменных х и z,

– значение зависимой переменной y,

N – количество испытуемых в каждой выборке.

27. Обоснование задачи сравнения распределений исследуемого признака

Число испытуемых

Значение

признака

Распределение может различаться по средним, дисперсиям, ассиметрии, эксцессу и их сочетаниям.

Рассмотрим 2 различных распределения признака.

Распределение 1 характеризуется меньшей дисперсией, чем распределение 2. В распределении 1 чаще встречаются значения близкие к среднему в распределении 2. Чаще встречаются более высокие и более низкие, чем средние значения признака. Такое соотношение может наблюдаться в распределении фенотипических признаков у мужчин (2) и у женщин (1).

Фенотипическая дисперсия мужчин должна быть больше, поскольку они представляют собой авангардную часть человеческого общества, которое ответственно за поиск новых форм приспособления, поэтому краткие значения различных фенотипических признаков у мужчин встречаются чаще. 2 тип отклонения от среднего значения в дальнейшем может приводить как к возможным будущим путям эволюции, так и к ошибкам истории.

В то же время женская часть общества ответственна за сохранение уже накопленных изменений, поэтому у них чаще встречаются средние значения фенотипических признаков.

Кол-во истып

Время

решения

задачи

Рассмотрим два распределения, которые отличаются по знаку ассиметрии. Распределение 1 имеет положительную ассиметрию (левостороннюю), распределение 2 – отрицательную (правостороннюю).

2 эти распределения могут отражать распределения времени решения простой задачи (1) и трудной задачи (2).

Простую задачу большинство решает быстро и поэтому большая часть значений сгруппировано слева, в то же время простота задачи может привести к тому, что некоторые испытуемые могут решать её достаточно долго.

Трудную задачу большинство испытуемых решает дольше, но всегда находятся такие, которые могут решить её быстро. Если доказать, что распределения статистически достоверно различаются, то это может стать основой для классификации задач и типов испытуемых, которые мыслят стандартно: простую задачу решают быстро, а сложную долго. И тех испытуемых, которые мыслят нестандартно: трудную задачу решают быстро, а простую медленно.

Можно также рассматривать показатель мотивации достижения, поскольку лица с преобладанием стремления к успеху предпочитают задачи средней трудности, где вероятность успеха примерно 0,5, а те, кто не любит неудачи, предпочтительнее выбирают либо очень лёгкие задачи, либо очень трудные.

Т.о. выяснения различия распределений по самым различным характеристикам может дать начало научному поиску.

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]