Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
МатСтГл4-2.doc
Скачиваний:
113
Добавлен:
01.06.2015
Размер:
410.62 Кб
Скачать

4.11. Показатели связи для порядковых и качественных признаков.

В практике биологических исследований встречаются задачи, в которых требуется оценить тесноту зависимости между качественными (например, цвет, принадлежность биологическому виду, всхожесть и т.д.) и порядковыми (служащими своеобразными номерами изучаемых объектов) признаками. Точное измерение таких признаков часто невозможно (можно лишь установить, обладает объект таким признаком, или не обладает).

Представленность качественного признака в совокупностихарактеризуется величиной, аналогичной среднему квадратичному отклонению. Эту величину будем обозначать через:

, (4.21)

где n1 иn2 - число объектов в совокупности соответственно с наличием и с отсутствием данного признака;- те же числа объектов в долях;n =n1 +n2 . Эта же величина в процентах от общего числа случаев

% ,

где

Ошибка доли признака

или

.

Пример 4.9. Пусть на некотором участке леса произрастают 300 сосен и 200 берез, а на другом соответственно 400 и 100 деревьев этих же пород (n = 500). Доли участия деревьев разных пород: на первом участке – сосны= 0,6 илир1с= 60%, березы= 0,4 илир1б = 40%; на втором участке - сосны= 0,8 илир= 80%, березы= 0,2 илир2б = 20%. Требуется определить, являются ли эти участки настолько сходными, что их можно рассматривать как две части одного сравнительно однородного по породному составу участка [ ].

Решение. На первом участке

На втором участке

Мера существенности различия полученных показателей

= 3,2 > 3 .

Различие участков существенно. Участки с таким различием в долях представленных пород (на 20% и более) являются существенно различными и их нельзя считать частями одного однородного в среднем участка.

Показатель связи между двумя качественными признаками. Использование этого показателя рассмотрим на конкретном примере [ ]. Проведено исследование двухсот желудей на всхожесть. Эти желуди были разделены по цвету на темные и светлые, и внутри каждой цветовой группы на всхожие и невсхожие. Требуется установить, связаны ли цвет желудей и их всхожесть.

Желуди

Всхожие

Невсхожие

Итого

Темные

Светлые

n1 = 80

n3 = 25

n2 = 30

n4 = 65

N1 = 110

N2 = 90

Итого

N3 = 105

N4 = 95

N = 200

Показатель связи между двумя качественными признаками вычисляют по формуле

(4.22)

Ошибку показателя связи находим так же, как для коэффициента корреляции

= 0,06.

Показатель связи

> 3

является достоверным, поэтому связь между цветом желудей и всхожестью следует считать доказанной. Связь цвета и всхожести прямая умеренная, поэтому для посева из данной партии целесообразно отбирать более темные желуди.

Показатель связи между ранговыми номерами признаков. По характеру качественного признака изучаемые объекты могут быть разбиты на группы подобных объектов. Эти группы нумеруют в порядке усиления или ослабления качества признака. Номера групп называютрангамикачества, а совокупность исследованных объектов, разбитую на пронумерованные группы,ранжированной.

Пример 4.10. В полевых условиях приближенно определялось содержание заданного химического элемента в почвенных пробах (исследуемый признакX - содержание элемента в пробе). Содержание элемента характеризовалось как: исчезающе малое (И), очень малое (О), малое (М), среднее (С), высокое (В). Если выборка почвенных проб имеет объем больше пяти, то в ней будут пробы с одинаковыми значениями признака. Пусть получена следующая последовательность значений признака: С, М, В, С, И, С, В, О, С, М. Предварительно эти значения следует расположить в порядке усиления (или ослабления) признака и пронумеровать (т.е. присвоить предварительный ранг):

содержание элемента И О М М С С С С В В

предварительный ранг 1 2 3 4 5 6 7 8 9 10.

Затем объектам с одинаковым значением признака присваивается ранг, равный среднему арифметическому их предварительных рангов. Так как значение М занимает места 3 и 4, то ранг для объектов с М будет равным (3+4) / 2 = 3,5. Ранг для объектов с С будет равным (5+6+7+8) / 4 = 6,5. Ранг объектов с В будет равен (9+10) / 9,5. Окончательно ранжированная совокупность имеет вид:

содержание элемента И О М М С С С С В В

ранг 1 2 3,5 3,5 6,5 6,5 6,5 6,5 9,5 9,5. Е

Показатель связи между ранговыми номерами признаков называют показателем корреляции рангов. Он является мерой тесноты связи между признаками и определяется формулой

, (4.23)

где а – разность между рангами пары связанных признаков (т.е. между рангом уровня признакаX и рангом соответствующего ему уровня признакаY );n – число пар объектов, у которых уровни признаковX иY определены совместно.

Свойства показателя корреляции рангов аналогичны свойствам коэффициента корреляции. Показатель корреляции рангов изменяется в пределах -1 ≤ ≤ 1. Если=0, то корреляционная связь между признаками отсутствует, если= 1 (или= -1) – связь функциональная. Неравенство> 0 указывает на прямую зависимость между изучаемыми признаками, а< 0 - на обратную.

Основная ошибка коэффициента ранговой корреляции . Значимость коэффициента ранговой корреляции проверяется аналогично тому, как это делается для коэффициента корреляции. Если значение критерияtэмп=будет меньше табличного

tα(n– 3) при заданном уровне значимостиα, то говорить о наличии связи между признаками нет оснований.

Пример 4.11. Результаты приближенного определения в полевых условиях содержания химических элементов А и В вn = 10 пробах почвы приведены в таблице. Определить тесноту связи между содержаниями элементов А и В.

Решение. Уровни содержания химических элементов обозначены так же, как и в примере 4.10.

Содержание элементов

Предварительный ранг

Ранг

Разность рангов

А

В

RА

RВ

RА

RВ

|а|

а2

М

С

М

И

С

С

О

В

С

В

С

В

С

О

С

В

М

С

В

В

3

5

4

1

6

7

2

9

8

10

3

7

4

1

5

8

2

6

9

10

3,5

6,5

3,5

1

6,5

6,5

2

9,5

6,5

9,5

4,5

8,5

4,5

1

4,5

8,5

2

4,5

8,5

8,5

1

2

1

0

2

2

0

5

2

1

1

4

1

0

4

4

0

25

4

1

∑ = 44.

Вычисляем показатель корреляции рангов

= 0,73.

Основная ошибка коэффициента ранговой корреляции Значение критерияt , вычисленное по выборочным данным, равноtэмп==По таблице (Приложение 4) для уровня значимостиα = 0,05 иf = (n – 3) = 7 находимt0,05(7) = 2,37. Так какtэмп <t0,05(7) , то нет оснований говорить о наличии связи между признаками (найденныйявляется незначимым).

Пример 4.12. Исследован процент всхожести еловых семян в зависимости от их цвета, причем по степени окраски все семена были разбиты наn = 7 групп. Определить тесноту связи между цветом и всхожестью семян.

Решение. Экспериментальные и вспомогательные данные приведены в таблице:

Цвет семян

Всхожесть, %

Ранг

Разность рангов

По цвету

По всхожести

а

а2

Черный

Темный

Темно-серый

Серый

Светло-серый

Беловатый

Белый

75

80

70

60

65

40

5

1

2

3

4

5

6

7

2

1

3

5

4

6

7

-1

1

0

-1

1

0

0

1

1

0

1

1

0

0

∑ = 4.

Показатель корреляции рангов равен

Связь между цветом и всхожестью семян получилась прямая, очень высокая (процент всхожести тем выше, чем темнее семена). Значит из данной партии для посева нужно отбирать наиболее темные семена.

Вопросы и задачи

1. Какую связь между признаками называют корреляционной? Напишите по памяти несколько формул для расчета коэффициента корреляции.

2. Каковы возможные значения коэффициента корреляции? Какие выделяют уровни тесноты корреляционной связи и какие значения коэффициента корреляции соответствуют этим уровням?

3. Какую корреляционную зависимость между признаками называют положительной, а какую отрицательной? Каков знак коэффициента корреляции при положительной корреляционной зависимости? При отрицательной?

4. Какой связи между признаками соответствуют значения rв = +1 иrв = -1 ?

5. Имеет ли коэффициент корреляции размерность? Если имеет, то как связана размерность коэффициента корреляции с размерностями признаков?

6. Обязательно ли из существования зависимости между величинами Y иX следует существование между ними линейной корреляционной зависимости? Обязательно ли из независимости величинY иX следует отсутствие между ними линейной корреляционной зависимости?

7. Всегда ли при rв = 0 между признаками нет корреляционной связи?

8. Каков характерный вид поля корреляции в случае, если между Y иX существует: положительная (отрицательная) линейная корреляционная связь; параболическая корреляция второго порядка? Каков вид поля корреляции, еслиY иX независимы? Каков вид поля корреляции, еслиY иXзависимы, но не связаны линейной корреляционной зависимостью?

9. Что такое корреляционное отношение? Почему существует необходимость введения этой величины наряду с коэффициентом корреляции? Каковы возможные значения корреляционного отношения?

10. Что такое множественная корреляция между признаками? Что такое частная корреляция?

11. Что такое ранговая корреляция и почему приходится вводить это понятие? Как вычисляется коэффициент ранговой корреляции?

12. Найти выборочное уравнение уравнение прямой линии регрессии Y наX по данным

n = 8 наблюдений:

xi 1,00 1,50 2,00 2,50 3,00 3,50 4,00 4,50

yi 0,95 1,20 1,55 1,45 1,70 1,70 1,90 1,85.

Вычислить коэффициент корреляции rвпризнаковY иX . Проверить справедливость соотношения, связывающегоrв и угловой коэффициент прямой линии регрессии.

13. Найти выборочное уравнение уравнение прямой линии регрессии Y наX по данным

n = 8 наблюдений:

xi 1,00 1,50 2,00 2,50 3,00 3,50 4,00 4,50

yi 2,75 2,60 2,30 2,40 2,15 1,80 1,90 1,60.

Вычислить коэффициент корреляции rвпризнаковY иX . Проверить справедливость соотношения, связывающегоrв и угловой коэффициент прямой линии регрессии.

14. Пусть в эксперименте с равными относительными частотами наблюдаются следующие пары (xi ,yi ) признаковX иY :

(2,1), (2,2), (2,3), (4,1), (4,2), (4,3), (6,1), (6,2), (6,3).

Признак Y должен считаться независимым от признакаX, так как разным значениям признакаX соответствуют одинаковые множества (и распределения) значений признакаY (другими словами, значения признакаY не зависят от того, какое значение принял признак

X). Вычислить коэффициент корреляции признаковX иY .