Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
1928.pdf
Скачиваний:
9
Добавлен:
07.01.2021
Размер:
2.23 Mб
Скачать

Таблица 7

 

 

 

Сферы применения методов анализа

 

 

 

 

 

 

Метод анализа

 

Назначение

 

Вероятностный

Исследование взаимосвязей между переменными, измерен-

 

 

ными метрически, с целью уменьшения их числа до наиболее

 

С

 

 

(стохастиче-

существенных. Рассматривается в качестве этапа корреляци-

 

 

ский)

 

 

 

 

 

онно-регрессионного анализа

 

 

 

 

 

 

 

Детерм н ро-

Исследование взаимосвязей между факторами-причинами и

 

 

факторами-следствиями, измеренными метрически. Ранжиро-

 

 

ванный

 

 

вание факторов-причин

 

 

 

 

 

 

 

Вариац

 

 

 

 

 

Исследование взаимосвязи между фактором-следствием, из-

 

 

Дискрим нант-

меренным на качественном уровне, и фактором-причиной,

 

 

ный

 

змеренным на метрическом уровне. Позволяет выявить и

 

 

 

 

о ъяснить различия между группами явлений/объектов

 

 

 

бА

 

 

 

 

Исследование взаимосвязи между фактором-следствием, из-

 

 

онный

меренным на метрическом уровне, и фактором-причиной, из-

 

 

 

 

меренным на качественном уровне. Проверяет, существенно

 

 

 

 

ли вл яет изменение независимого фактора на зависимый

 

 

Вероятностный

Исследование взаимосвязей между переменными, измерен-

 

 

(стохастиче-

ными метрически, с целью уменьшения их числа до наиболее

 

 

ский)

 

существенных. Рассматривается в качестве этапа корреляци-

 

 

 

 

онно-регрессионного анализа

 

 

 

 

 

 

 

Детерминиро-

Исследование взаимосвязей между факторами-причинами и

 

 

факторами-следствиями, измеренными метрически. Ранжиро-

 

 

ванный

 

 

вание факторов-причин

 

 

 

 

 

 

 

 

 

Исследование взаимосвязи между фактором-следствием, из-

 

 

Дискриминант-

меренным на качественном уровне, и фактором-причиной,

 

 

ный

 

измеренным на метрическом уровне. Позволяет выявить и

 

 

 

 

объяснить различия между группами явлений/объектов

 

 

 

 

Исследование взаимосвязи между фактором-следствием, из-

 

 

 

 

 

И

 

 

 

 

меренным на метрическом уровне, и фактором-причиной, из-

 

 

Вариационный

меренным на качественномДуровне. Проверяет, существенно

 

 

 

 

ли влияет изменение независимого фактора на зависимый

 

 

 

 

11.2.1. Вариационный анализ

Вариация (от лат. varictio – изменение) представляет собой изменение признака в статистической совокупности, т. е. принятие единицами такой совокупности разных значений [4].

Причины вариации чрезвычайно многообразны, обусловлены всеобщей взаимосвязанностью явлений в природе и обществе. Вариация предопределяет необходимость использования статистики и ее методов.

42

При качественной характеристике явлений статистические признаки могут принимать одно из двух взаимоисключающих значений. В таких случаях говорят об альтернативной вариации. Например, рабочий квалифицированный (признак может быть обозначен 1) и неквалифицированный (признак 0) [4].

Если вариация принимает какую-то тенденцию, но изменение не обусловлено внутренне присущими явлению механизмами, то говорят о системат ческой вар ации. В противном случае – о случайной.

Пр мером с стематической вариации можно рассматривать ко-

лебание про звод тельности труда под влиянием профессионализма

рабочих. лучайной – необъяснимые колебания цен по продавцам на

С

 

 

одном том же рынке.

 

 

Варь рующ е

знаки (например, уровень профессионализма

рабочих) подразделяются на прерывные и непрерывные [4].

Прерывные ( ли дискретные, от лат. diskretus – разделенный)

представляют со ой

 

, которые могут иметь только опреде-

признаки

 

ленные значен я, между которыми не может быть промежуточных.

Напр мер, нд в дуальный разряд рабочих может принимать

значения 1, 2, 3, 4, 5, 6, но никогда 2,2.

Количественные значения непрерывного признака могут отли-

чаться на любую малую величину. Например, водоцементное отно-

шение при изготовлении етонных смесей.

бА

Любой ранжированный ряд состоитДиз ранговых номеров и соответствующих им значений признака (вариант) [4].

Различают следующие виды вариационных рядов (или рядов рас-

пределения признака): ранжированный, дискретный, интервальный.

Ранжированный ряд (лат. rang – чин) — это такой ряд распределения единиц статистической совокупности, в котором члены ряда

(варианты признака) размещены в порядке возрастания или убывания. И

Дискретный ряд распределения формируется с учетом частоты (повторяемости) признака в совокупности [4].

Интервальный ряд – такой вариационный ряд, варианты которого представлены в виде интервалов.

11.2.2. Дискриминантный анализ

Дискриминантный анализ является статистическим методом, который позволяет изучать различия между двумя и более группами объектов по нескольким переменным одновременно, другими словами, этот метод анализа относится к многофакторным.

43

Независимые переменные при этом виде анализа могут измеряться количественно (возраст, доход, продолжительность обучения и т.п.). Зависимая переменная измеряется на качественном уровне (или номинальном) уровне. Так, в анализе для целей маркетинга потребителю конкретного продукта (зависимая переменная) может присваиваться код 1, а другому, который не потребляет этот продукт, – 2.

Порядок проведения множественного дискриминационного анализа [4]:

1) построен е модели, позволяющей классифицировать объекты (индив дуумов) по группам на основаниинезависимых переменных;

2) определен е статистической значимости различий между

С

 

группами;

 

3) проверка соответствия дискриминантного множества расчет-

ному, полученному по независимым переменным.

 

Общая модель д скриминантного анализа, называемая

также

м нантной функцией, имеет вид [4]:

 

дискр

 

Z b1 x1 b2 x2 ... bn xn,

(13)

где Z – дискриминантноебАмножество (база для отнесения объектов к определенной группе); b1 ... bn – коэффициенты (веса) дискриминантной функции; x1 ... xn – независимые переменные.

Дискриминантные коэффициенты определяют структуру вариации переменных в уравнении. НезависимыеДпеременные, существенно влияющие на различия в группах, имеют большие веса, а оказывающие незначительное влияние, – малые веса [4].

Впроцессе анализа отбирают те переменные, которые в большей мере определяют вероятность отнесения какого-либо объекта к конкретной группе (для каждой группы формируется свое дискриминантное множество) [4].

Впроцессе моделирования используют так называемую

O-статистику Уилкса. С ее помощью определяется вероятность ошибочного отнесения объектов к группам. И

11.2.3. Корреляционно-регрессионный анализ

Под корреляционным анализом понимают выявление наличия вероятностной связи (или стохастической, т. е. такой, которая проявляется на массовых явлениях и с определенной долей вероятности) (прямой (причинно-следственной) или обратной) между двумя количественно измеренными факторами.

44

Под регрессионным – установление формы и существенности связи между ними [4].

ущность метода рассмотрим на примере парной линейной кор-

реляции (под корреляцией понимают вероятностную связь, зависимость двух переменных. Различают линейную и нелинейную, парную и множественные корреляции). Исходные данные для соответствующего анализа представим в табл. 8 [4].

В табл. 9 пр ведены показатели уровня квалификации рабочих на десяти охваченных выборкой предприятиях, выраженные средним

 

разрядом рабоч х,

среднемесячные значения выработки рабочих на

 

этих же предпр ят ях, выраженные в тыс. руб./чел.

 

 

 

С

 

 

 

 

 

 

 

Таблица 8

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Данные о

квалификации и выработке рабочих

 

 

 

 

 

 

по предприятиям

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Обозначен е

 

 

 

 

 

 

 

 

 

 

 

предпр ят я

1

2

3

4

5

6

7

8

9

10

 

средних

 

 

 

 

 

 

 

 

 

(наблюден я)

 

 

 

 

 

 

 

 

 

 

Независ мая

 

 

 

 

 

 

 

 

 

 

 

переменная –

3,6

4,1

3,7

5,0

3,8

4,0

4,5

4,9

3,9

4,7

 

уровень ква-

 

лификации x

 

 

 

 

 

 

 

 

 

 

 

Зависимая

 

 

 

 

 

 

 

 

 

 

 

 

переменная –

49,0

54,0

50,0

57,0

52,0

48,0

57,0

58,0

51,0

56,0

 

выработка y

 

 

 

 

 

 

 

 

 

 

 

 

бА

 

 

 

 

 

 

 

 

 

 

 

Д

 

В табл. 8 приведены показатели уровня квалификации рабочих на десяти охваченных выборкой предприятиях, выраженные средним разрядом рабочих, и среднемесячные значения выработки рабочих на этих же предприятиях, выраженные в тыс. руб./чел.

Зависимость выработки рабочих от уровняИих квалификации (гипотеза исследования) предполагается на основе наблюдений.

Факт наличия стохастической связи между парой переменных (наличия корреляции) может быть установлен графически.

Для этого в двухкоординатной сетке (х; у) наносятся показатели, характеризующие каждое наблюдение, т. е. строится так называемое корреляционное поле. Пример корреляционного поля, соответствующего данным табл. 8, приведен на рис. 7 [4] (видео 2).

45

Си бАР с. 7. Корреляционное поле

Из р с. 7 в дна о щая тенденция, отмечаемая эмпирически: с увеличен ем уровня квалификации рабочих их выработка возрастает; однако тенденция эта стохастическая, наряду с возрастанием наблю-

даются и снижения выра отки при росте уровня квалификации.

Необходимо, с одной стороны, подтвердить или опровергнуть

гипотезу об увеличении выра отки с ростом квалификации рабочих, а с другой – если гипотеза будет подтверждена, установить характеристики связи между рассматриваемымиДпеременными [4].

Для решения стоящей перед исследователем задачи привлекается

статистический метод, лежащий в основе регрессионного анализа и получивший название метода наименьших квадратов.

Суть метода в том, что приведенное на рис. 7 поле аппроксимируется линией (при линейной регрессии – прямойИ), сумма квадратов

отклонений от которой точек корреляционного поля равна нулю (на рис. 7 – пунктирная линия, именуемая теоретической линией регрессии), или, другими словами, – линией, заштрихованные и незаштрихованные площади между которой и эмпирической линией регрессии, равны.

Для получения аналитического выражения этой линии (y=a0+ai·x) необходимо составить систему нормальных уравнений и решить ее. В результате решения будут найдены параметры a0 и a1, первый из которых получил название свободного члена уравнения регрессии, а второй – коэффициента регрессии при независимой переменной, фак- торе-аргументе х.

46

Для многих типичных нелинейных форм зависимости между двумя переменными математиками предложены свои системы нормальных уравнений.

истема нормальных уравнений для парной линейной регрессии имеет общий вид [4]:

 

 

 

 

 

 

 

n

 

 

 

n

 

 

 

 

 

 

 

 

a0 n a1 xi yi;

 

 

 

 

 

 

 

 

 

 

 

i 1

 

 

 

i 1

 

 

(14)

 

 

 

 

 

 

n

 

 

 

n

 

n

 

,

 

 

 

 

a

 

 

a

 

2

 

y

 

 

 

 

 

0

x

i

 

x

x

i

 

 

 

 

 

 

i 1

1

i 1

i

i 1

i

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

значений

 

 

 

 

 

 

 

 

 

 

где i – обозначен (номер) наблюдения; n – количество наблюдений.

СОпределен е

 

 

сумм для составления системы нормаль-

 

ных уравнен й удо но вести в та личной форме (табл. 9) [4].

 

 

 

 

бА

Таблица 9

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Расчет значен й сумм аргументов, необходимых для составления

 

 

 

с стемы нормальных уравнений парной регрессии

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Номер на-

 

 

 

 

 

 

 

 

 

Значения

 

 

 

блюден я (i)

 

xi

 

 

 

yi

 

 

 

 

xi2

 

xiyi

yi2

 

 

1

 

3,6

 

49,0

 

 

 

 

21,96

176,4

2401,0

 

 

2

 

4,7

 

54,0

 

 

 

 

16,81

221,4

2916,0

 

 

3

 

3,7

 

50,0

 

 

 

 

13,69

185,0

2500,0

 

 

4

 

5,0

 

57,0

 

 

 

 

25,00

285,0

3249,0

 

 

5

 

3,8

 

52,0

 

 

Д

 

 

 

 

 

 

 

 

 

14,44

197,6

2704,0

 

 

6

 

4,0

 

48,0

 

 

 

 

16,00

192,0

2304,0

 

 

7

 

4,5

 

57,0

 

 

 

 

20,25

256,5

3249,0

 

 

8

 

4,9

 

58,0

 

 

 

 

24,01

284,2

3364,0

 

 

9

 

3,9

 

51,0

 

 

 

 

15,21

198,9

2601,0

 

 

10

 

4,7

 

56,0

 

 

 

 

22,09

263,2

3136,0

 

 

54

 

42,2

 

532,0

 

 

 

 

180,46

И

 

 

 

 

 

 

 

 

2260,2

28424,0

 

 

По данным табл. 10 составляется конкретная система нормаль-

 

ных уравнений, отражающая вычисленные значения [4]:

 

 

 

 

 

a0 10 a1 42,2 532,0;

 

(15)

 

 

 

 

a

 

42,2 a

180,46 2260,2.

 

 

 

0

 

 

1

 

 

 

 

 

 

 

 

 

 

Приведенная система подлежит решению любым известным ме-

 

тодом с целью получения значений a0

и a1.

 

 

 

 

Наряду с параметрами аппроксимирующей линии вычисляются такие ее важнейшие характеристики, как коэффициенты корреляции r и детерминации Д. Первый характеризует тесноту связи между фак-

47

торами, а второй – долю фактора-функции у, изменения которой объясняются (зависят) от изменения фактора-аргумента.

Для всех форм парной зависимости функции у от аргумента х (линейной и нелинейной) разработаны аналитические выражения систем нормальных уравнений, выражения для вычисления коэффициентов регрессии (a0, a1), корреляции и детерминации.

Значение линейного коэффициента корреляции по итоговым значениям л нейных переменных определяется спомощьювыражения[4]:

 

 

 

n

 

n

 

n

 

 

 

 

 

 

 

 

n xi yi xi yi

 

 

 

 

нации

 

 

 

 

 

 

 

,

(16)

r

 

i 1

 

i 1

i 1

 

 

 

 

n 2

 

n

 

2

n

2

n

 

2

 

Сn xi

 

xi

 

n yi

yi

 

 

 

 

 

i 1

i 1

 

 

i 1

 

i 1

 

 

 

 

 

 

Д=r2.

 

 

 

 

 

 

 

а коэфф ц ента детерм

 

 

 

 

 

 

 

 

 

бА

 

 

 

 

Значен я коэфф ц ента корреляции изменяются в пределах от

–1 до +1; –1<=r<=1.

 

 

 

 

 

 

 

 

 

 

 

 

Знаки коэфф ц ента регрессии и корреляции совпадают. При

этом нтерпретац ю

значений

коэффициента корреляции

можно

представить в та л. 10.

 

 

 

 

 

 

 

 

 

 

 

 

В результате решения системы уравнений (15) и определения значения коэффициента корреляции получено: a0 = 26,32, a1 = 6,37, r = 0,89, Д = 0,79.

Из этого следует, что у = 26,32 + 6,37х, при этом зависимость выработки рабочего от уровня квалификации – высокая. Изменения выработкина79%обусловленыизменениемуровняквалификациирабочих.

 

 

 

Таблица 10

Оценка линейного коэффициента корреляции

Значение линейного ко-

 

 

нтерпретация

 

 

Характер связи

 

И

 

эффициента корреляции

 

 

(в том числе сила связи)

 

 

Д

 

r = 0

Отсутствует

0< r <1

Прямая

 

С увеличением х увели-

 

 

 

 

чивается у

 

0,1–0,3

-//-

 

Слабая (очень слабая)

 

0,3–0,5

-//-

 

Умеренная (слабая)

 

0,5–0,7

-//-

 

Заметная (умеренная)

 

0,7–0,9

-//-

 

Высокая (сильная)

 

0,9–0,99

-//-

 

Весьма высокая

 

–1 < r <0

Обратная

 

С увеличением х

 

 

уменьшается у

 

 

 

 

 

r = 1

 

 

Каждому значению х

 

Функциональная

 

строго соответствует

 

 

 

 

одно значение у

 

48

Основная ошибка коэффициента корреляции (mr) вычисляется по формуле [4]:

 

m

 

 

1 r2

 

 

 

 

 

 

 

 

.

(17)

 

 

 

 

 

 

 

 

 

 

r

 

 

 

 

n

 

 

 

 

 

 

 

 

 

тепень же его достоверности может быть определена по выра-

С

 

 

 

 

 

 

 

 

 

 

жению [4]:

 

 

 

r

 

 

 

 

 

 

tr

 

mr

3.

(18)

имущественно11.3. Граф ческ е методы, используемые в исследованиях

Граф ческ методы в процессе исследований используются прецелью структуризации и визуализации структуры проблемы, а такжебАпредставления всей совокупности возможных ее реше-

ний (развертки цели подцели / задачи и решения). Иногда такие методы пр меняются для представления результатов исследований и свертки частных кр тер альных показателей в обобщающий[4].

Можно сказать, что графические методы, используемые в исследованиях, играют служе ную роль. Кроме того, они чаще всего применяются в сочетании с другими методами. Совокупность графических методов, используемых в исследованиях, можно представить в

виде классификации, приведенной на рис. 8 [4]. Д И

Рис. 8. Классификация графических методов, используемых в исследованиях

49

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]