11.2.1. Вариационный анализ

Добавил:

ivanov666 Опубликованный материал нарушает ваши авторские права? Сообщите нам.

Вуз:

Сибирская государственная автомобильно-дорожная академия

Предмет:

[НЕСОРТИРОВАННОЕ]

Файл:

1928.pdf

Скачиваний:

Добавлен:

07.01.2021

Размер:

2.23 Mб

Скачать

☆

<<< < Предыдущая 1 2 3 4 5 6 78 / 178 9 10 11 12 13 14 15 16 17 > Следующая >>>

Таблица 7

			Сферы применения методов анализа

	Метод анализа			Назначение
	Вероятностный		Исследование взаимосвязей между переменными, измерен-
	Вероятностный		ными метрически, с целью уменьшения их числа до наиболее
С			ными метрически, с целью уменьшения их числа до наиболее
	(стохастиче-		существенных. Рассматривается в качестве этапа корреляци-
	ский)		существенных. Рассматривается в качестве этапа корреляци-
	ский)			онно-регрессионного анализа
				онно-регрессионного анализа
	Детерм н ро-		Исследование взаимосвязей между факторами-причинами и
	Детерм н ро-		факторами-следствиями, измеренными метрически. Ранжиро-
	ванный			вание факторов-причин
				вание факторов-причин
	Вариац
			Исследование взаимосвязи между фактором-следствием, из-
	Дискрим нант-		меренным на качественном уровне, и фактором-причиной,
	ный		змеренным на метрическом уровне. Позволяет выявить и
			о ъяснить различия между группами явлений/объектов
		бА
			Исследование взаимосвязи между фактором-следствием, из-
	онный		меренным на метрическом уровне, и фактором-причиной, из-
			меренным на качественном уровне. Проверяет, существенно
			ли вл яет изменение независимого фактора на зависимый
	Вероятностный		Исследование взаимосвязей между переменными, измерен-
	(стохастиче-		ными метрически, с целью уменьшения их числа до наиболее
	ский)		существенных. Рассматривается в качестве этапа корреляци-
	ский)			онно-регрессионного анализа
				онно-регрессионного анализа
	Детерминиро-		Исследование взаимосвязей между факторами-причинами и
	Детерминиро-		факторами-следствиями, измеренными метрически. Ранжиро-
	ванный			вание факторов-причин
				вание факторов-причин
			Исследование взаимосвязи между фактором-следствием, из-
	Дискриминант-		меренным на качественном уровне, и фактором-причиной,
	ный		измеренным на метрическом уровне. Позволяет выявить и
			объяснить различия между группами явлений/объектов
			Исследование взаимосвязи между фактором-следствием, из-
				И
			меренным на метрическом уровне, и фактором-причиной, из-
	Вариационный		меренным на качественномДуровне. Проверяет, существенно
			ли влияет изменение независимого фактора на зависимый
			11.2.1. Вариационный анализ

Вариация (от лат. varictio – изменение) представляет собой изменение признака в статистической совокупности, т. е. принятие единицами такой совокупности разных значений [4].

Причины вариации чрезвычайно многообразны, обусловлены всеобщей взаимосвязанностью явлений в природе и обществе. Вариация предопределяет необходимость использования статистики и ее методов.

При качественной характеристике явлений статистические признаки могут принимать одно из двух взаимоисключающих значений. В таких случаях говорят об альтернативной вариации. Например, рабочий квалифицированный (признак может быть обозначен 1) и неквалифицированный (признак 0) [4].

Если вариация принимает какую-то тенденцию, но изменение не обусловлено внутренне присущими явлению механизмами, то говорят о системат ческой вар ации. В противном случае – о случайной.

Пр мером с стематической вариации можно рассматривать ко-
лебание про звод тельности труда под влиянием профессионализма
рабочих. лучайной – необъяснимые колебания цен по продавцам на
С
одном том же рынке.
Варь рующ е	знаки (например, уровень профессионализма
рабочих) подразделяются на прерывные и непрерывные [4].
Прерывные ( ли дискретные, от лат. diskretus – разделенный)
представляют со ой		, которые могут иметь только опреде-
признаки
ленные значен я, между которыми не может быть промежуточных.
Напр мер, нд в дуальный разряд рабочих может принимать
значения 1, 2, 3, 4, 5, 6, но никогда 2,2.
Количественные значения непрерывного признака могут отли-
чаться на любую малую величину. Например, водоцементное отно-
шение при изготовлении етонных смесей.
бА

Любой ранжированный ряд состоитДиз ранговых номеров и соответствующих им значений признака (вариант) [4].

Различают следующие виды вариационных рядов (или рядов рас-

пределения признака): ранжированный, дискретный, интервальный.

Ранжированный ряд (лат. rang – чин) — это такой ряд распределения единиц статистической совокупности, в котором члены ряда

(варианты признака) размещены в порядке возрастания или убывания. И

Дискретный ряд распределения формируется с учетом частоты (повторяемости) признака в совокупности [4].

Интервальный ряд – такой вариационный ряд, варианты которого представлены в виде интервалов.

11.2.2. Дискриминантный анализ

Дискриминантный анализ является статистическим методом, который позволяет изучать различия между двумя и более группами объектов по нескольким переменным одновременно, другими словами, этот метод анализа относится к многофакторным.

Независимые переменные при этом виде анализа могут измеряться количественно (возраст, доход, продолжительность обучения и т.п.). Зависимая переменная измеряется на качественном уровне (или номинальном) уровне. Так, в анализе для целей маркетинга потребителю конкретного продукта (зависимая переменная) может присваиваться код 1, а другому, который не потребляет этот продукт, – 2.

Порядок проведения множественного дискриминационного анализа [4]:

1) построен е модели, позволяющей классифицировать объекты (индив дуумов) по группам на основаниинезависимых переменных;

2) определен е статистической значимости различий между
С
группами;
3) проверка соответствия дискриминантного множества расчет-
ному, полученному по независимым переменным.
Общая модель д скриминантного анализа, называемая	также
м нантной функцией, имеет вид [4]:
дискр
Z b1 x1 b2 x2 ... bn xn,	(13)

где Z – дискриминантноебАмножество (база для отнесения объектов к определенной группе); b1 ... bn – коэффициенты (веса) дискриминантной функции; x1 ... xn – независимые переменные.

Дискриминантные коэффициенты определяют структуру вариации переменных в уравнении. НезависимыеДпеременные, существенно влияющие на различия в группах, имеют большие веса, а оказывающие незначительное влияние, – малые веса [4].

Впроцессе анализа отбирают те переменные, которые в большей мере определяют вероятность отнесения какого-либо объекта к конкретной группе (для каждой группы формируется свое дискриминантное множество) [4].

Впроцессе моделирования используют так называемую

O-статистику Уилкса. С ее помощью определяется вероятность ошибочного отнесения объектов к группам. И

11.2.3. Корреляционно-регрессионный анализ

Под корреляционным анализом понимают выявление наличия вероятностной связи (или стохастической, т. е. такой, которая проявляется на массовых явлениях и с определенной долей вероятности) (прямой (причинно-следственной) или обратной) между двумя количественно измеренными факторами.

Под регрессионным – установление формы и существенности связи между ними [4].

ущность метода рассмотрим на примере парной линейной кор-

реляции (под корреляцией понимают вероятностную связь, зависимость двух переменных. Различают линейную и нелинейную, парную и множественные корреляции). Исходные данные для соответствующего анализа представим в табл. 8 [4].

В табл. 9 пр ведены показатели уровня квалификации рабочих на десяти охваченных выборкой предприятиях, выраженные средним

	разрядом рабоч х,			среднемесячные значения выработки рабочих на
	этих же предпр ят ях, выраженные в тыс. руб./чел.
С											Таблица 8
											Таблица 8
			Данные о		квалификации и выработке рабочих
					по предприятиям

	Обозначен е
	предпр ят я		1	2	3	4	5	6	7	8	9	10
	средних
	(наблюден я)
	Независ мая
	переменная –		3,6	4,1	3,7	5,0	3,8	4,0	4,5	4,9	3,9	4,7
	уровень ква-		3,6	4,1	3,7	5,0	3,8	4,0	4,5	4,9	3,9	4,7
	лификации x
	Зависимая
	переменная –		49,0	54,0	50,0	57,0	52,0	48,0	57,0	58,0	51,0	56,0
	выработка y
		бА
						Д

В табл. 8 приведены показатели уровня квалификации рабочих на десяти охваченных выборкой предприятиях, выраженные средним разрядом рабочих, и среднемесячные значения выработки рабочих на этих же предприятиях, выраженные в тыс. руб./чел.

Зависимость выработки рабочих от уровняИих квалификации (гипотеза исследования) предполагается на основе наблюдений.

Факт наличия стохастической связи между парой переменных (наличия корреляции) может быть установлен графически.

Для этого в двухкоординатной сетке (х; у) наносятся показатели, характеризующие каждое наблюдение, т. е. строится так называемое корреляционное поле. Пример корреляционного поля, соответствующего данным табл. 8, приведен на рис. 7 [4] (видео 2).

Си бАР с. 7. Корреляционное поле

Из р с. 7 в дна о щая тенденция, отмечаемая эмпирически: с увеличен ем уровня квалификации рабочих их выработка возрастает; однако тенденция эта стохастическая, наряду с возрастанием наблю-

даются и снижения выра отки при росте уровня квалификации.

Необходимо, с одной стороны, подтвердить или опровергнуть

гипотезу об увеличении выра отки с ростом квалификации рабочих, а с другой – если гипотеза будет подтверждена, установить характеристики связи между рассматриваемымиДпеременными [4].

Для решения стоящей перед исследователем задачи привлекается

статистический метод, лежащий в основе регрессионного анализа и получивший название метода наименьших квадратов.

Суть метода в том, что приведенное на рис. 7 поле аппроксимируется линией (при линейной регрессии – прямойИ), сумма квадратов

отклонений от которой точек корреляционного поля равна нулю (на рис. 7 – пунктирная линия, именуемая теоретической линией регрессии), или, другими словами, – линией, заштрихованные и незаштрихованные площади между которой и эмпирической линией регрессии, равны.

Для получения аналитического выражения этой линии (y=a0+ai·x) необходимо составить систему нормальных уравнений и решить ее. В результате решения будут найдены параметры a0 и a1, первый из которых получил название свободного члена уравнения регрессии, а второй – коэффициента регрессии при независимой переменной, фак- торе-аргументе х.

Для многих типичных нелинейных форм зависимости между двумя переменными математиками предложены свои системы нормальных уравнений.

истема нормальных уравнений для парной линейной регрессии имеет общий вид [4]:

							n				n
			a0 n a1 xi yi;
							i 1				i 1				(14)
					n				n			n		,	(14)
			a		n		a		n		2	n		y
			a	0	x	i	a		x		2	x	i	y
				0	i 1	i	1		i 1		i	i 1	i	i
					i 1				i 1			i 1
	значений
	где i – обозначен (номер) наблюдения; n – количество наблюдений.
СОпределен е						сумм для составления системы нормаль-
	ных уравнен й удо но вести в та личной форме (табл. 9) [4].
		бА													Таблица 9
															Таблица 9
	Расчет значен й сумм аргументов, необходимых для составления
			с стемы нормальных уравнений парной регрессии

	Номер на-										Значения
	блюден я (i)		xi				yi					xi2		xi∙yi	yi2
	1		3,6		49,0							21,96		176,4	2401,0
	2		4,7		54,0							16,81		221,4	2916,0
	3		3,7		50,0							13,69		185,0	2500,0
	4		5,0		57,0							25,00		285,0	3249,0
	5		3,8		52,0					Д
	5		3,8		52,0							14,44		197,6	2704,0
	6		4,0		48,0							16,00		192,0	2304,0
	7		4,5		57,0							20,25		256,5	3249,0
	8		4,9		58,0							24,01		284,2	3364,0
	9		3,9		51,0							15,21		198,9	2601,0
	10		4,7		56,0							22,09		263,2	3136,0
	54		42,2		532,0							180,46		И
	54		42,2		532,0							180,46		2260,2	28424,0
	По данным табл. 10 составляется конкретная система нормаль-
	ных уравнений, отражающая вычисленные значения [4]:
			a0 10 a1 42,2 532,0;												(15)
			a		42,2 a			180,46 2260,2.							(15)
		0					1
	Приведенная система подлежит решению любым известным ме-
	тодом с целью получения значений a0											и a1.

Наряду с параметрами аппроксимирующей линии вычисляются такие ее важнейшие характеристики, как коэффициенты корреляции r и детерминации Д. Первый характеризует тесноту связи между фак-

торами, а второй – долю фактора-функции у, изменения которой объясняются (зависят) от изменения фактора-аргумента.

Для всех форм парной зависимости функции у от аргумента х (линейной и нелинейной) разработаны аналитические выражения систем нормальных уравнений, выражения для вычисления коэффициентов регрессии (a0, a1), корреляции и детерминации.

Значение линейного коэффициента корреляции по итоговым значениям л нейных переменных определяется спомощьювыражения[4]:

n xi yi xi yi

нации

(16)

i 1

n 2

Сn xi

n yi

i 1

Д=r2.

а коэфф ц ента детерм

бА

Значен я коэфф ц ента корреляции изменяются в пределах от

–1 до +1; –1<=r<=1.

Знаки коэфф ц ента регрессии и корреляции совпадают. При

этом нтерпретац ю

значений

коэффициента корреляции

можно

представить в та л. 10.

В результате решения системы уравнений (15) и определения значения коэффициента корреляции получено: a0 = 26,32, a1 = 6,37, r = 0,89, Д = 0,79.

Из этого следует, что у = 26,32 + 6,37х, при этом зависимость выработки рабочего от уровня квалификации – высокая. Изменения выработкина79%обусловленыизменениемуровняквалификациирабочих.

		Таблица 10
Оценка линейного коэффициента корреляции
Значение линейного ко-		нтерпретация
	Характер связи	И
эффициента корреляции		(в том числе сила связи)
	Д
r = 0	Отсутствует –
0< r <1	Прямая	С увеличением х увели-
		чивается у
0,1–0,3	-//-	Слабая (очень слабая)
0,3–0,5	-//-	Умеренная (слабая)
0,5–0,7	-//-	Заметная (умеренная)
0,7–0,9	-//-	Высокая (сильная)
0,9–0,99	-//-	Весьма высокая
–1 < r <0	Обратная	С увеличением х
–1 < r <0	Обратная	уменьшается у
		уменьшается у
r = 1		Каждому значению х
r = 1	Функциональная	строго соответствует
		одно значение у

Основная ошибка коэффициента корреляции (mr) вычисляется по формуле [4]:

	m	1 r2
					.	(17)


	r			n
				n
тепень же его достоверности может быть определена по выра-
С
жению [4]:		r
	tr	mr	3.			(18)

имущественно11.3. Граф ческ е методы, используемые в исследованиях

Граф ческ методы в процессе исследований используются прецелью структуризации и визуализации структуры проблемы, а такжебАпредставления всей совокупности возможных ее реше-

ний (развертки цели подцели / задачи и решения). Иногда такие методы пр меняются для представления результатов исследований и свертки частных кр тер альных показателей в обобщающий[4].

Можно сказать, что графические методы, используемые в исследованиях, играют служе ную роль. Кроме того, они чаще всего применяются в сочетании с другими методами. Совокупность графических методов, используемых в исследованиях, можно представить в

виде классификации, приведенной на рис. 8 [4]. Д И

Рис. 8. Классификация графических методов, используемых в исследованиях

<<< < Предыдущая 1 2 3 4 5 6 78 / 178 9 10 11 12 13 14 15 16 17 > Следующая >>>

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]

#
07.01.20212.22 Mб311923.pdf
#
07.01.20212.22 Mб71924.pdf
#
07.01.20212.22 Mб1041925.pdf
#
07.01.20212.23 Mб51926.pdf
#
07.01.20212.23 Mб61927.pdf
#
07.01.20212.23 Mб91928.pdf
#
07.01.20212.23 Mб31929.pdf
#
07.01.2021341.1 Кб2193.pdf
#
07.01.20212.23 Mб31930.pdf
#
07.01.20212.23 Mб31931.pdf
#
07.01.20212.24 Mб91932.pdf