- •1. ПОНЯТИЕ НАУКИ. КЛАССИФИКАЦИЯ НАУК
- •5. ВИДЫ ИССЛЕДОВАНИЙ
- •7.1. Классификация методов, используемых в исследованиях
- •7.3. Общенаучные методы исследования
- •8. СУЩНОСТЬ ОЦЕНИВАНИЯ
- •Экспертные методы получения первичной информации
- •11. МЕТОДЫ АНАЛИЗА
- •11.1. Детерминированные и стохастические процессы
- •11.2. Классификация методов анализа, используемых в исследованиях
- •11.2.1. Вариационный анализ
- •11.2.2. Дискриминантный анализ
- •11.2.3. Корреляционно-регрессионный анализ
- •11.3.1. Древовидные графы
- •11.3.2. Диаграмма «рыбий скелет»
- •11.4. Математические методы исследования
- •12. ОБЪЕКТ ИССЛЕДОВАНИЯ И ЕГО СВОЙСТВА
- •13. МОДЕЛИ, ИХ КЛАССИФИКАЦИЯ
- •13.1. Построение моделей
- •13.2. Методы имитационного моделирования
- •13.3. Основные этапы имитационного моделирования
- •13.5. Формализация имитационной модели
- •15. ПЛАНИРОВАНИЕ ЭКСПЕРИМЕНТА
- •15.1. Классификация планов
- •15.2. Область определения, интервалы варьирования и уровни факторов. Кодирование факторов
- •15.4. Дробный факторный эксперимент
- •15.7. Экстремальный эксперимент
- •ЗАКЛЮЧЕНИЕ
- •Библиографический список
Таблица 7
|
|
|
Сферы применения методов анализа |
||
|
|
|
|
|
|
|
Метод анализа |
|
Назначение |
||
|
Вероятностный |
Исследование взаимосвязей между переменными, измерен- |
|
||
|
ными метрически, с целью уменьшения их числа до наиболее |
|
|||
С |
|
||||
|
(стохастиче- |
существенных. Рассматривается в качестве этапа корреляци- |
|
||
|
ский) |
|
|
||
|
|
|
онно-регрессионного анализа |
|
|
|
|
|
|
|
|
|
Детерм н ро- |
Исследование взаимосвязей между факторами-причинами и |
|
||
|
факторами-следствиями, измеренными метрически. Ранжиро- |
|
|||
|
ванный |
|
|
вание факторов-причин |
|
|
|
|
|
|
|
|
Вариац |
|
|
||
|
|
|
Исследование взаимосвязи между фактором-следствием, из- |
|
|
|
Дискрим нант- |
меренным на качественном уровне, и фактором-причиной, |
|
||
|
ный |
|
змеренным на метрическом уровне. Позволяет выявить и |
|
|
|
|
|
о ъяснить различия между группами явлений/объектов |
|
|
|
|
бА |
|
||
|
|
|
Исследование взаимосвязи между фактором-следствием, из- |
|
|
|
онный |
меренным на метрическом уровне, и фактором-причиной, из- |
|
||
|
|
|
меренным на качественном уровне. Проверяет, существенно |
|
|
|
|
|
ли вл яет изменение независимого фактора на зависимый |
|
|
|
Вероятностный |
Исследование взаимосвязей между переменными, измерен- |
|
||
|
(стохастиче- |
ными метрически, с целью уменьшения их числа до наиболее |
|
||
|
ский) |
|
существенных. Рассматривается в качестве этапа корреляци- |
|
|
|
|
|
онно-регрессионного анализа |
|
|
|
|
|
|
|
|
|
Детерминиро- |
Исследование взаимосвязей между факторами-причинами и |
|
||
|
факторами-следствиями, измеренными метрически. Ранжиро- |
|
|||
|
ванный |
|
|
вание факторов-причин |
|
|
|
|
|
|
|
|
|
|
Исследование взаимосвязи между фактором-следствием, из- |
|
|
|
Дискриминант- |
меренным на качественном уровне, и фактором-причиной, |
|
||
|
ный |
|
измеренным на метрическом уровне. Позволяет выявить и |
|
|
|
|
|
объяснить различия между группами явлений/объектов |
|
|
|
|
|
Исследование взаимосвязи между фактором-следствием, из- |
|
|
|
|
|
|
И |
|
|
|
|
меренным на метрическом уровне, и фактором-причиной, из- |
|
|
|
Вариационный |
меренным на качественномДуровне. Проверяет, существенно |
|
||
|
|
|
ли влияет изменение независимого фактора на зависимый |
|
|
|
|
|
11.2.1. Вариационный анализ |
Вариация (от лат. varictio – изменение) представляет собой изменение признака в статистической совокупности, т. е. принятие единицами такой совокупности разных значений [4].
Причины вариации чрезвычайно многообразны, обусловлены всеобщей взаимосвязанностью явлений в природе и обществе. Вариация предопределяет необходимость использования статистики и ее методов.
42
При качественной характеристике явлений статистические признаки могут принимать одно из двух взаимоисключающих значений. В таких случаях говорят об альтернативной вариации. Например, рабочий квалифицированный (признак может быть обозначен 1) и неквалифицированный (признак 0) [4].
Если вариация принимает какую-то тенденцию, но изменение не обусловлено внутренне присущими явлению механизмами, то говорят о системат ческой вар ации. В противном случае – о случайной.
Пр мером с стематической вариации можно рассматривать ко- |
||
лебание про звод тельности труда под влиянием профессионализма |
||
рабочих. лучайной – необъяснимые колебания цен по продавцам на |
||
С |
|
|
одном том же рынке. |
|
|
Варь рующ е |
знаки (например, уровень профессионализма |
|
рабочих) подразделяются на прерывные и непрерывные [4]. |
||
Прерывные ( ли дискретные, от лат. diskretus – разделенный) |
||
представляют со ой |
|
, которые могут иметь только опреде- |
признаки |
|
|
ленные значен я, между которыми не может быть промежуточных. |
||
Напр мер, нд в дуальный разряд рабочих может принимать |
||
значения 1, 2, 3, 4, 5, 6, но никогда 2,2. |
||
Количественные значения непрерывного признака могут отли- |
||
чаться на любую малую величину. Например, водоцементное отно- |
||
шение при изготовлении етонных смесей. |
||
бА |
Любой ранжированный ряд состоитДиз ранговых номеров и соответствующих им значений признака (вариант) [4].
Различают следующие виды вариационных рядов (или рядов рас-
пределения признака): ранжированный, дискретный, интервальный.
Ранжированный ряд (лат. rang – чин) — это такой ряд распределения единиц статистической совокупности, в котором члены ряда
(варианты признака) размещены в порядке возрастания или убывания. И
Дискретный ряд распределения формируется с учетом частоты (повторяемости) признака в совокупности [4].
Интервальный ряд – такой вариационный ряд, варианты которого представлены в виде интервалов.
11.2.2. Дискриминантный анализ
Дискриминантный анализ является статистическим методом, который позволяет изучать различия между двумя и более группами объектов по нескольким переменным одновременно, другими словами, этот метод анализа относится к многофакторным.
43
Независимые переменные при этом виде анализа могут измеряться количественно (возраст, доход, продолжительность обучения и т.п.). Зависимая переменная измеряется на качественном уровне (или номинальном) уровне. Так, в анализе для целей маркетинга потребителю конкретного продукта (зависимая переменная) может присваиваться код 1, а другому, который не потребляет этот продукт, – 2.
Порядок проведения множественного дискриминационного анализа [4]:
1) построен е модели, позволяющей классифицировать объекты (индив дуумов) по группам на основаниинезависимых переменных;
2) определен е статистической значимости различий между |
|
С |
|
группами; |
|
3) проверка соответствия дискриминантного множества расчет- |
|
ному, полученному по независимым переменным. |
|
Общая модель д скриминантного анализа, называемая |
также |
м нантной функцией, имеет вид [4]: |
|
дискр |
|
Z b1 x1 b2 x2 ... bn xn, |
(13) |
где Z – дискриминантноебАмножество (база для отнесения объектов к определенной группе); b1 ... bn – коэффициенты (веса) дискриминантной функции; x1 ... xn – независимые переменные.
Дискриминантные коэффициенты определяют структуру вариации переменных в уравнении. НезависимыеДпеременные, существенно влияющие на различия в группах, имеют большие веса, а оказывающие незначительное влияние, – малые веса [4].
Впроцессе анализа отбирают те переменные, которые в большей мере определяют вероятность отнесения какого-либо объекта к конкретной группе (для каждой группы формируется свое дискриминантное множество) [4].
Впроцессе моделирования используют так называемую
O-статистику Уилкса. С ее помощью определяется вероятность ошибочного отнесения объектов к группам. И
11.2.3. Корреляционно-регрессионный анализ
Под корреляционным анализом понимают выявление наличия вероятностной связи (или стохастической, т. е. такой, которая проявляется на массовых явлениях и с определенной долей вероятности) (прямой (причинно-следственной) или обратной) между двумя количественно измеренными факторами.
44
Под регрессионным – установление формы и существенности связи между ними [4].
ущность метода рассмотрим на примере парной линейной кор-
реляции (под корреляцией понимают вероятностную связь, зависимость двух переменных. Различают линейную и нелинейную, парную и множественные корреляции). Исходные данные для соответствующего анализа представим в табл. 8 [4].
В табл. 9 пр ведены показатели уровня квалификации рабочих на десяти охваченных выборкой предприятиях, выраженные средним
|
разрядом рабоч х, |
среднемесячные значения выработки рабочих на |
||||||||||
|
этих же предпр ят ях, выраженные в тыс. руб./чел. |
|
|
|
||||||||
С |
|
|
|
|
|
|
|
Таблица 8 |
||||
|
|
|
|
|
|
|
|
|
|
|
||
|
|
|
Данные о |
квалификации и выработке рабочих |
|
|||||||
|
|
|
|
|
по предприятиям |
|
|
|
|
|||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Обозначен е |
|
|
|
|
|
|
|
|
|
|
|
|
предпр ят я |
1 |
2 |
3 |
4 |
5 |
6 |
7 |
8 |
9 |
10 |
|
|
средних |
|
|
|
|
|
|
|
|
|||
|
(наблюден я) |
|
|
|
|
|
|
|
|
|
||
|
Независ мая |
|
|
|
|
|
|
|
|
|
|
|
|
переменная – |
3,6 |
4,1 |
3,7 |
5,0 |
3,8 |
4,0 |
4,5 |
4,9 |
3,9 |
4,7 |
|
|
уровень ква- |
|||||||||||
|
лификации x |
|
|
|
|
|
|
|
|
|
|
|
|
Зависимая |
|
|
|
|
|
|
|
|
|
|
|
|
переменная – |
49,0 |
54,0 |
50,0 |
57,0 |
52,0 |
48,0 |
57,0 |
58,0 |
51,0 |
56,0 |
|
|
выработка y |
|
|
|
|
|
|
|
|
|
|
|
|
|
бА |
|
|
|
|
|
|||||
|
|
|
|
|
|
Д |
|
В табл. 8 приведены показатели уровня квалификации рабочих на десяти охваченных выборкой предприятиях, выраженные средним разрядом рабочих, и среднемесячные значения выработки рабочих на этих же предприятиях, выраженные в тыс. руб./чел.
Зависимость выработки рабочих от уровняИих квалификации (гипотеза исследования) предполагается на основе наблюдений.
Факт наличия стохастической связи между парой переменных (наличия корреляции) может быть установлен графически.
Для этого в двухкоординатной сетке (х; у) наносятся показатели, характеризующие каждое наблюдение, т. е. строится так называемое корреляционное поле. Пример корреляционного поля, соответствующего данным табл. 8, приведен на рис. 7 [4] (видео 2).
45
Си бАР с. 7. Корреляционное поле
Из р с. 7 в дна о щая тенденция, отмечаемая эмпирически: с увеличен ем уровня квалификации рабочих их выработка возрастает; однако тенденция эта стохастическая, наряду с возрастанием наблю-
даются и снижения выра отки при росте уровня квалификации.
Необходимо, с одной стороны, подтвердить или опровергнуть
гипотезу об увеличении выра отки с ростом квалификации рабочих, а с другой – если гипотеза будет подтверждена, установить характеристики связи между рассматриваемымиДпеременными [4].
Для решения стоящей перед исследователем задачи привлекается
статистический метод, лежащий в основе регрессионного анализа и получивший название метода наименьших квадратов.
Суть метода в том, что приведенное на рис. 7 поле аппроксимируется линией (при линейной регрессии – прямойИ), сумма квадратов
отклонений от которой точек корреляционного поля равна нулю (на рис. 7 – пунктирная линия, именуемая теоретической линией регрессии), или, другими словами, – линией, заштрихованные и незаштрихованные площади между которой и эмпирической линией регрессии, равны.
Для получения аналитического выражения этой линии (y=a0+ai·x) необходимо составить систему нормальных уравнений и решить ее. В результате решения будут найдены параметры a0 и a1, первый из которых получил название свободного члена уравнения регрессии, а второй – коэффициента регрессии при независимой переменной, фак- торе-аргументе х.
46
Для многих типичных нелинейных форм зависимости между двумя переменными математиками предложены свои системы нормальных уравнений.
истема нормальных уравнений для парной линейной регрессии имеет общий вид [4]:
|
|
|
|
|
|
|
n |
|
|
|
n |
|
|
|
|
|
|
|
|
a0 n a1 xi yi; |
|
|
|
|
|||||||||
|
|
|
|
|
|
|
i 1 |
|
|
|
i 1 |
|
|
(14) |
|
|
|
|
|
|
|
n |
|
|
|
n |
|
n |
|
, |
|
||
|
|
|
a |
|
|
a |
|
2 |
|
y |
|
|
||||
|
|
|
0 |
x |
i |
|
x |
x |
i |
|
|
|||||
|
|
|
|
i 1 |
1 |
i 1 |
i |
i 1 |
i |
|
|
|||||
|
|
|
|
|
|
|
|
|
|
|
|
|
||||
|
значений |
|
|
|
|
|
|
|
|
|
||||||
|
где i – обозначен (номер) наблюдения; n – количество наблюдений. |
|||||||||||||||
СОпределен е |
|
|
сумм для составления системы нормаль- |
|||||||||||||
|
ных уравнен й удо но вести в та личной форме (табл. 9) [4]. |
|
|
|||||||||||||
|
|
бА |
Таблица 9 |
|||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||
|
Расчет значен й сумм аргументов, необходимых для составления |
|||||||||||||||
|
|
|
с стемы нормальных уравнений парной регрессии |
|
|
|||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||
|
Номер на- |
|
|
|
|
|
|
|
|
|
Значения |
|
|
|||
|
блюден я (i) |
|
xi |
|
|
|
yi |
|
|
|
|
xi2 |
|
xi∙yi |
yi2 |
|
|
1 |
|
3,6 |
|
49,0 |
|
|
|
|
21,96 |
176,4 |
2401,0 |
|
|||
|
2 |
|
4,7 |
|
54,0 |
|
|
|
|
16,81 |
221,4 |
2916,0 |
|
|||
|
3 |
|
3,7 |
|
50,0 |
|
|
|
|
13,69 |
185,0 |
2500,0 |
|
|||
|
4 |
|
5,0 |
|
57,0 |
|
|
|
|
25,00 |
285,0 |
3249,0 |
|
|||
|
5 |
|
3,8 |
|
52,0 |
|
|
Д |
|
|
||||||
|
|
|
|
|
|
|
14,44 |
197,6 |
2704,0 |
|
||||||
|
6 |
|
4,0 |
|
48,0 |
|
|
|
|
16,00 |
192,0 |
2304,0 |
|
|||
|
7 |
|
4,5 |
|
57,0 |
|
|
|
|
20,25 |
256,5 |
3249,0 |
|
|||
|
8 |
|
4,9 |
|
58,0 |
|
|
|
|
24,01 |
284,2 |
3364,0 |
|
|||
|
9 |
|
3,9 |
|
51,0 |
|
|
|
|
15,21 |
198,9 |
2601,0 |
|
|||
|
10 |
|
4,7 |
|
56,0 |
|
|
|
|
22,09 |
263,2 |
3136,0 |
|
|||
|
54 |
|
42,2 |
|
532,0 |
|
|
|
|
180,46 |
И |
|
||||
|
|
|
|
|
|
|
2260,2 |
28424,0 |
|
|||||||
|
По данным табл. 10 составляется конкретная система нормаль- |
|||||||||||||||
|
ных уравнений, отражающая вычисленные значения [4]: |
|
|
|||||||||||||
|
|
|
a0 10 a1 42,2 532,0; |
|
(15) |
|
||||||||||
|
|
|
a |
|
42,2 a |
180,46 2260,2. |
|
|||||||||
|
|
0 |
|
|
1 |
|
|
|
|
|
|
|
|
|
||
|
Приведенная система подлежит решению любым известным ме- |
|||||||||||||||
|
тодом с целью получения значений a0 |
и a1. |
|
|
|
|
Наряду с параметрами аппроксимирующей линии вычисляются такие ее важнейшие характеристики, как коэффициенты корреляции r и детерминации Д. Первый характеризует тесноту связи между фак-
47
торами, а второй – долю фактора-функции у, изменения которой объясняются (зависят) от изменения фактора-аргумента.
Для всех форм парной зависимости функции у от аргумента х (линейной и нелинейной) разработаны аналитические выражения систем нормальных уравнений, выражения для вычисления коэффициентов регрессии (a0, a1), корреляции и детерминации.
Значение линейного коэффициента корреляции по итоговым значениям л нейных переменных определяется спомощьювыражения[4]:
|
|
|
n |
|
n |
|
n |
|
|
|
|
|
|
|
|
|
n xi yi xi yi |
|
|
|
|
||||||
нации |
|
|
|
|
|
|
|
, |
(16) |
||||
r |
|
i 1 |
|
i 1 |
i 1 |
|
|
||||||
|
|
n 2 |
|
n |
|
2 |
n |
2 |
n |
|
2 |
|
|
Сn xi |
|
xi |
|
n yi |
yi |
|
|
|
|||||
|
|
i 1 |
i 1 |
|
|
i 1 |
|
i 1 |
|
|
|
||
|
|
|
Д=r2. |
|
|
|
|
|
|
|
|||
а коэфф ц ента детерм |
|
|
|
|
|
|
|
|
|
||||
бА |
|
|
|
|
|||||||||
Значен я коэфф ц ента корреляции изменяются в пределах от |
|||||||||||||
–1 до +1; –1<=r<=1. |
|
|
|
|
|
|
|
|
|
|
|
|
|
Знаки коэфф ц ента регрессии и корреляции совпадают. При |
|||||||||||||
этом нтерпретац ю |
значений |
коэффициента корреляции |
можно |
||||||||||
представить в та л. 10. |
|
|
|
|
|
|
|
|
|
|
|
|
В результате решения системы уравнений (15) и определения значения коэффициента корреляции получено: a0 = 26,32, a1 = 6,37, r = 0,89, Д = 0,79.
Из этого следует, что у = 26,32 + 6,37х, при этом зависимость выработки рабочего от уровня квалификации – высокая. Изменения выработкина79%обусловленыизменениемуровняквалификациирабочих.
|
|
|
Таблица 10 |
|
Оценка линейного коэффициента корреляции |
||||
Значение линейного ко- |
|
|
нтерпретация |
|
|
Характер связи |
|
И |
|
эффициента корреляции |
|
|
(в том числе сила связи) |
|
|
Д |
|
||
r = 0 |
Отсутствует – |
|||
0< r <1 |
Прямая |
|
С увеличением х увели- |
|
|
|
|
чивается у |
|
0,1–0,3 |
-//- |
|
Слабая (очень слабая) |
|
0,3–0,5 |
-//- |
|
Умеренная (слабая) |
|
0,5–0,7 |
-//- |
|
Заметная (умеренная) |
|
0,7–0,9 |
-//- |
|
Высокая (сильная) |
|
0,9–0,99 |
-//- |
|
Весьма высокая |
|
–1 < r <0 |
Обратная |
|
С увеличением х |
|
|
уменьшается у |
|
||
|
|
|
|
|
r = 1 |
|
|
Каждому значению х |
|
Функциональная |
|
строго соответствует |
|
|
|
|
|
одно значение у |
|
48
Основная ошибка коэффициента корреляции (mr) вычисляется по формуле [4]:
|
m |
|
|
1 r2 |
|
|||||
|
|
|
|
|
|
|
. |
(17) |
||
|
|
|
|
|
|
|||||
|
|
|
||||||||
|
r |
|
|
|
|
n |
|
|||
|
|
|
|
|
|
|
|
|||
тепень же его достоверности может быть определена по выра- |
||||||||||
С |
|
|
|
|
|
|
|
|
|
|
жению [4]: |
|
|
|
r |
|
|
|
|
|
|
|
tr |
|
mr |
3. |
(18) |
имущественно11.3. Граф ческ е методы, используемые в исследованиях
Граф ческ методы в процессе исследований используются прецелью структуризации и визуализации структуры проблемы, а такжебАпредставления всей совокупности возможных ее реше-
ний (развертки цели подцели / задачи и решения). Иногда такие методы пр меняются для представления результатов исследований и свертки частных кр тер альных показателей в обобщающий[4].
Можно сказать, что графические методы, используемые в исследованиях, играют служе ную роль. Кроме того, они чаще всего применяются в сочетании с другими методами. Совокупность графических методов, используемых в исследованиях, можно представить в
виде классификации, приведенной на рис. 8 [4]. Д И
Рис. 8. Классификация графических методов, используемых в исследованиях
49