Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Парная корреляция.docx
Скачиваний:
113
Добавлен:
13.02.2015
Размер:
386.77 Кб
Скачать

Парная корреляция

Часто при проведении маркетингового исследования нас интересует связь между двумя метрическими переменными, как, например, в следующих ситуациях.

Насколько сильно связан объем продаж с затратами на рекламу?

Существует ли связь между долей рынка фирмы и численностью ее торгового персонала?

Связано ли восприятие качества товаров потребителями с их восприятием цены?

В таких ситуациях наиболее широко используемой статистикой является коэффициент парной Корреляции, (commercial units moment Correlation r), который характеризует степень тесноты связи между двумя метрическими (измеряемыми с помощью интервальной или относительной шкал) переменными, скажем, Х и Y. Этот коэффициент используют, чтобы определить, существует ли между переменными линейная зависимость. Он показывает степень, в которой вариация одной переменной X связана с вариацией другой переменной Y, т.е. меру зависимости между переменными Х и Y.

Коэффициент парной Корреляции, г (commercial units moment Correlation r)

Статистический показатель, характеризующий степень тесноты связи между двумя метрическими переменными.

Поскольку этот коэффициент первоначально предложил Карл Пирсон, его также называют коэффициентом Корреляции Пирсона. Кроме того, он известен как простой коэффициент Корреляции, линейный коэффициент Корреляции или просто коэффициент Корреляции.

В этих уравнениях X и Y обозначают выборочные средние, а — соответствующие стандартные отклонения; COV представляет собой ковариацию (covari-апсе) между Х и Y, т.е. меру зависимости Xи Y.

Ковариация может быть как положительной, так и отрицательной. Деление на SxS приводит к нормированному виду, так что коэффициент Корреляции г находится в пределах от -1 до +1. Обратите внимание, что коэффициент Корреляции никак не связан с единицами измерения, в которых выражены переменные.

Предположим, что исследователь хочет выяснить, зависит ли отношение респондента к местожительству от длительности его проживания в этом городе. Отношение выражают в 11- балльной шкале (1 — не нравится город, 11 — очень нравится город), а продолжительность проживания измеряют количеством лет, которые респондент прожил в этом городе.

В этом примере г = 0,9361, что близко к 1. Это означает, что отношение респондента к своему городу сильно зависит от времени проживания в нем. Более того, положительный знак г указывает на прямую связь (прямо пропорциональную): чем дольше респондент проживает в городе, тем больше он ему нравится, и наоборот.

Поскольку коэффициент Корреляции показывает меру, в которой вариация значений одной переменной зависит от вариации другой, можно выразить через разложение полной вариации.

Следовательно, г2 показывает, какая доля вариации одной переменной обусловлена вариацией другой. И г, и г2 являются симметричными показателями связи между переменными. Иначе говоря, корреляция между Х и Y та же, что и корреляция между Y и X. Корреляция не зависит от того, какая из переменных взята в качестве зависимой, а какая — в качестве независимой. Коэффициент Корреляции является мерой линейной зависимости, и он не предназначен для измерения силы связи в случае нелинейной зависимости. Таким образом, г = 0 просто означает отсутствие линейной зависимости между Х и Y. Это не означает, что Х и Y не взаимосвязаны. Между ними может существовать нелинейная зависимость, которую нельзя определить с помощью коэффициента Корреляции г.

Если коэффициент Корреляции вычисляют не для выборки, а для всей генеральной совокупности, то он обозначается греческой буквой р (ро). Коэффициент г — это оценка р. Обратите внимание, что расчет г предполагает, что X и Y- метрические переменные, кривые распределения которых имеют одинаковую форму. Если эти допущения не удовлетворяются, то значение г уменьшается и р получается недооцененным. В маркетинговых исследованиях данные, полученные с использованием относительной шкалы при небольшом количестве категорий, могут не быть строго интервальными.

Статистику, лежащую в основе критерия для проверки гипотезы, вычисляют по формуле которая имеет распределение с (п — 2) степенями свободы. Для коэффициента Корреляции, вычисленного на основе данных, а число степеней свободы- 12- 2 = 10. Следовательно, нулевую гипотезу об отсутствии связи между переменными Х и Y отклоняют. Это, наряду с положительным знаком коэффициента Корреляции, показывает, что отношение респондента к своему городу прямо пропорционально зависит от продолжительности проживания в нем. Более того, высокое значение г свидетельствует о том, что эта связь сильная.

При выполнении многомерного анализа данных часто полезно изучить простую Корреляцию между каждой парой переменных. Эти результаты представляют в форме корреляционной матрицы, которая показывает коэффициент Корреляции между каждой парой данных. Обычно рассматривают только самую нижнюю треугольную часть матрицы. Все элементы по диагонали равны 1,00, так как переменная коррелирует сама с собой. Верхняя треугольная часть матрицы — зеркальное отражение нижней треугольной части матрицы, поскольку г — симметричный показатель связи между переменными.

Хотя матрица простых коэффициентов Корреляций позволяет уяснить суть по парных связей, иногда исследователю хочется изучить связи между двумя переменными при условии управления одной или несколькими переменными. В последнем случае следует оценивать частную Корреляцию. В последние годы понятие и применение in vitro — in vivo Корреляции (IVIVC) для фармацевтических дозированных лекарственных форм стали одними из центральных предметов рассмотрения фармацевтической промышленностью, ВУЗами и регулирующими организациями. Поскольку разработка и оптимизация технологических составов (прописей) — неотъемлемая часть производства и анализа рынка любого терапевтического средства, они являются наиболее трудоемкими и дорогостоящими. В процессе оптимизации могут потребоваться изменения технологической части, производства, оборудования или масштабов производства. Если таковые типы изменений применены к технологической прописи, то исследования на здоровых добровольцах необходимо повторять для подтверждения того, что новая пропись биоэквивалентна старой. Безусловно, выполнение этих требований не только тормозит анализ конъюнктуры рынка новой технологической прописи, но также и увеличивает цена ее оптимизации. Таким образом, на сегодняшний день для производителей предпочтительнее и экономически выгоднее разрабатывать тесты in vitro, которые будут адекватно отражать исследования биодоступности.

Регуляторные руководства для дозированных форм как немедленного, так и модифицированного высвобождения, были разработаны FDA. Актуальность их создания заключалась, во-первых, в уменьшении необходимости проведения исследований биодоступности, а вовторых, они требовались для замены устаревших методов разработки и оптимизации технологических прописей.

Как указывалось выше, разработка IVIVC главным образом нацелена на то, чтобы частично или полностью заменить испытания на здоровых добровольцах в течение всего периода создания препарата. В дополнение к этому, IVIVC также можно использовать для изучения IVIVC спецификаций и для валидации методик растворения. Такое применение данного метода заключено в его определении. Данный метод также может стать серьезным подспорьем в процессе контроля качества в случае масштабирования производства (например, для улучшения состава технологической прописи или внесения изменений в производственный процесс) и / или внесения пострегистрационных изменений. При этом следует учитывать, что данные in vitro будут гарантироваться тем, что каждая политическая партия одного и того же препарата будет действовать идентично in vivo.

С быстрым увеличением препаратов с модифицированным высвобождением, существенно повысилась и значимость более глубокого изучения IVIVC. Хотя акцент дискуссии в этом обзоре будет, прежде всего, сосредоточен на технологических формах с модифицированным высвобождением, для которых считается, что IVIVC лучше прогнозируется, также будут рассмотрены некоторые аспекты ее применения и для технологических форм с немедленным высвобождением.