ной. После этого ошибку можно уменьшить хорошо известными методами-прежде всего, увеличивая число измерений, на основе свойства, описываемого уравнениями (5.22)-(5.23).
Корреляция является важнейшим типом взаимной зависимости случайных величин. Это такая связь между двумя величинами, при которой с ростом одной из них в среднем растет (или убывает) другая. Теснота корреляционной связи определяется коэффициентом корреляции. Коэффициент корреляции О может принимать значения от -1 до +1. При р=±1 одна из величин X èëè Ó является линейной функцией второй. При р=0 корреляционная связь отсутствует. При р=0 могут существовать иные формы зависимости между X и У, отличные от корреляции; но если обе величины имеют нормальный закон распределения, то отсутствие корреляции означает их независимость.
На рис. 5.1 приведены корреляционные графики для двух величин X è V. Каждая точка показывает значения õ è ó для некоторого объекта. Рис. 5.1.а соответствует слабой отрицательной корреляции между X è V (р»-0,3); рис. 5.1, б - сильной положительной корреляции (ра+0,99); рис. 5.1,8-отсутствию корреляции (рдаО).
Если р=+1 или р=-1, то величины õ è ó связаны точной линейной зависимостью
ó=à+Üõ (5.24)
Формула для расчета коэффициента корреляции дана в разделе 6.
В ряде задач анализ корреляции позволяет установить существенные связи, ценные для практики. Так, установив высокую положительную корреляцию между содержанием в рудах цинка и галлия, мы определяем перспективный источник редкого элемента. Но во многих случаях корреляция связана с влиянием несущественных факторов, и ее наличие может даже помешать анализу сущности изучаемого явления.
.Пример 5.5. Корреляция, не связанная с сутью явления. На рис. 5.2 представлен корреляционный график для величин: X (содержание примесей в реактиве) и У (количество бумаги, пошедшей на заворачивание банки реактива). Очевидно, по существу эти величины не связаны. Однако расчет дал значение коэффициента корреляции, близкое к +1. График проясняет,
Ðèñ. 5.1. Корреляционные графики äëÿ величин X è Ó: à -· ела б а я отр иц ат ел ьн а я корр ели Пня б - сил ьн а я п оложител ьн ая кор р еляция б - кор реляция отсутствует.
рис. 5.2. Корреляционный график: x - содержание примесей в реактиве; ó - расход бумаги на заворачивание банки.
в чем здесь дело. Точки группируются в два «облака», в пределах каждого из которых корреляции практически нет, но оба «облака» в совокупности соответствуют росту ó ñ ðîñòîì õ. Это объясняется тем, что банки с реактивом поступили с двух разных заводов. На одном из них реактив чище, а бумагу тратят экономнее, на другом-качество реактива
экономнее, на другом-качество реактива ниже, но зато не жалеют обертку. Существенной связи здесь нет. Наивной была бы попытка очищать реактив путем уменьшения расхода бумаги.
ВОПРОСЫ И ЗАДАЧИ
5.1. Случайная величина характеризуется дифференциальной функцией распределения :
*!(õ)=é ïðè*Î *(*)=å-* ïðÿë:*
Чему равны Ì(Õ) è 0(Õ)?
5.2. Рудный концентрат содержит примеси алюмосиликатов. Необходимо установить характер влияния на металлургический процесс дцух факторов: содержания 51 н содержания А1. Обоснованно ли мнение, что факторы сильно закор- релированы? Можно ли предложить такую организацию экспериментов, при которой данная корреляция была бы сведена к минимуму?
6. Статистические оценки и проверка гипотез
Теория вероятностей не занимается вопросом о том, как по опытным данным находить вышеуказанные характеристики. Это-предмет математической статистики. Рассмотрим некоторые ее вопросы.
Генеральная совокупность и выборка. Эти понятия относятся к числу важнейших в статистике. В науке чаще всего измерения производятся таким образом, что из всей интересующей нас совокупности объектов (генеральной совокупности) измеряется только лишь некоторое сравнительно небольшое число (выборка). Связано это либо с тем, что генеральная совокупность слишком велика-обычно теоретически она бесконечна - и измерить все объекты невозможно (или, по крайней мере, слишком дорого), либо с тем, что процесс измерения разрушает объекты и проведение измерений на всей генеральной совокупности бессмысленно: она окажется полностью уничтоженной, так что выводы из эксперимента не к чему будет прилагать.
Измерения на выборке мы проводим для того, чтобы их результаты применить к генеральной совокупности. В этом смысле выборка есть модель генеральной совокупности, а измерения проводятся для того, чтобы в дальнейшем осуществить традукцию.
57
**
** \
ной. После этого ошибку можно уменьшить хорошо известными методами-прежде всего, увеличивая число измерений, на основе свойства, описываемого уравнениями (5.22)-(5.23).
Корреляция является важнейшим типом взаимной зависимости случайных величин. Это такая связь между двумя величинами, при которой с ростом одной из них в среднем растет (или убывает) другая. Теснота корреляционной связи определяется коэффициентом корреляции. Коэффициент корреляции О может принимать значения от -1 до +1. При р=±1 одна из величин X èëè Ó является линейной функцией второй. При р=0 корреляционная связь отсутствует. При р=0 могут существовать иные формы зависимости между X и У, отличные от корреляции; но если обе величины имеют нормальный закон распределения, то отсутствие корреляции означает их независимость.
На рис. 5.1 приведены корреляционные графики для двух величин X è V. Каждая точка показывает значения õ è ó для некоторого объекта. Рис. 5.1.а соответствует слабой отрицательной корреляции между X è V (р»-0,3); рис. 5.1, б - сильной положительной корреляции (ра+0,99); рис. 5.1,8-отсутствию корреляции (рдаО).
Если р=+1 или р=-1, то величины õ è ó связаны точной линейной зависимостью
ó=à+Üõ (5.24)
Формула для расчета коэффициента корреляции дана в разделе 6.
В ряде задач анализ корреляции позволяет установить существенные связи, ценные для практики. Так, установив высокую положительную корреляцию между содержанием в рудах цинка и галлия, мы определяем перспективный источник редкого элемента. Но во многих случаях корреляция связана с влиянием несущественных факторов, и ее наличие может даже помешать анализу сущности изучаемого явления.
.Пример 5.5. Корреляция, не связанная с сутью явления. На рис. 5.2 представлен корреляционный график для величин: X (содержание примесей в реактиве) и У (количество бумаги, пошедшей на заворачивание банки реактива). Очевидно, по существу эти величины не связаны. Однако расчет дал значение коэффициента корреляции, близкое к +1. График проясняет,
Ðèñ. 5.1. Корреляционные графики äëÿ величин X è Ó: à -· ела б а я отр иц ат ел ьн а я корр ели Пня б - сил ьн а я п оложител ьн ая кор р еляция б - кор реляция отсутствует.
рис. 5.2. Корреляционный график: x - содержание примесей в реактиве; ó - расход бумаги на заворачивание банки.
в чем здесь дело. Точки группируются в два «облака», в пределах каждого из которых корреляции практически нет, но оба «облака» в совокупности соответствуют росту ó ñ ðîñòîì õ. Это объясняется тем, что банки с реактивом поступили с двух разных заводов. На одном из них реактив чище, а бумагу тратят экономнее, на другом-качество реактива
экономнее, на другом-качество реактива ниже, но зато не жалеют обертку. Существенной связи здесь нет. Наивной была бы попытка очищать реактив путем уменьшения расхода бумаги.
ВОПРОСЫ И ЗАДАЧИ
5.1. Случайная величина характеризуется дифференциальной функцией распределения :
*!(õ)=é ïðè*Î *(*)=å-* ïðÿë:*
Чему равны Ì(Õ) è 0(Õ)?
5.2. Рудный концентрат содержит примеси алюмосиликатов. Необходимо установить характер влияния на металлургический процесс дцух факторов: содержания 51 н содержания А1. Обоснованно ли мнение, что факторы сильно закор- релированы? Можно ли предложить такую организацию экспериментов, при которой данная корреляция была бы сведена к минимуму?
6. Статистические оценки и проверка гипотез
Теория вероятностей не занимается вопросом о том, как по опытным данным находить вышеуказанные характеристики. Это-предмет математической статистики. Рассмотрим некоторые ее вопросы.
Генеральная совокупность и выборка. Эти понятия относятся к числу важнейших в статистике. В науке чаще всего измерения производятся таким образом, что из всей интересующей нас совокупности объектов (генеральной совокупности) измеряется только лишь некоторое сравнительно небольшое число (выборка). Связано это либо с тем, что генеральная совокупность слишком велика-обычно теоретически она бесконечна - и измерить все объекты невозможно (или, по крайней мере, слишком дорого), либо с тем, что процесс измерения разрушает объекты и проведение измерений на всей генеральной совокупности бессмысленно: она окажется полностью уничтоженной, так что выводы из эксперимента не к чему будет прилагать.
Измерения на выборке мы проводим для того, чтобы их результаты применить к генеральной совокупности. В этом смысле выборка есть модель генеральной совокупности, а измерения проводятся для того, чтобы в дальнейшем осуществить традукцию.
57
**
** \
©è®