
- •В.М. Еськов
- •Часть 2
- •Лабораторная работа № 8. Функция распределения. Гистограмма
- •Практическое значение выполняемых исследований.
- •Литература
- •Блок информации
- •Лабораторная работа № 9. Расчет доверительного интервала на эвм
- •Практическое значение выполняемых исследований
- •Литература
- •Бюджет времени
- •Блок информации
- •Блок информации
- •Лабораторная работа № 11
- •Статистическая проверка гипотез в экологии
- •Практическое значение выполняемых исследований
- •Литература
- •Бюджет времени
- •Блок информации
- •Лабораторная работа №13 Элементы дисперсионного анализа (да)
- •Практическое значение выполняемых исследований
- •Бюджет времени
- •Блок информации
- •1. Общие задачи идентификации параметров порядка и русел биосистем, находящихся в некоторых аттракторах состояний.
- •2. Нейрокомпьютерные технологии в идентификации пп для всоч.
- •3. Системный синтез в рамках компартментно – кластерного подхода.
- •Практическое значение выполняемых исследований
- •Бюджет времени
- •Литература
Лабораторная работа № 9. Расчет доверительного интервала на эвм
Цель работы.
Студент должен знать: смысл первичной статистической обработки результатов исследований до доверительного интервала с погрешностью измерений, правило 3-х сигм для случайных величин.
Студент должен уметь: произвести первичную статистическую обработку результатов экологических экспериментов до x±dx, произвести определение величины (размеров) конкретного биообъекта (среднее значение, выше среднего, высокий).
Практическое значение выполняемых исследований
С использованием методов математической статистики можно давать оценку любого биообъекта. Может быть выполнен анализ основных погрешностей в различных измерениях с использованием критерия Стьюдента. Использование программ в языках программирования (например, BASIC) для нахождения доверительного интервала и обработки результатов позволяет резко облегчить механические многократно повторяемые операции в расчетах и повысить их точность.
Литература
В.М. Еськов, О.Е. Филатова, В.А. Рачковская Статистическая обработка результатов измерений в практикуме по экологии и естествознанию.- Сургут: Изд. СурГУ, 1999.- 43 с.
М. Дж. Кендалл, А. Стьюарт. Теория распределений.
В. В. Гмурман. Теория вероятностей и математическая статистика.
Бюджет времени
На изучение темы отводится 6 часов, из них 2 часа лекций, 2 часа лабораторные занятия и 2 часа на самоподготовку.
МЕТОДИЧЕСКИЕ УКАЗАНИЯ ПО I ЭТАПУ
"Самоподготовка"
Для подготовки к лабораторной работе Вам следует повторить математику и математические методы за 1-2 курс, изучить лекции и ответить на следующие вопросы:
Каков смысл доверительного интервала?
Сформулируйте метод нахождения дисперсии и средне квадратического отклонения.
Для чего используется коэффициент Стьюдента?
Что такое дисперсия результата в экологическом смысле?
В чем смысл "правила трех сигм"?
Как перейти от доверительного интервала к стандартной форме записи
результатов эксперимента?
МЕТОДИЧЕСКИЕ УКАЗАНИЯ ПО II ЭТАПУ:
“Выполнение лабораторной работы”
Для выполнения этапа наберите описанную в блоке информации программу, реализующую алгоритм нахождения доверительного интервала. Оцените результат по критериям поиска грубых ошибок (промахов) эксперимента. Если таковые присутствуют, удалите их из выборки и проведите расчет заново. Выборку используйте по данным роста и массы студентов свей группы (студенты однокурсники) или из литературы разных пород рыб, одного года (например, двухлетний язь или карп и т.д.)
Блок информации
Рассмотрим первичную обработку результатов измерений до доверительного интервала. Определив в предыдущей работе №8 круг основных задач СОРЭИ и исходную информацию в области математической статистики, рассмотрим теперь конкретное применение указанного подхода при выполнении эколого-технических измерений, понимая под этим любые измерения в биологии, экологии, медицине, физике, химии, т.е. в естествознании вообще.
Прежде всего отметим, что вместо вероятности события P(x) мы будем пользоваться частотой P*(x)=m/N (см. л.р. №8) и тогда все формулы ТВ можно применить с некоторой точностью, заменив P(x) на P*(x). При малом числе измерений (n<30) вместо распределения Гаусса используем распределение Стьюдента, которое внесет некоторые коррективы в формулы, приведенные ниже. Сразу отметим, что в экологии (как и в физике, технике и др. науках) могут быть прямые измерения и косвенные. Начнем рассмотрение с 1-го блока, как наиболее распространенного.
I Прямые измерения. Расчет доверительного интервала.
Прежде всего отметим, что общая схема (алгоритм) первичной статистической обработки результатов измерений примет следующий вид для случая прямых измерений:
1. Нахождение выборочного математического ожидания (или среднего арифметического):
(9.1)
2. Нахождение статистической (выборочной) дисперсии (или центрального момента 2-го порядка):
(9.2)
3. Определение статистического (выборочного) среднего квадратического отклонения СВ:
(9.3)
Если
n
велико, то величины
,
D*(x),
могут хорошо характеризовать истинные
значения математического ожидания,
дисперсии и среднего квадратического
отклонения СВ (измеряемой величины).
Иная ситуация возникает при небольших
n
(n<30,
например). Вообще говоря
тоже является случайной величиной, как
и каждая xi,
поэтому оно тоже может характеризоваться
средним квадратическим отклонением,
которое, как показывают расчеты для
распределения Стьюдента, определяется
по формуле:
.
Легко
видеть, что с увеличением n средняя
квадратическая ошибка среднего
арифметического (выборочного
математического ожидания)
0.
Так как нас интересует истинное значение,
x0
для СВ, к которому стремится
,
то представляет интерес оценка точности
наших измерений и ответ на вопрос, как
близко
подходит к xo.
4. В первом случае используем правило трех сигм и определяем наиболее возможную ошибку отдельного измерения
.
(9.4)
Как
известно (см. выше), вероятность непопадания
СВ в интервал
чрезвычайно мала (1-0.9972=0.0028), поэтому те
значения СВ, которые не попали в этот
интервал, мы должны отбросить (промахи!),
а вычисления повторить заново. Тогда
схема вычисления (алгоритм) примет вид:
123456 (9.5)
5. Далее, точность прямого измерения x, т.е. разность между xo (истинным значением СВ) и ее можно определить по формуле:
(9.6)
где
tk,
- параметр, при малых n задается таблицей
1 (для критерия Стьюдента
).
Этот параметр можно определить из
распределения Стьюдента. Он зависит от
числа степеней свободы k, которое на
единицу меньше числа измерений, т.е. и
доверительной вероятности .
k=n-1 (9.7)
6.
Для ответа на второй вопрос мы должны
записать доверительный интервал (
),
внутрь
которого с доверительной вероятностью
попадает неизвестное нам истинное
значение xo
СВ. Выбор
определяется требованиями практики. В
биологических исследованиях можно
брать =0.9,
т.е. из 100 случаев, в среднем, 90 раз
вычисленный нами доверительный интервал
накроет истинное значение СВ, а в 10
случаях - нет. Иногда предъявляют более
жесткие требования (в авиации, медицине
=0.999,
в космонавтике – 0,99999).
Важно отметить, что истинные значение СВ мы так и не определим, но получаем определенную оценку xo. Этим объясняется невозможность исключить случайные ошибки. Иногда молодые исследователи говорят, что провели несколько измерений, а результат одинаковый, вывод "нет ошибки". Это утверждение неверное, т.к. фактически такая ситуация означает, что x СВ меньше абсолютной погрешности прибора xnp, тогда нужно просто приравнять эти две величины без дополнительных расчетов, т.е. сразу 16.
II. Косвенные измерения.
Приведенные выше методы расчета применимы при работе с любым измерительным прибором в экологии и при любых прямых измерениях. Однако, во многих случаях необходимая ЭТВ получается при расчете с использованием известных функциональных зависимостей между искомой величиной и непосредственно измеряемыми x1, x2,...,xn , т.е. y=y(x1...xn). В этом случае для каждой xi, используя алгоритм 1-6, находят xi и xi, а затем находят среднюю квадратическую погрешность косвенного измерения y по формуле:
(9.8)
где y/xi - частная производная от у по хi.
Приведем
простейший пример, если определяют
объем цилиндра (часть ствола дерева,
червь и т.д.) V=R2h,
то сначала по схеме 1-6 находят
,
а затем, используя (9.8)
.
Расчет средней квадратической ошибки среднего арифметического
,
точности
измерения
и доверительного интервала (
)
ничем не отличается от общей схемы 1-6.
В общем случае естествоиспытатель (биоэколог) должен сам уметь составлять алгоритм расчета доверительного интервала. Конкретный пример такого алгоритма (программы) представлен в приложении 1. В данной работе Вам придется измерить параметры (масса и рост) каждого студента группы и для этих двух СВ (m и n) рассчитать доверительные интервалы. Если бы выборка была побольше, например, юношей n1>10 и девушек n2>10, то можно было бы определить доверительные интервалы для юношей и девушек и сделать вывод о наличии (или отсутствии) гендерных различий среди населения Югры.
Наконец,
отметим еще одно важное замечание. Если
для данной выборки мы получим
и
,
то любой объект попавший в интервал
(
,
)
характеризуется как объект со средними
значениями (массы, роста и т.д.). Если же
его данные попали в интервал (
)
или в интервал (
),
то мы говорим, что рост (например, h)
человека ниже среднего или выше среднего.
Наконец, если параметры объекта лежат
за границей
,
то это или низкий (рост) или высокий
(рост) показатель объекта. Так в экологии
мы можем говорить о загрязненности
(воды, атмосферы, почвы, крови или лимфы
человека) в пределах нормы, выше (ниже)
нормы (среднее) или о высоких (низких)
показателях внешней для человека (или
внутренней) среды.
Доверительные интервалы можно сравнивать, но для этого лучше применять статистическую проверку гипотез (см. Лаб.р. №12, №13).
Приложение 1
ПРОГРАММА РАСЧЕТА ДОВЕРИТЕЛЬНОГО ИНТЕРВАЛА
REM *******************************************************
CLS
j = 0: Dsp = 0:
INPUT "Tkb (критерий Стьюдента) = ", Tkb
INPUT "количество n = ", n
DIM x(n)
REM *********** заполнение массива **************************
FOR i = 1 TO n
PRINT "x ("; i; ") = "; : INPUT "", x(i)
NEXT i
REM *******************************************************
REM ************** среднее значение x ***********************
FOR i = 1 TO n
j = j + x(i)
NEXT i
j = j / n
PRINT "Среднее арифметическое значения <x> = "; j
REM *******************************************************
REM *********** Статистическая дисперсия ********************
FOR i = 1 TO n
Dsp = Dsp + (j - x(i)) * (j - x(i))
NEXT i
Dsp = Dsp / n
PRINT "Статистическая дисперсия, D = "; Dsp
REM ******** Cреднее квадратичное отклонение ****************
Sc = SQR(Dsp)
PRINT "Среднее квадратичное отклонение x = "; Sc
REM *Среднее квадратичное отклонение среднего арифметического *
k = n - 1
Sxc = Sc / (SQR(k))
PRINT "Среднее квадратичное отклонение среднего арифметического ="; Sxc
REM ************ доверительный интервал ********************
dx = Tkb * Sxc
PRINT "доверительный интервал = ("; j - dx; ","; j + dx; ")"
Лабораторная работа №10
Метод наименьших квадратов (МНК) в расчете уравнения регрессии
Цель работы.
Студент должен знать: смысл регрессии x по y (регрессионных зависимостей), способы определения параметров регрессии (для линейной и квадратичной регрессии), метод наименьших квадратов.
Студент должен уметь: произвести расчет уравнения регрессии по результатам экспериментов произвести анализ программ ЭВМ для реализации метода регрессионного анализа.
Практическое значение выполняемых исследований
Различные величины, наблюдаемые в эксперименте, могут явно или неявно зависеть друг от друга. В последнем случае мы говорим о регрессии y по x Использование программ в языках программирования (например, BASIC) для нахождения параметров уравнения регрессии и обработки результатов экологических исследований. Данная работа позволяет обучаемому получить необходимые навыки в этой области.
Литература
В.М. Еськов, О.Е. Филатова, В.А. Рачковская Статистическая обработка результатов измерений в практикуме по экологии и естествознанию.- Сургут: Изд. СурГУ, 1999.- 43 с.
М. Дж. Кендалл, А. Стьюарт. Теория распределений.
В. В. Гмурман. Теория вероятностей и математическая статистика. – М.:
Ю. В. Линник. Метод наименьших квадратов. – М. – 2001. – 196 с.
Бюджет времени
На изучение темы отводится 6 часов, из них 2 часа лекций, 2 часа лабораторные занятия и 2 часа на самоподготовку.
МЕТОДИЧЕСКИЕ УКАЗАНИЯ ПО I ЭТАПУ
"Самоподготовка"
Для подготовки к лабораторной работе Вам следует повторить пройденный материал и изучить лекции. Ответьте на следующие вопросы:
1. Что такое регрессионное уравнение? Для чего его используют?
2 . Как проверяется соответствие гипотезы эксперименту методом наименьших квадратов?
3. Приведите алгоритм нахождения линейной регрессии.
МЕТОДИЧЕСКИЕ УКАЗАНИЯ ПО II ЭТАПУ:
“Выполнение лабораторной работы”
Для выполнения этапа наберите описанную в блоке информации программу, реализующую алгоритм нахождения регрессионных уравнений. Оцените полученные параметры уравнения регрессии и сделайте выводы.