
- •Биостат
- •Биологическая статистика как наука.
- •Значение биологической статистики в исследовательской работе и профессиональной подготовке специалистов-биологов.
- •Понятие о наименьшей выборочной единице (единице наблюдения) и данных в биологии.
- •Генеральная совокупность и выборка.
- •Количественные переменные: дискретные и непрерывные.
- •Ранговая шкала измерений в биометрии.
- •Производные переменные: пропорции, индексы.
- •Полностью случайный отбор и его реализация при помощи таблиц случайных чисел.
- •Стратифицированный отбор при формировании выборок.
- •Систематический отбор при формировании выборок.
- •Группировка данных в вариационный ряд.
- •Способы графического изображения вариационного ряда: полигон (кривая) распределения, гистограмма.
- •Теоретические распределения случайных величин и их свойства: биномиальное распределение, распределение Пуассона, нормальное распределение.
- •Коэффициенты асимметрии и эксцесса.
- •Меры разброса единиц совокупности: дисперсия и стандартное отклонение. Коэффициент вариации.
- •Структурные средние. Мода. Медиана. Квантили.
- •Расчет параметров описательной статистики при качественной изменчивости.
- •Оценка репрезентативности выборочных показателей при помощи стандартной ошибки.
- •Способы определения достаточного объема выборки.
- •Способы представления средних величин, мер разброса, стандартных ошибок и доверительных интервалов в научных публикациях.
- •Статистические критерии (тесты).
- •Вероятность справедливости нулевой гипотезы (уровень значимости).
- •Мощность статистического критерия (теста).
- •Понятие о параметрических и непараметрических критериях (тестах).
- •Способы трансформации данных для приведения их к нормальному распределению: логарифмирование, извлечение квадратного корня, угловое преобразование.
- •Назначение дисперсионного анализа (anova).
- •Нулевая гипотеза при дисперсионном анализе.
- •Понятие о многофакторном дисперсионном анализе.
- •39. Допущения дисперсионного анализа. Проверка нормальности распределения данных: визуальный анализ гистограммы распределения, тесты Колмогорова-Смирнова.
- •Непараметрические аналоги однофакторного дисперсионного анализа: тест Крускала-Уоллиса и тест Фридмана.
- •Сравнение двух групп. Тест Стьюдента как частный случай дисперсионного анализа.
- •Тест Стьюдента для парных измерений.
- •Использование доверительных интервалов для проверки гипотезы о равенстве двух средних.
- •Непараметрические аналоги критерия Стьюдента: тест Манна-Уитни, тест Уилкоксона, тест Уэлча.
- •Понятие о функциональной и корреляционной зависимостях.
- •Коэффициент корреляции Пирсона и оценка его статистической значимости.
- •Частная и множественная корреляции.
- •Коэффициент ранговой корреляции Спирмена.
- •Назначение регрессионного анализа.
- •Связь коэффициента регрессии с коэффициентом корреляции.
- •Статистическая значимость регрессии. Проверка нулевой гипотезы о равенстве коэффициента регрессии нулю.
- •Стандартные ошибки параметров регрессионного уравнения.
- •Коэффициент детерминации. Анализ остатков. Оценка величины остаточной дисперсии.
- •Понятие о многомерной совокупности и многомерном пространстве. Принцип «сворачивания» информации, заключенной в многомерных совокупностях.
- •60. Кластерный анализ и области его применения. Правила объединения объектов в кластеры. Графическое изображение результатов кластерного анализа.
- •61. Дискриминантный анализ и области его применения. Дискриминантное уравнение и его параметры.
- •62. Анализ главных компонент и области его применения. Принцип ортогональности главных компонент.
Статистическая значимость регрессии. Проверка нулевой гипотезы о равенстве коэффициента регрессии нулю.
Для оценки качества подбора линейной функции к выборочным данным проводится дисперсионный анализ, и оценка значимости полученного урав-нения регрессии дается с помощью F-критерия Фишера. В основе проверки значимости регрессии лежит идея разложения общей дисперсии результа-тивного признака на факторную и остаточную дисперсии, т.е. объясненную (за счет независимых факторов) часть дисперсии и часть, оставшуюся необъ-ясненной в рамках данной модели. Предварительно рассчитываются девиаты, степени свободы, а потом и соответствующие дисперсии. Гипотезы такие же, как в случае проверки достоверности коэффициента регрессии, а выво-ды различаются.
Гипотезы:
Н0: в генеральной совокупности коэффициент регрессии равен нулю, признак-фактор не влияет на признак-результат.
Н1: в генеральной совокупности коэффициент регрессии не равен нулю, признак-фактор влияет на признак-результат.
Общая девиата, ответственная за общую изменчивость признака-результата.
Факторная девиата, ответственная за изменчивость признака-результата под действием признака-фактора.
Остаточная девиата, ответственная за изменчивость признака-результата под действием других факторов, исключая признак-фактор. Чем она меньше , тем лучше уравнение регрессии подходит к исходным данным. С помощью F-критерия определяют значимость всего уравнения регрессии.
Вывод: если фактически установленная величина Fфакт больше Fst. для степеней свободы регрессии и остатков на принятом уровне значимости β, нулевую гипотезу отвергают. Иначе нулевую гипотезу отвергнуть нельзя.
Стандартные ошибки параметров регрессионного уравнения.
Гипотезы:
Н0: в генеральной совокупности коэффициент регрессии равен нулю, признак-фактор не влияет на признак-результат.
Н1: в генеральной совокупности коэффициент регрессии не равен нулю, признак-фактор влияет на признак-результат.
Вывод: если фактически установленная величина tфакт – отношения вы-борочного коэффициента регрессии к своей ошибке больше tst для чисел степеней свободы k = n – 2 на принятом уровне значимости, нулевую гипотезу отвергают. Иначе нулевую гипотезу отвергнуть нельзя
Коэффициент детерминации. Анализ остатков. Оценка величины остаточной дисперсии.
Коэффициент детерминации используется для измерения того, насколько хорошо модель регрессии соответствует данным.
доля общей изменчивости зависимой переменной, которая объясняется регрессионной моделью.
R-квадрат принимает значения от 0 до 1, где 1 означает идеальное соответствие модели данным.
Анализ остатков включает в себя оценку остатков, которые представляют разницу между фактическими значениями зависимой переменной и значениями, предсказанными моделью. Путем анализа остатков можно проверить предпосылки регрессионной модели, такие как нормальность распределения остатков, отсутствие автокорреляции и гетероскедастичности.
Оценка величины остаточной дисперсии позволяет определить степень изменчивости остатков вокруг регрессионной линии. Это важно для проверки однородности дисперсии остатков. Если остаточная дисперсия не постоянна, это может указывать на наличие однородности дисперсионных остатков, что может привести к неправильным выводам из модели (с помощью F-критерия)
Нахождение доверительной области для линии регрессии.можно воспользоваться методом доверительных интервалов для параметров регрессии.
Доверительная область для линии регрессии показывает, где с некоторой вероятностью (обычно 95%) находится истинная линия регрессии.
Для этого можно построить доверительные интервалы для коэффициентов наклона и свободного члена линии регрессии. используя эти интервалы, можно построить доверительную область вокруг линии регрессии.
Общий подход к нахождению доверительной области для линии регрессии включает следующие шаги:
1. Оценка коэффициентов наклона и свободного члена линии регрессии с помощью метода наименьших квадратов.
2. Построение доверительных интервалов для оценок коэффициентов наклона и свободного члена с учетом стандартной ошибки и выбранного уровня доверия.
3. Использование этих доверительных интервалов для построения доверительной области вокруг линии регрессии.
Построение доверительной области позволяет учитывать неопределенность, связанную с оценкой коэффициентов регрессии, и предоставляет информацию о том, где с высокой вероятностью находится истинная линия регрессии.
Понятие о нелинейной и множественной регрессионной зависимости.
Нелинейная
регрессионная зависимость означает,
что связь между зависимой переменной
и одной или несколькими независимыми
переменными не может быть описана
простой линейной моделью. Вместо этого
используются более сложные функции,
такие как квадратичные, экспоненциальные,
логарифмические и другие. Например,
если данные показывают криволинейную
зависимость, то модель может быть
аппроксимирована квадратичной функцией
вместо линейной.
Множественная
регрессионная зависимость возникает,
когда зависимая переменная связана с
двумя или более независимыми переменными.
Коэффициента регрессии в уравнении множественной регрессии показывает как в среднем изменится значение результативного признака, если соответствующий факторный признак увеличится на единицу при фиксированных значениях всех остальных факторов.