
ДЗ№1 ББ-204.1
.docxДомашняя работа №1
Задача 1:
В
двух озёрах (Озеро №1 и Озеро №2) было
проведено изучение биологического
разнообразия рыб. Исследователь
отлавливал в каждом озере рыб и каждый
раз отмечал, к какому семейству относится
выловленная особь (Карповые, Окуневые,
Лососёвые). Полученные данные приведены
в соответствующем файле Excel. На основе
полученных данных постройте столбчатый
график с 95%ДИ для двух групп (Озеро №1 и
Озеро №2). Опишите данные, выписав объёмы
выборок и показатели для качественных
признаков (доля и 95%ДИ для доли).
Задача 2:
Поскольку разнообразие рыб в первом озере было ниже, а в прошлых исследованиях было выявлено большое содержание нитратов в воде этого озера, у исследователя появилась гипотеза: нитраты в воде неблагоприятно влияют на экосистему озера. Чтобы проверить свою гипотезу, исследователь решил определить содержание нитратов в тканях рыб. Рыбы отлавливались (без определения принадлежности к семейству), и у каждой особи измеряли содержание нитратов в крови. Полученные данные приведены во втором файле Excel. Проверьте распределение данных на нормальность: постройте гистограмму, и выпишите значение критерия Шапиро – Уилка и p-значение. В случае неоднородности распределения проведите разделение данных на однородные группы, для выделившихся групп постройте общий график и опишите их, используя показатели для количественных признаков (группы можно назвать «Группа 1», «Группа 2» и т. п.). Не забудьте указать объёмы получившихся выборок. Какой вид графика (столбчатый с 95%ДИ или коробчатый) и какие показатели для описания (среднее с 95%ДИ или медиану с квартилями) Вы использовали в данном случае и почему? Если исходная выборка неоднородна, как Вы думаете, в чём причина неоднородности исходной выборки?
Р
ешение
и графики: Критерий Шапиро – Уилка:
0,8485. Р-значение: 0,00039.
Построив гистограмму, мы видим, что есть неоднородность (2 группы):
Группа 1-ая составляет 62,5% в них среднее содержание нитратов равно 6,7 мг/кг.
Группа 2-ая составляет 37,5% со средним содержанием нитратов 18,2 мг/кг.
Коробчатый график (Box Plot) будет лучшим выбором для представления данных в данной ситуации. Он позволяет наглядно показать медиану, межквартильный размах (25-й и 75-й процентиль). Медиана и квартильные значения лучше отражают характеристики данных в случае неоднородности
Неоднородность выборки, в данном случае, может быть обусловлена несколькими факторами:
Разнообразие видов рыб: если разные виды рыб имеют различную толерантность к нитратам, это может привести к варьированию их содержания в тканях. Например, некоторые виды могут быть более чувствительными к нитратам, чем другие.
Географические условия: Разные участки одного и того же озера могут иметь разное содержание нитратов из-за различных источников загрязнения или особенностей водоема.
Методы отлова: Способы и время отлова рыб могут также влиять на результирующие данные. Например, если одни рыбы были пойманы в утренние часы, а другие — в вечерние, это может привести к различиям в уровнях стресса и, как следствие, в содержании нитратов.
Возраст и размер рыб: Молодые и старые особи могут по-разному накапливать нитраты, что также может добавлять вариативности в данные.