Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Вопросы к экзамену по Биологической статистике.docx
Скачиваний:
14
Добавлен:
12.06.2024
Размер:
1.33 Mб
Скачать

Вопросы к экзамену по Биологической статистике

  1. Биологическая статистика как наука.

Биологическая статистика представляет собой область статистики, которая специализируется на применении статистических методов и анализе данных в биологических исследованиях. Эта наука играет важную роль в понимании различных биологических процессов, включая эволюцию, экологию, генетику, физиологию и другие области. В биологической статистике используются различные методы статистического анализа для интерпретации данных, полученных из наблюдений над живыми организмами или биологическими системами. Эти методы могут включать в себя оценку различий между группами организмов, анализ временных рядов, моделирование популяционных процессов, исследование генетической изменчивости и многое другое. Биологическая статистика также играет важную роль в дизайне экспериментов и определении объема выборок для обеспечения статистической значимости результатов исследований. Она помогает ученым извлекать информацию из сложных биологических данных, делать выводы о популяционных трендах, выявлять корреляции и прогнозировать результаты на основе статистических моделей. Таким образом, биологическая статистика является важным инструментом для биологов и других ученых, работающих в области живой природы, поскольку она позволяет систематизировать, анализировать и интерпретировать данные, полученные из наблюдений над живыми организмами.

  1. Значение биологической статистики в исследовательской работе и профессиональной подготовке специалистов-биологов.

Связи современной биологии с математикой многосторонни, они все более расширяются и углубляются. В настоящее время трудно указать область знания, в которой не применялись бы математические методы. Даже в такой, казалось бы, очень далекой от математики области, как анатомия человека, не обходятся без применения биометрии. Биометрия необходима и при изучении наследуемости и повторяемости хозяйственно важных признаков, измерении связей между ними и во многих других случаях. Применение биометрии оказалось полезным во многих областях прикладной биологии. Так, благодаря биометрическому анализу массовых антропологических измерений антропологам удалось подойти к довольно точному обоснованию принципов раскроя и стандартизации обуви и одежды, изготовляемой для массового потребления. Биометрические показатели легли в основу количественной оценки физического развития человека, его спортивных и трудовых достижений. Несомненно, что значение биометрии для наук, изучающих биологические объекты, будет возрастать тем более, чем успешнее применяются достижения счетно-вычислительной техники. Конечно, не всякое исследование опирается на биометрию. В биологии с успехом применяют и чисто описательные методы, не требующие количественных оценок получаемых результатов. Но там, где исследования проводят с использованием счета или меры, применение биометрии становится совершенно необходимым. В таких случаях пренебрежение методами биометрии или неправильное их применение приводит к неоправданным затратам труда и времени, а главное — к мало убедительным, а нередко и ошибочным выводам. В качестве примера можно привести одну из попыток опровергнуть закон расщепления, открытый Г. Менделем. В 1939 г. были опубликованы опыты Н. Е. Ермолаевой, из которых якобы следовало, что частота встречаемости доминантного признака во втором поколении гибридов не совпадает с ожидаемой величиной 3/4. Отсюда был сделан вывод о несостоятельности упомянутого закона Менделя. Заинтересовавшись работой Ермолаевой, акад. А. Н. Колмогоров подверг ее данные статистическому анализу и пришел к прямо противоположному выводу. В статье, опубликованной в одном из номеров журнала «Доклады Академии наук СССР» (1940), он писал: «Материал этот, вопреки сомнению самой Н. Е. Ермолаевой, оказывается блестящим подтверждением законов Менделя». Ошибка Ермолаевой явилась следствием пренебрежительного отношения к биометрии, недооценки ее роли в исследовательской работе. Приведенный пример показывает, во-первых, что пренебрежение биометрическими методами при изучении варьирующих объектов приводит к неубедительным и даже ошибочным выводам, а во-вторых, что неумелое, формальное применение биометрии создает лишь видимость строгой научности, а в действительности приносит не пользу, а вред. Биометрия — формальная наука. Применение ее к анализу изучаемых явлений требует известной осторожности. Недаром, по образному выражению Гексли, биометрию сравнивают с жерновом, «который всякую засыпку смелет, но ценность помола определяется исключительно ценностью засыпанного». Биометрия призвана вооружать исследователей методами статистического анализа, воспитывать у них статистическое мышление, раскрывая перед ними диалектику связи между частью и целым, причиной и следствием, случайным и необходимым в явлениях живой природы. Поистине трудно переоценить значение биометрии в подготовке научно-педагогических кадров. Биометрия – раздел биологии, содержанием которого являются планирование и обработка результатов количественных экспериментов и наблюдений методами математической статистики. При проведении биологических экспериментов и наблюдений исследователь всегда имеет дело с количественными вариациями частоты встречаемости или степени проявления различных признаков и свойств. Поэтому без специального статистического анализа обычно нельзя решить, каковы возможные пределы случайных колебаний изучаемой величины и являются ли наблюдаемые разницы между вариантами опыта случайными или достоверными. Математико-статистические методы, применяемые в биологии, разрабатываются иногда вне зависимости от биологических исследований, но чаще в связи с задачами, возникающими в биологии, экологии, сельском хозяйстве и медицине. Применение этих методов в биологии по существу представляет выбор некоторой статистической модели, проверку ее соответствия экспериментальным данным и анализ статистических и биологических результатов, вытекающих из ее рассмотрения. Люди использовали математику для описания и анализа биологических явлений на протяжении всей истории цивилизации. Известно, что еще древние пифагорейцы считали материальный мир неполноценным воплощением идеальных чисел и полагали возможным при помощи вычислений познать универсальные законы. Значительно позднее Галилео Галилей в знаменитых «Диалогах», говоря о размерах животных, рассуждал чисто математически и писал, что «скелет животного возрастает как третья степень увеличивающихся линейных размеров». В начале XII века Реомюр пытался найти математические законы строения пчелиных сот, а за 30 лет до него Борелли делал математические расчѐты движения животных. В Афинах с древнейших времен велся регулярный учет естественного движения населения, велась регистрация рожденных и умерших. К первым попыткам научной обработки таких собранных официальных данных можно отнести известную «таблицу» римского юриста Ульпиана (ок. 170–228 гг.). Он пытался установить продолжительность жизни для разных возрастных групп с целью определения пожизненной ренты для каждого возраста.

  1. Понятие о наименьшей выборочной единице (единице наблюдения) и данных в биологии.

  2. Предметом биометрии служит любой биологический объект, изучаемый с применением счета или меры, т.е. с количественной стороны в целях более или менее точной оценки его качественного состояния. При этом, как уже сообщалось, имеются в виду не единичные, а групповые объекты, т. е. явления массовые, в сфере которых проявляют свое действие статистические законы. Например, врач принял больного и назначил необходимое ему лекарство — это единичное явление, отдельный акт. Если же врач принял несколько больных или подверг неоднократному осмотру одного и того же больного, — это массовое явление независимо от того, каким был объект наблюдения — единичным или групповым. Обычно наблюдения проводят на групповых объектах, например на особях одного и того же вида, пола и возраста, которые рассматривают как составные элементы, или члены группового объекта, и называют единицами наблюдения. Множество относительно однородных, но индивидуально различимых единиц, объединенных для совместного (группового) изучения, называют статистической совокупностью. Понятие статистической совокупности — одно из фундаментальных биометрических понятий. Оно базируется на принципе качественной однородности ее состава. Нельзя объединять в одну совокупность особей разного пола и возраста, когда речь идет о нормах питания, стандартизации обуви и одежды, поскольку заведомо известно, что с возрастом и в зависимости от пола индивидов меняются их потребности в питании и закономерно изменяются размеры и пропорции тела. Недопустимо изучать закономерность модификационной изменчивости на генетически неоднородном материале, объединяя в одну совокупность чистопородных и гибридных особей и т. д.

    Генеральная совокупность и выборка.

Генеральной совокупностью называют совокупность объектов или наблюдений, все элементы которой подлежат изучению при статистическом анализе. Отобранная тем или иным способом часть генеральной совокупности называется выборочной совокупностью или выборкой. Генеральная совокупность может быть конечной или бесконечной. Общую сумму членов генеральной совокупности называют ее объемом и обозначают буквой N.

  1. Количественные переменные: дискретные и непрерывные.

Признаки подразделяются на количественные (континуальные) и качественные (атрибутивные или категориальные).

Количественные (quantitative) поддаются непосредственному измерению или счету, имеют конкретные числовые значения и могут быть непрерывными (мерными) или дискретными (счетными).

Непрерывные переменные (continuous) (например, рост, вес, температура организма, содержание органических и неорганических веществ в его тканях и т.п.), варьируют непрерывно, их величина может принимать в определенных пределах между минимальным и максимальным показателем признака любые числовые значения.

Дискретные (discrete) (например, количество яиц у птицы, лепестков у цветка, зерен в колосе, число глазков на клубне картофеля, пятен на надкрыльях жука) варьируют прерывисто или дискретно: их числовые значения выражаются только целыми числами

  1. Качественные переменные.

Качественные признаки (qualitative) не поддаются непосредственному измерению или счету и учитываются по наличию их свойств у отдельных членов изучаемой группы. Примером качественных признаков может быть пол, национальность человека, его имя, фамилия, цвет глаз, волос. Качественные переменные можно разбить на два типа: порядковые и номинальные. Порядковые переменные (ordinal) можно упорядочить, например оценки или фамилии и имена (по возрастанию или убыванию). Номинальные (nominal) качественные переменные нельзя упорядочить: например, национальность, пол. Если признаки можно противопоставить друг другу, их называют альтернативными: например, женский – мужской, больной – здоровый.

  1. Ранговая шкала измерений в биометрии.

Порядковая (неметрическая) или ранговая шкала – это шкала, классифицирующая по принципу «больше – меньше». Если в шкале наименований было безразлично, в каком порядке расположены классификационные ячейки, то в порядковой шкале они образуют последовательность от ячейки «самое малое значение» к ячейке «самое большое значение» (или наоборот). Такие ячейки называют классами или рангами. Единица измерения в шкале порядка – расстояние в 1 класс или в 1 ранг, при этом расстояние между классами и рангами может быть разным. Данные в такой шкале выстраивают (ранжируют), чаще всего, по возрастанию. Затем каждой варианте присваивается ранг (R) – порядковый номер того места, которое оно занимает в этом ряду. Одинаковым по величине вариантам присваивается один и тот же средний ранг, который находится как среднее арифметическое между такими вариантами. Сумма всех присвоенных рангов для группы численностью n должна равняться (2.1):

  1. Производные переменные: пропорции, индексы.

Кроме количественных и качественных, признаки (переменные) могут быть производными, то есть вычисляемыми по какой-либо формуле. Например, при изучении некоторого альтернативного признака, который мог проявиться, а мог и не проявиться, общее число всех исследуемых вариант составило n. Тогда, если численность вариант с проявившимся признаком обозначить через m, то численность противоположной группы, не имеющей этого признака, будет равна (n – m). Численность альтернатив можно выразить в долях единицы, а также в процентах от их общего числа n. Доля (отношение, пропорция) – это отношение числа вариант, обладающих учитываемым признаком, к общему числу всех вариант. Доля обозначается через wd, а доля противоположной группы – qd (2.2):

К производным переменным (признакам) относятся индексы, которые, как и доля, являются относительными величинами. Слово «индекс» в переводе с латинского (index) означает «указатель», «показатель». Индекс часто используют как показатель, получающийся в результате сравнения двух величин, характеризующих уровень изучаемого явления для двух разных периодов. Индекс может быть выражен в виде коэффициентов или в виде процентов. Если индекс больше 1, уровень изучаемого явления растет, если меньше 1 – снижается. С помощью индекса рассчитывается, например, индекс массы тела (ИМТ) – масса, скорректированная на рост, по формуле (2.5)

  1. Сплошное и выборочное обследование совокупностей.

В зависимости от величины генеральной совокупности и целей исследования могут быть использованы методы сплошного или выбо­рочного обследования.

Метод сплошного обследования включается в опросе всех потреби­телей генеральной совокупности на рынке. Метод связан с высокими затратами на проведение исследования, его использование оправданно в случае малого количества потребителей, представляющих сегмент, или в случае больших размеров потребителя, когда объем покупок клиен­тов данного сегмента составляет значительную долю от емкости рын­ка в целом.

Метод выборочного обследования обеспечивает меньшую точность по сравнению с методом сплошного обследования, однако он менее трудоемок. Целесообразно использование данного метода при нали­чии на рынке большого числа однородных потребителей.

  1. Важность случайного (рендомизированного) отбора единиц наблюдения

Случайный отбор единиц наблюдения является ключевым методом при формировании выборок в исследованиях, так как он обеспечивает репрезентативность выборки и позволяет делать обобщения на всю популяцию. Вот несколько причин, почему случайный отбор важен: 1. Избежание смещения: Случайный отбор помогает избежать смещения выборки, когда определенные группы или типы единиц наблюдения представлены в выборке недостаточно или, наоборот, слишком сильно. Это позволяет получить более объективные результаты и делать обобщения на всю популяцию. 2. Статистическая значимость: Случайный отбор обеспечивает статистическую значимость результатов и позволяет проводить статистические тесты для проверки гипотез. Это важно для того, чтобы убедиться, что различия или связи, выявленные в выборке, не случайны. 3. Объективность: Случайный отбор делает процесс формирования выборки более объективным и исключает субъективное вмешательство и предвзятость со стороны исследователя. 4. Репрезентативность: Правильно выполненный случайный отбор обеспечивает репрезентативность выборки, то есть выборка точно отражает разнообразие и характеристики популяции, на которую делаются выводы. 5. Возможность обобщения: Благодаря случайному отбору можно обобщать результаты исследования на всю популяцию с большей уверенностью, так как выборка будет более точным представлением популяции. Таким образом, случайный отбор единиц наблюдения является фундаментальным принципом при формировании выборок, который обеспечивает надежность, объективность и репрезентативность результатов исследования.

  1. Понятие о репрезентативной и смещенной выборках.

  2. Объем выборки, обозначаемый буквой п, должен содержать не менее двух единиц. Сущность выборочного метода заключается в том, чтобы по определенной части генеральной совокупности судить о ее свойствах в целом. Выборка должна быть достаточно представительной, то есть должна в полной мере представлять генеральную совокупность, особенно, если та содержит разнородные элементы. Выборка должна быть репрезентативной. Репрезентативность выборки достигается способом рандомизации или случайным отбором вариант из генеральной совокупности. Если выборка не является репрезентативной, она называется смещенной.

    Полностью случайный отбор и его реализация при помощи таблиц случайных чисел.

При простой случайной выборке исследователь сначала формирует основу выборочного наблюдения, в которой каждому элементу присваивается уникальный идентификационный номер. Затем генерируются случайные числа, чтобы определить номера элементов, которые будут включены в выборку. Эти случайные числа могут генерироваться компьютерной программой, жребием или с помощью таблицы случайных чисел.

  1. Стратифицированный отбор при формировании выборок.

Стратифицированная, расслоенная выборка – это процесс, состоящий из двух этапов, в котором совокупность сначала делится на подгруппы (слои, страты, strata). Затем элементы случайным образом выбираются из каждого слоя. Элементы, относящиеся к одному слою, должны быть как можно более однородными, а относящиеся к разным слоям – наоборот, как можно более разнородными. Для стратификации можно использовать несколько переменных, но больше двух применяют редко. Количество слоев в расслоенной выборке должно быть не больше шести.

  1. Систематический отбор при формировании выборок.

При проведении систематического отбора из основы выборочного наблюдения последовательно выбирают каждый i-й элемент. Интервал выборки i определяется как отношение объема совокупности N к объему выборки n, с округлением результата до ближайшего целого числа. Например, совокупность состоит из 100 тысяч элементов, а желательный объем выборки равен тысяче объектов. В этом случае интервал выборки i равен 100. Выбирается случайное число между 1 и 100. Если, например, это число равно 23, то выборка состоит из элементов 23, 123, 223, 323, 423, 523 и т.д.

  1. Группировка данных в вариационный ряд.

  1. Способы графического изображения вариационного ряда: полигон (кривая) распределения, гистограмма.

Анализ рядов распределения сопровождается их графическим изображением. Именно графики лучше всего позволяют судить о форме распределения. Для отображения вариационных рядов распределения используются следующие графики: полигон, гистограмму и кумуляту. Полигон применяют для графического изображения дискретного вариационного ряда, и этот график является разновидностью статистических ломаных. В прямоугольной системе координат по оси абсцисс откладываются варианты признака, а по оси ординат – частости каждого варианта. На пересечении абсциссы и ординаты фиксируют точки, соответствующие данному ряду распределения. Соединив эти точки прямыми, получим ломаную, которая и является полигоном, или эмпирической кривой распределения. Для замыкания полигона крайние вершины соединяют с точками на оси абсцисс, отстоящими на одно деление в принятом масштабе, или с серединами предыдущего (перед начальным) и последующим (за последним) интервалов.

Гистограмма применяется для графического изображения непрерывных (интервальных) вариационных рядов. При этом на оси абсцисс откладывают интервалы ряда. На этих отрезках строят прямоугольники, высота которых по оси ординат в принятом масштабе соответствует частотам. При равных интервалах по оси абсцисс откладывают прямоугольники, сомкнутые друг с другом, с равными основаниями и ординатами, пропорциональными весам. Данный ступенчатый многоугольник и называется гистограммой. Его построение аналогично построению столбиковых диаграмм. Гистограмма может быть преобразована в полигон распределения, для чего середины верхних сторон прямоугольников соединяют отрезками прямых. Две крайние точки прямоугольников замыкают по оси абсцисс на середине интервалов аналогично замыканию полигона. В случае неравенства интервалов график строится не по частотам или частостям, а по плотности распределения (отношению частот или частостей к величине интервала), и тогда высоты прямоугольников графика будут соответствовать величинам этой плотности.

  1. Теоретические распределения случайных величин и их свойства: биномиальное распределение, распределение Пуассона, нормальное распределение.

Распределение Бернулли используется для того, чтобы определить вероятность успешного исхода при одном испытании. Биномиальное распределение используется для определения вероятности появления определенного числа успешных исходов при n независимых испытаниях. Распределение Пуассона описывает число событий, происходящих в одинаковых промежутках времени или на одинаковых площадях, при условии, что события происходят независимо друг от друга. Биномиальное распределение и распределение Пуассона для случайной величины Х можно рассчитать по таблицам.

К непрерывным распределениям относят нормальное, а также связанные с нормальным распределения: Стьюдента, 2  – квадрат и F – распределение Фишера.

  1. Коэффициенты асимметрии и эксцесса.

Коэффициент асимметрии и эксцесса - это меры, используемые в статистике для измерения формы распределения вероятностей случайной величины. 1. Коэффициент асимметрии (skewness) измеряет степень и направление асимметрии распределения случайной величины. Если распределение смещено вправо (больше значений сосредоточено слева от среднего), то коэффициент асимметрии положителен. Если распределение смещено влево (больше значений сосредоточено справа от среднего), то коэффициент асимметрии отрицателен. Для симметричных распределений коэффициент асимметрии равен нулю. 2. Коэффициент эксцесса (kurtosis) измеряет степень остроты или плоскости пика распределения случайной величины, а также наличие "тяжелых" хвостов. Положительный коэффициент эксцесса указывает на более острый и высокий пик, чем у нормального распределения (нормальное распределение имеет коэффициент эксцесса равный 0). Отрицательный коэффициент эксцесса указывает на более плоский пик, чем у нормального распределения. Эти меры позволяют более детально описать форму распределения данных и помогают исследователям понять его особенности, что важно при статистическом анализе данных.

  1. Средние величины: средняя арифметическая, взвешенная средняя, геометрическая средняя.

Средняя арифметическая: Средняя арифметическая - это сумма всех значений, деленная на количество этих значений. Для набора чисел x_1, x_2, ..., x_n средняя арифметическая обозначается как x̅

Взвешенная средняя: В отличие от средней арифметической, взвешенная средняя учитывает вес каждого значения. Для набора чисел x_1, x_2, ..., x_n с весами w_1, w_2, ..., w_n взвешенная средняя обозначается как x̅_w

Геометрическая средняя: Геометрическая средняя используется для нахождения среднего геометрического набора положительных чисел. Для набора чисел x_1, x_2, ..., x_n геометрическая средняя обозначается как G

Каждый тип средней величины имеет свои особенности и применяется в различных контекстах в статистике, финансах, экономике и других областях.

  1. Меры разброса единиц совокупности: дисперсия и стандартное отклонение. Коэффициент вариации.

Определение. Дисперсией случайной величины называется математическое ожидание квадрата отклонения случайной величины от ее математического ожидания

.

Слово «дисперсия» означает «рассеяние», т.е. дисперсия характеризует рассеяние (разбросанность) значений случайной величины около ее математического ожидания.

Из определения следует, что дисперсия – это постоянная величина, т.е. числовая характеристика случайной величины, которая имеет размерность квадрата случайной величины.

С вероятной точки зрения, дисперсия является мерой рассеяния значений случайной величины около ее математического ожидания.

Действительно, рассмотрим дискретную случайную величину, которая имеет конечное множество значений.

Величина, равная квадратному корню из дисперсии, называется стандартным отклонением (sx ), т.е.:

Совершенно очевидной интерпретацией стандартного отклонения является его способность оценивать «типичность» среднего: стандартное отклонение тем меньше, чем лучше среднее суммирует, «представляет» данную совокупность наблюдений.

Из всех показателей вариации среднеквадратическое отклонение в наибольшей степени используется для проведения других видов статистического анализа. Однако среднеквадратическое отклонение дает абсолютную оценку меры разбросанности значений и чтобы понять, насколько она велика относительно самих значений, требуется относительный показатель. Такой показатель называется он коэффициент вариации.

  1. Структурные средние. Мода. Медиана. Квантили.

Медиана (Ме) – это средняя величина, относительно которой вариационный ряд распределения делится на две половинки.

Мода (Мо) – величина, которая встречается в данной совокупности наиболее часто.

К структурным характеристикам вариационного ряда относятся квантили, отсекающие в пределах ряда определенную часть его членов (вариант). К ним относятся квартили, децили и перцентили (процентили или персентили). Квартиль – величина, отсекающая 1 /4 всех членов ряда. Три квартиля – q1, q2, q3 – делят весь вариационный ряд на четыре равночисленные части (кварты). Дециль – величина, отделяющая 1 /10 всех членов ряда. Девять децилей делят весь вариационный ряд на десять равных частей. Соответственно, перцентиль (процентиль) (Pi) – величина, отделяющая 1 /100 всех членов ряда.

  1. Расчет параметров описательной статистики при качественной изменчивости.

  2. При качественной изменчивости описательная статистика включает в себя такие параметры, как частота, относительная частота и процентное соотношение. 1. Частота: Частота представляет собой количество раз, которое определенное значение или категория встречается в наборе данных. 2. Относительная частота: Относительная частота показывает долю или процент встречаемости определенного значения или категории относительно общего числа наблюдений. 3. Процентное соотношение: Процентное соотношение представляет собой относительную частоту, выраженную в процентах. Это позволяет лучше воспринимать долю каждой категории в наборе данных. При работе с качественными данными, такими как категории или номинальные переменные, эти параметры помогают понять распределение значений и их относительную значимость в наборе данных.

    Оценка репрезентативности выборочных показателей при помощи стандартной ошибки.

Репрезентати́вность (фр. représentatif — представляющий собой что-либо, показательный, характерный) — соответствие характеристик выборки характеристикам популяции или генеральной совокупности в целом.

Стандартная ошибка (Standard Error) используется для оценки точности или репрезентативности выборочной статистики, такой как среднее значение или коэффициент корреляции, относительно истинного значения в генеральной совокупности. Она представляет собой меру изменчивости выборочных статистик в различных выборках из одной и той же генеральной совокупности. Стандартная ошибка обычно вычисляется как стандартное отклонение выборки, деленное на квадратный корень из размера выборки. Чем меньше стандартная ошибка, тем ближе выборочная статистика к истинному значению в генеральной совокупности.

  1. Способы определения достаточного объема выборки.

Определение достаточного объема выборки зависит от нескольких факторов, включая желаемую точность оценок, уровень доверия и вариабельность данных. Вот несколько распространенных способов определения достаточного объема выборки: 1. Формула для расчета размера выборки: Существуют стандартные формулы, которые позволяют рассчитать необходимый размер выборки на основе желаемой точности оценок, уровня доверия и ожидаемой вариабельности в данных. 2. Использование таблиц и графиков: Для определения достаточного объема выборки можно использовать стандартные таблицы или графики, которые позволяют связать уровень доверия, точность оценок и вариабельность с необходимым размером выборки. 3. Эмпирические правила: Некоторые исследователи используют эмпирические правила, такие как правило 30 или правило 10%, которые предполагают, что для большинства ситуаций определенный минимальный размер выборки будет достаточным. 4. Использование статистических пакетов: Многие статистические пакеты предоставляют инструменты для расчета достаточного объема выборки на основе заданных параметров и критериев. 5. Пилотные исследования: Иногда проводят пилотные исследования, чтобы оценить вариабельность данных и определить необходимый размер выборки для основного исследования. Выбор метода определения размера выборки зависит от конкретной ситуации и требуемой точности оценок.

  1. Доверительные интервалы для средней арифметической и для доли.

Доверительный интервал для средней арифметической:Доверительный интервал для средней арифметической используется для оценки диапазона значений, в котором, с определенной вероятностью, находится истинное значение среднего в генеральной совокупности. Обычно он строится на основе выборочного среднего и стандартной ошибки среднего. Для 95% доверительного интервала используется критическое значение 1.96, но это может изменяться в зависимости от уровня доверия.

Доверительный интервал для доли:Доверительный интервал для доли используется для оценки диапазона значений, в котором, с определенной вероятностью, находится истинная доля в генеральной совокупности. Он строится на основе выборочной доли и стандартной ошибки доли. Обычно для 95% доверительного интервала используется критическое значение 1.96.

  1. Способы представления средних величин, мер разброса, стандартных ошибок и доверительных интервалов в научных публикациях.

В научных публикациях средние величины, меры разброса, стандартные ошибки и доверительные интервалы представляются с использованием различных статистических методов и символов. Вот несколько способов их представления: 1. Средние величины: - Средние значения обычно представляются с использованием символа x̅ для выборочного среднего и μ для среднего значения в генеральной совокупности. 2. Меры разброса: - Диапазон значений, стандартное отклонение и дисперсия используются для измерения разброса данных. Обычно они представляются с использованием символов s (выборочное стандартное отклонение), σ (стандартное отклонение в генеральной совокупности) и S^2 (выборочная дисперсия). 3. Стандартные ошибки: - Стандартная ошибка используется для измерения неопределенности в оценке параметра. Она часто обозначается как SE или SE(x̅) для стандартной ошибки выборочного среднего. 4. Доверительные интервалы: - Доверительные интервалы представляются в виде диапазона значений, в котором, с определенной вероятностью, находится истинное значение параметра. Обычно они представляются в формате "среднее значение ± доверительный интервал", например " x̅± 1.96 s/√(n) " для 95% доверительного интервала. При написании научных публикаций важно ясно указывать методы расчета и представления статистических данных, чтобы обеспечить понимание их интерпретации читателями и другими исследователями.

  1. Понятие о статистической гипотезе. 28. Нулевая и альтернативная статистические гипотезы.

Статистическая гипотеза – это определенное предположение о распределении вероятностей, лежащем в основе наблюдаемой выборки данных. В области биометрии широко используется так называемая нулевая гипотеза (Н0), которая чаще всего носит общепринятый характер. Например: средняя температура воздуха зимы этого года не отличается от прошлогодней. Студенты дневного отделения сдают зачет по биометрии так же, как студенты заочного.

Противоположная нулевой – альтернативная гипотеза (НА или Н1) – исходит из обратного предположения, например, средняя температура воздуха зимы этого года отличается от прошлогодней. Студенты дневного отделения успешнее сдают зачет по биометрии, чем студенты заочного.

29. Статистические критерии (тесты).

Гипотеза выражается в терминах вероятности и может быть проверена по выборочным характеристикам. Проверка статистической гипотезы, или статистический тест – это процесс принятия решения о том, противоречит ли рассматриваемая статистическая гипотеза наблюдаемой выборке данных или нет.

Статистические тесты (например, Т-критерий Стьюдента или U-критерий Манна-Уитни) могут показать вероятность того, что две случайным образом взятые выборки (см.) принадлежат к одной генеральной совокупности. Если эта вероятность мала, то нуль-гипотеза может быть отброшена, т.е. можно сделать заключение, что утверждение "результаты обеих групп являются случайными выборками одной генеральной совокупности" неверно (правильнее было бы сказать - маловероятно). Следует учитывать, что единственный вывод, который правомочно сделать после статистической обработки данных Э., состоит в факте отрицания нуль-гипотезы, а не в "подтверждении" исследовательской гипотезы.

30. Вероятность справедливости нулевой гипотезы (уровень значимости).

Уровень значимости (обычно обозначается как α) представляет собой вероятность ошибки первого рода при отклонении нулевой гипотезы, когда она фактически верна. В статистике уровень значимости используется для определения того, насколько сильные должны быть данные, чтобы отвергнуть нулевую гипотезу. Обычно уровень значимости выбирается заранее и обозначает вероятность ошибки первого рода, которую исследователь готов допустить. Наиболее распространенные значения уровня значимости в статистике - это 0.05 (5%) и 0.01 (1%), но его можно выбирать в зависимости от конкретной задачи и требований исследования. Если полученное значение p-уровня значимости (p-value) меньше или равно уровню значимости α, то нулевая гипотеза отвергается. Это означает, что данные предоставляют достаточно доказательств для того, чтобы считать результат статистически значимым. Важно помнить, что уровень значимости не определяет вероятность того, что нулевая гипотеза верна или ложна; он определяет вероятность того, что будет совершена ошибка первого рода при отклонении нулевой гипотезы. Таким образом, уровень значимости играет важную роль в статистических тестах и позволяет исследователям контролировать вероятность ошибок при принятии решений на основе данных.