
- •Элементы математической статистики
- •1.1. Предмет и задачи математической статистики Генеральная и выборочная совокупность. Выборочный метод.
- •1.2. Способы отбора статистического материала
- •1.3. Статистическое распределение. Геометрическое изображение
- •1.4. Эмпирическая функция распределения
- •1.5. Выборочные характеристики статистического распределения
- •3. Выборочное среднее квадратическое отклонение.
- •1.6. Статистические оценки параметров распределения
- •1.7. Доверительные интервалы и доверительные вероятности
- •1.8. Оценка существенности различий выборочных средних
- •1.10. Выводы
1.8. Оценка существенности различий выборочных средних
Пусть с целью
исследования влияния двух факторов на
урожай проводились полевые опыты из
двух серий по п
делянок.
Получены следующие результаты: средний
урожай
и
(ц/га)
и исправленные средние квадратические
отклоненияs1
и s2.
Как установить,
является ли расхождение
случайным,
или оно обусловлено влиянием изучаемых
факторов? В первом случае
расхождение
называется
несущественным,
а во втором различие существенно. Следует
иметь в виду, что ответ не может быть
строго определенным, он либо будет верен
с некоторой вероятностью g,
либо ошибочен
с вероятностью р
= 1 — g,
называемой
уровнем
значимости.
Составим случайную величину
(1)
где,п –
объем выборки (число делянок в серии).
Доказано, что случайная величина Т
имеет t
– распределение Стьюдента, для которого
составлены таблицы.
Случайная величина Т зависит от числа степеней свободы v = 2(п – 1) и уровня значимости р. По заданному р и числу степеней v находится t теоретическое.
По формуле (13.8.1) находят t практическое:
Если tпр < tтеор, то с вероятностью ошибки, равной р, считают, что расхождение между средними незначимо, и влияние факторов на урожайность существенным признать нельзя. Если, tпр ≥ tтеор, то расхождение между средними выборочными существенно, оно объясняется влиянием изучаемых факторов.
Если объем выборочных совокупностей неодинаков, то используют более сложные формулы, которые можно найти в подробных курсах (например, [8]).
Пример.
В результате полевых испытаний выращен
урожай двух сортов картофеля: «Приекульский
ранний» и «Дружба». Отобрано по 25 клубней
каждого сорта. Результаты взвешивания
таковы: выборочное среднее значение и
исправленное среднее квадратическое
отклонение массы одного клубня сорта
«Приекульский» равны
= 65 г, s1
= 15 г, для сорта «Дружба»
=
90 г, s2
= 20г.
На уровне, значимости р = 0,05 проверить существенность различий выборочных средних.
Решение. Находим
Число степеней свободы р = 2(25 – 1) = 48. Далее получаем tтеор = 2,01, т.е. tпр > 1теор. Расхождение существенно. Принимается утверждение, что обе выборки сделаны из разных генеральных совокупностей, т. е. влияние сорта значимо.
1.10. Выводы
Математическая статистика занимается изучением и разработкой методов сбора, регистрации и обработки статистического материала.
Основным понятием математической статистики является статистическое распределение. Статистическим распределением выборки называется соответствие между количественными признаками и их частотами или относительными частотами. По нему составляется эмпирическая функция распределения, являющаяся оценкой функции распределения признака в генеральной совокупности. Для параметров распределения признака в генеральной совокупности находят точечные и интервальные оценки. Оценка называется точечной, если она характеризуется одним числом. Точечными оценками параметров распределения, в частности, служат выборочная средняя, выборочная дисперсия, исправленная выборочная дисперсия. При малом объеме выборки точечная оценка может намного отличаться от оцениваемого параметра.
Оценка, определяемая двумя числами, – концами интервалов, называется интервальной. Интервал (θ* – δ, θ + δ), который накрывает оцениваемый параметр с вероятностью γ называется доверительным. Вероятность γ называется доверительной. Между доверительным интервалом, доверительной вероятностью и объемом выборки существует тесная связь. Для случая нормально распределенного признака в генеральной совокупности эта связь определяется формулой
где
2Ф(t)
= γ,
t
= Ф–1,
Ф–1
(Х)–
функция, обратная функции Лапласа.
Важное практическое значение этой формулы состоит в том, что по ней можно заранее установить минимальный объем выборочной совокупности при известных других величинах так, чтобы с заданной вероятностью отклонение выборочной средней от математического ожидания не превышало заранее назначенной величины.
Утверждение, что Хв имеет нормальное распределение, принимается без доказательства.