- •Элементы математической статистики
- •1.1. Предмет и задачи математической статистики Генеральная и выборочная совокупность. Выборочный метод.
- •1.2. Способы отбора статистического материала
- •1.3. Статистическое распределение. Геометрическое изображение
- •1.4. Эмпирическая функция распределения
- •1.5. Выборочные характеристики статистического распределения
- •3. Выборочное среднее квадратическое отклонение.
- •1.6. Статистические оценки параметров распределения
- •1.7. Доверительные интервалы и доверительные вероятности
- •1.8. Оценка существенности различий выборочных средних
- •1.10. Выводы
1.8. Оценка существенности различий выборочных средних
Пусть с целью исследования влияния двух факторов на урожай проводились полевые опыты из двух серий по п делянок. Получены следующие результаты: средний урожай и (ц/га) и исправленные средние квадратические отклоненияs1 и s2. Как установить, является ли расхождение случайным, или оно обусловлено влиянием изучаемых факторов? В первом случае расхождение называется несущественным, а во втором различие существенно. Следует иметь в виду, что ответ не может быть строго определенным, он либо будет верен с некоторой вероятностью g, либо ошибочен с вероятностью р = 1 — g, называемой уровнем значимости.
Составим случайную величину
(1)
где,п – объем выборки (число делянок в серии). Доказано, что случайная величина Т имеет t – распределение Стьюдента, для которого составлены таблицы.
Случайная величина Т зависит от числа степеней свободы v = 2(п – 1) и уровня значимости р. По заданному р и числу степеней v находится t теоретическое.
По формуле (13.8.1) находят t практическое:
Если tпр < tтеор, то с вероятностью ошибки, равной р, считают, что расхождение между средними незначимо, и влияние факторов на урожайность существенным признать нельзя. Если, tпр ≥ tтеор, то расхождение между средними выборочными существенно, оно объясняется влиянием изучаемых факторов.
Если объем выборочных совокупностей неодинаков, то используют более сложные формулы, которые можно найти в подробных курсах (например, [8]).
Пример. В результате полевых испытаний выращен урожай двух сортов картофеля: «Приекульский ранний» и «Дружба». Отобрано по 25 клубней каждого сорта. Результаты взвешивания таковы: выборочное среднее значение и исправленное среднее квадратическое отклонение массы одного клубня сорта «Приекульский» равны = 65 г, s1 = 15 г, для сорта «Дружба» = 90 г, s2 = 20г.
На уровне, значимости р = 0,05 проверить существенность различий выборочных средних.
Решение. Находим
Число степеней свободы р = 2(25 – 1) = 48. Далее получаем tтеор = 2,01, т.е. tпр > 1теор. Расхождение существенно. Принимается утверждение, что обе выборки сделаны из разных генеральных совокупностей, т. е. влияние сорта значимо.
1.10. Выводы
Математическая статистика занимается изучением и разработкой методов сбора, регистрации и обработки статистического материала.
Основным понятием математической статистики является статистическое распределение. Статистическим распределением выборки называется соответствие между количественными признаками и их частотами или относительными частотами. По нему составляется эмпирическая функция распределения, являющаяся оценкой функции распределения признака в генеральной совокупности. Для параметров распределения признака в генеральной совокупности находят точечные и интервальные оценки. Оценка называется точечной, если она характеризуется одним числом. Точечными оценками параметров распределения, в частности, служат выборочная средняя, выборочная дисперсия, исправленная выборочная дисперсия. При малом объеме выборки точечная оценка может намного отличаться от оцениваемого параметра.
Оценка, определяемая двумя числами, – концами интервалов, называется интервальной. Интервал (θ* – δ, θ + δ), который накрывает оцениваемый параметр с вероятностью γ называется доверительным. Вероятность γ называется доверительной. Между доверительным интервалом, доверительной вероятностью и объемом выборки существует тесная связь. Для случая нормально распределенного признака в генеральной совокупности эта связь определяется формулой
где 2Ф(t) = γ, t = Ф–1, Ф–1 (Х)– функция, обратная функции Лапласа.
Важное практическое значение этой формулы состоит в том, что по ней можно заранее установить минимальный объем выборочной совокупности при известных других величинах так, чтобы с заданной вероятностью отклонение выборочной средней от математического ожидания не превышало заранее назначенной величины.
Утверждение, что Хв имеет нормальное распределение, принимается без доказательства.