
- •1. Предмет математической статистики.
- •2. Статистические совокупности, их виды.
- •3. Определяющее свойство статистической совокупности.
- •4. Признаки единиц совокупности, их классификация.
- •5. Описательная характеристика статистических совокупностей.
- •6. Ранжированный ряд распределения, техника его построения.
- •7. Анализ ранжированного ряда распределения.
- •8. Вариационный ряд распределения, техника построения для дискретного признака.
- •9. Интервальный вариационный ряд распределения, техника его построения.
- •10. Анализ дискретного и интервального вариационного ряда распределения.
- •11. Определение статистического показателя применительно к абстрактной статистической совокупности.
- •12. Система статистических показателей для всесторонней характеристики статистического ряда распределения.
- •13. Показатели центральной тенденции, их классификация.
- •14. Параметрические показатели центральной тенденции, их виды, условия применения и алгоритмы расчета.
- •15. Условия типичности параметрических средних.
- •16. Непараметрические средние. Алгоритмы их расчета в ранжированном ряду распределения.
- •17. Алгоритмы расчета структурных средних в дискретном и вариационном рядах распределения.
- •18. Взаимосвязь средней арифметической, моды и медианы.
- •19. Сравнение средней арифметической, моды и медианы.
- •20. Понятие о вариации.
- •Показатели вариации, алгоритмы их расчета
- •Интерпретация показателей вариации
- •Сравнение вариации одного и того же признака в двух совокупностях, сравнение вариации разных по содержанию признаков
- •Конкретная ошибка выборки, распределение конкретных ошибок выборки
- •Средняя ошибка выборки для выборочной средней и выборочной доли
- •61.Область согласия и область отказа. Соотношение между ними
- •62. Статистические таблицы , как инструмент принятия ( отказа ) гипотез
- •68. Особенности проверки гипотезы о соответствии фактического распределения нормальному.: постановка гипотезы; содержание ожидаемых частот; расчет критерия
- •69 Особенности проверки гипотезы о соответствии фактического распределения распределению Пуассона: постановка гипотезы; содержание ожидаемых частот; расчет критерия
- •71. Как критерий независимости. Постановка нулевой и альтернативной гипотез.
- •72. Как критерий независимости. Содержание и алгоритм расчета ожидаемых частот
- •73. Как критерий однородности. Содержание выдвигаемых гипотез
- •74. Как критерий однородности.Какие сравнения определяют величину фактического значения критерия.
- •75. Определение табличного значения критерия при различных аспектах его использования.
- •76. Схема проверки гипотез относительно генеральной средней
- •77. Критерий двухсторонний и односторонний
- •78. Особенности принятия альтернативной гипотезы при направленном ее характере
- •79. Выборки зависимые и независимые
- •80. Особенности проверки гипотез относительно двух средних при равных численностях выборок и равных дисперсиях
- •91. Проверка гипотезы относительно доли признака в двух совокупностях, если хотя бы одна из выборочных долей лежит вне интервала 0,1-0,9
- •92. Проверка гипотезы о принадлежности конкретного наблюдения исследуемой совокупности с использованием критерия t – нормального распределения
- •93. Проверка гипотезы о принадлежности конкретного наблюдения исследуемой совокупности с использованием критерия Диксона
- •94. Постановка гипотез при дисперсионном анализе
- •95 Критерий f- Фишера. Условия его применимости
- •96.Преобразование исходных данных с целью проведения дисперсионного анализа
- •97.Необходимость конкретизации результатов дисперсионного анализа
- •98. Конкретизация результатов дисперсионного анализа на основе критерия q- Тьюки
- •99 Понятие о контрастах
- •100. Схема конкретизации результатов дисперсионного анализа методом контрастов Шефе
- •101. Модель дисперсионного анализа с постоянным эффектом факторов, постановка гипотез и расчет фактического значение критерия.
- •102. Модель дисперсионного анализа со случайным эффектом факторов, постановка гипотез и расчет фактического значение критерия.
- •103. Проверяемые гипотезы при двухфакторном дисперсионном анализе.
- •104. Разложение общего объема вариации признака при двухфакторном дисперсионном анализе и неслучайном формировании повторностей.
- •105. Понятие о многомерном дисперсионном анализе.
- •106. Понятие о корреляционной связи.
- •107. Требования к совокупности и факторным признакам при построении корреляционного уравнения связи.
- •108. Этапы построения уравнения связи.
- •108. Методы нахождения вида уравнения.
- •109. Метод наименьших квадратов, содержание и реализация.
- •110. Интерпретация коэффициентов уравнения.
- •122. Приведение матрицы исходных данных в сопоставимый вид при построении многомерной средней.
- •122. Нормирование исходных данных.
- •125. Выбор итерации, соответствующей оптимальному разбиению.
- •126. Метод k-средних (кластерный анализ с обучением).
- •127. Методы установления центров тяжести.
- •128. Назначение факторного анализа.
- •129. Техника факторного анализа.
- •130. Разложение единичной дисперсии.
- •131. Общность, специфичность, надежность в факторном анализе.
- •132. Общий алгоритм факторного анализа.
- •133. Решение проблемы общности при факторном анализе.
- •134. Установление числа факторов.
- •135. Простая структура Терстоуна.
- •136. Факторные нагрузки.
- •137. Вращение матрицы факторных нагрузок и интерпретация факторов.
- •138. Методы вращения матрицы факторных нагрузок.
- •139. Расчет значений факторов по отдельным наблюдениям.
- •140. Применение результатов факторного анализа при построении регрессионных уравнений.
- •141. Назначение дискриминантного анализа.
- •142. Переменные группировочные и независимые
- •143.Пошаговое включение переменных (переменные в модели и вне модели)
- •144. Канонический анализ, его составляющие
- •150.Матрица классификации
Конкретная ошибка выборки, распределение конкретных ошибок выборки
Ошибка выборочного наблюдения – представляет собой разность между величиной параметра в генеральной совокупности и его величиной, вычисленной по результатам выборочного наблюдения.
Конкретная ошибка – это ошибка проведенной выборки.
Если из генеральной совокупности повторить выборку многократно, то каждый раз будем получать новую величину конкретной ошибки. Некоторые из этих новых величин конкретных ошибок будут совпадать друг с другом по величине и по знаку, т.е. имеет место распределение ошибок; часть из этих новых величин будет равно 0,т.е. наблюдается совпадение оценки и параметра генеральной совокупности.
Средняя ошибка выборки для выборочной средней и выборочной доли
Средняя ошибка – это средняя квадратическая из всех возможных конкретных ошибок оценки.
Средняя ошибка показывает насколько в среднем мы можем ошибиться, если на основе оценки сделаем выводы о параметре генеральной совокупности.
Расчет средней ошибки повторной простой случайной выборки производится следующим образом:
cредняя ошибка для средней
cредняя ошибка для доли
41 – 50 отсутствуют
50
Условие: Если значение ошибки (чаще всего предельной) заранее задано.
Вопрос: Какова должна быть min численность выборки, чтобы ошибка с принятым доверительным уровнем вероятности не выходила за заданные границы.
Алгоритм решения данной задачи вытекает из формулы расчета предельной ошибки
Из этого равенства вытекает
Необходимая численность выборки определяется округленно в большую сторону до целых единиц.
Возникает проблема с
(дисперсия),
так как выборка не проводилась, а величина
ее дисперсии уже известна. Поэтому, если
исследованная ген. Совокупность
подвергалась ранее выборочному
наблюдению, то можно воспользоваться
значением дисперсии по данным предыдущей
выборки, если выборочного наблюдения
не было, то можно провести экспресс
выборку.
Интервалы предельной ошибки задаются в % от оценки (выборочной средней). Формула для расчета min численности выборки
,
-квадрат
выборочного коэф. вар-ии,
- квадрат ошибки в %
51
Условие: При установленных границах ошибки имеет место ограничение в численности выборки.
Вопрос: Какова гарантия (вероятность), что при заданной численности выборки ошибка не выйдет за установленные границы.
Если вероятность окажется 0,90 и более – эта выборка с высокой степенью надежности гарантирует, что ошибка не превысит установленную величину
Если вер-ть ниже 0,90, то следует либо примириться с большей ошибкой, либо найти возможность увеличения численности выборки.
Коэф t связан с уровнем вероятности. Исходя из
Получаем
Находим искомый уровень вероятности по табл. «Значение интеграла нормального распределения вероятностей» или «Критические точки t распределения Стьюдента»
52
При случайном отборе каждой единице ген.совокупности присваивается метка , которая не должна быть связана с изучаемым признаком. Далее используются различные приемы, обеспечивающие случайность отбора (таблица случайных чисел, лототрон), осуществляющие отбор меток, как заменителей единиц.
Случайный отбор делится на: повторный и бесповторный.
Повторный отбор – единицы ген.совокупности, после фиксации значения признака, возвращаются обратно в генеральную совокупность. Поэтому численность ген.совокупности остается постоянной, и вероятность попадания каждой единицы в выборку не изменяется. Из этого способа формирования выборочной совокупности исходя алгоритмы расчета средней и предельной ошибок.
Бесповторный отбор – единицы, попавшие в выборку в ген.совокупность не возвращаются. Численность ген.совокупности уменьшается, вероятность попадания единиц в выборку возрастает
При этом отборе делается поправка на конечность ген.совокупности для расчета средней и предельной ошибок
При больших значениях N, единицей в знаменателе можно пренебречь
Следовательно, алгоритмы (средняя, предельная) будут такими:
<
1, средняя и предельная ошибки всегда
меньше, чем при повторном отборе.
С введением , меняются формулы для расчета других ошибок (не всех)
53
Механический отбор используется в том случае, если единицы генеральной совокупности располагаются в каком-либо порядке во времени или пространстве, или есть возможность это сделать. Порядок не должен быть связан с изучаемым явлением.
Пример: социологические обследования – люди в алфавитном прорядке.
1)Находится шаг или интервал отбора :
2)Осуществляется отбор из совокупности, упорядоченной, с указанным шагом
3)Случайная и предельная ошибки находятся по формулам случайного бесповторного отбора, так как механический осуществляется как бесповторный.
54
Типический отбор используют, если в ген.совокупности имеются своеобразные группы единиц (партии сена с разными сроками заготовки, группы животных на откорме разного возраста), или же можно выделить такие группы (коровы с разными месяцами лактации).
После определения качественно отличных частей, определяется представительство из каждой части в выборке
Ni -численность i-той группы в ген.совокупности, представительство которой в выборке надо определить; N- общая численность генеральной совокупности, n – общая численность выборки, ni – единицы из i-той группы, которые должны быть взяты в выборку.
Следовательно
Иногда представительство групп в выборке определяют пропорционально средним квадратическим отклонениям изучаемого признака в выделенных группах ген.совокупности, дисперсиям или объемам вариации.
Затем производится случайный бесповторный или механический отборы из групп.
При расчете средней и предельной ошибок учитывается колеблемость признака только внутри групп,
Так как остаточная дисперсия является частью общей, типический отбор обеспечиваем min ошибку при прочих равных условиях.
55
Представительство групп в выборке устанавливается пропорционально их численности
Ni -численность i-той группы в ген.совокупности, представительство которой в выборке надо определить; N- общая численность генеральной совокупности, n – общая численность выборки, ni – единицы из i-той группы, которые должны быть взяты в выборку.
Следовательно
Иногда представительство групп в выборке определяют пропорционально средним квадратическим отклонениям изучаемого признака в выделенных группах ген.совокупности, дисперсиям или объемам вариации.
56
Серийный отбор/гнездовой отбор
Выборка формируется из серий/гнезд, состоящих из нескольких единиц. Отбор гнезд проводится механически.
При расчете ошибок учитываются только межсерийные различия. Формулы для расчента средней и предельной ошибок для выборочной средней
и
соответственно средняя и предельная
ошибки выборочной средней, ni
и Ni
число серий (гнезд) соответственно
в выборочной и ген.совокупностях,
- межсерийная дисперсия.
57
Под статистической гипотезой понимается некоторое предположение о ген.совокупности, которое может быть проверено на основе выборки. Так как предположение может касаться распределения численностей или количественной статистической характеристики ген.совокупности, эти гипотезы получили название статистических.
Большинство научных гипотез требуют экспериментальной проверки, а так как данные любого эксперимента являются выборкой, то результаты любого эксперимента подлежат статистической обработке в режиме проверки гипотез. Подобная обработка нужна, чтобы не повторяя до бесконечности эксперимент (не доводя до ген.совокупности) иметь основание на основе единственного эксперимента (одной выборки) формулировать выводы.
58
Формулировка двух гипотез: Нулевая (рабочая) Ho, альтернативная Ha.
Выбор Ho определяется с одной стороны практическими соображениями, а с другой - законом распределения, так называемого критерия. Практическая сторона – в качестве Ho рекомендуется выдвигать предположение противоположное тому, во что изначально верит исследователь. Из теории проверки гипотез следует, что если Ho была принята, то она – единственно верная. Если была принята Ha, то вывод – однозначный. Ну а так как исследователь заинтересован в однозначности вывода, то свое предположение он относит к Ha. Ha-выдвигается в противоположность Ho.
59
Ошибка первого рода – Ho верна, но отвергается, т.к. критерий находится в критической области. Ошибка второго рода – Ho не верна, но мы принимаем ее, т.к значение критерия случайно оказалось в области согласия
Уровень значимости – вероятность допущения ошибки первого рода. Также это совокупная вероятность появления таких значений критерия, при которых отвергается Ho. Иногда уровень значимости трактуется упрощенно, как вероятность ошибки окончательного вывода относительно выдвинутых гипотез. Уровень значимости устанавливается самим исследователем не выше значения α=0,10, стандартными уровнями значимости являются значения равные 0,05 и 0,01.
Соотношение между областью согласия и критической областью регулируется уровнем значимости.
Область согласия – круг значений, при котором принимается Ho. Критическая область – Ho отвергается.
При статистической обработке результатов ошибкам первого и второго, которые влекут бОльшие материальные потери должно отдаваться предпочтение, т.е. они должны минимизироваться. Ошибки первого рода минимизируются уменьшением уровня значимости, второго рода – увеличением до допустимых (0,10) значений.
60
Статистический критерий – инструмент проверки выдвинутых гипотез. Это некая случайная величина, имеющая алгоритм расчета и закон распределения. Его значение может быть рассчитано по выборке – фактическое значение Qфакт . Так как критерий имеет закон распределения, то можно определить вероятность появления тех или иных значений критерия.
Выбор критерия зависит от
содержание гипотезы (распределение численности, средняя генеральная, дисперсия в ген.совокупности)
численность выборки
Критерии подразделяются на: параметрические и непараметрические
Параметрические – выдвигают по отношению к выборке некие предварительные условия (о законе распределения). На основе этого вида критерия делаются более надежные выводы, и параметрическим критериям отдается предпочтение
Непараметрические- условий не выдвигают.