- •Статистика наука о массовых явлениях
- •Способы получения статистической информации (отчетность обследования)
- •Статистическая совокупность (единица совокупности, виды признаков)
- •Виды статистического наблюдения
- •Ошибки статистического наблюдения.
- •Статистическая сводка и группировка
- •Абсолютные и относительные статистические величины
- •Средние величины на базе степенной средней
- •Вычисление средней арифметической при различных вариантах задания исходных данных и их свойства
- •Порядковые статистики. Квартили. Децили. Способы определения по выборочным данным.
- •Мода, определение по статистическим данным, свойства использования в статистическом анализе.
- •Медиана, определение по статистическим данным, свойства использования в статистическом анализе
- •Вариация признаков- важнейшее свойство единиц статистической совокупности
- •Показатели вариации, наиболее часто употребительные в статистике
- •Дисперсия и среднее квадратическое отклонение
- •Коэффициенты вариации, свойства, области применения
- •Графическое представление вариационного ряда
- •Асимметрия распределения (As )
- •Эксцесс распределения (куртозис, Ex)
- •Сглаживание эмпирического распределения нормальным законно распределения
- •Понятие статистической гипотезы и статистического критерия, как инструмента проверки статистических гипотез
- •Проверка гипотезы о законе распределения
- •Ошибки первого и второго рода при проверке статистических гипотез
- •Критерий согласия Xи квадрат (Критерий к. Пирсона).
- •Выборочный метод
- •Виды выборочного статистического исследования
- •Способы обеспечения случайного отбора при формирования выборки.
- •Расслоенная выборка. Способы формирования выборки при расслоенном отборе
- •Доверительный интервал для генеральной средней.
- •Определение необходимого объема выборки.
- •Повторная и бесповторная выборка
- •Средняя ошибка выборки
- •Предельная ошибка выборки.
- •Малая выборка.
- •36. Парная корреляция и регрессия.
- •37.Оценка тесноты связи в задаче парной корреляции
- •38.Соотношение коэффициента корреляции и корреляционного отношения.
- •39. Коэффициент детерминации.
- •40. Оценка существенности корреляционной связи.
- •41.Доверительный интервал для генерального коэффициента корреляции
- •42.Оценка параметров линейной регрессии.
- •43.Корреляционная таблица
- •44.Эмпирическая регрессия.
- •45.Интерпритация правила сложения дисперсий в контексте задачи анализа корреляций.
- •46.Эмпирическое корреляционное отношение.
- •47.Теоретическое корреляционное отношение
- •48.Оценка значимости коэффициента корреляции
- •49.Ранговые коэффициенты корреляции
- •50.Остаточная дисперсия
- •52.Оценка существенности параметров линейной регрессии.
- •54.Оценка тесноты связи в случае альтернативной вариации
- •55.Множественный коэффициент корреляции
- •56.Частная корреляция.
- •58.Компоненты динамического ряда
- •59. Показатели динамического ряда: абсолютный прирост, средний абсолютный прирост, темпы роста и прироста и их среднее значение.
- •61.Приемы выявление сезонной составляющей динамического ряда
- •62. Аналитическое сглаживание динамических рядов.
- •63. Выбор наилучшего тренда из набора возможных.
- •65. Автокорреляция в динамических рядах.
- •67. Анализ взаимосвязанных динамических рядов (кросс-корреляция).
- •68. Прогнозирование по тренду.
- •69. Доверительный интервал для прогнозных значений.
- •71. Индексы цепные, базисные, индивидуальные и сводные, переменного и фиксированного
- •72. Индекс физического объёма продукции.
- •73. Индекс цен (Схема Пааше и Ласпейреса).
- •74. Взаимосвязь индекса цен и индекса физического объема продукции.
- •75. Индекс себестоимости
Проверка гипотезы о законе распределения
Таким образом, анализируя частоты в эмпирическом распределении, можно описать его с помощью математической модели— закона распределения, установить по исходным данным параметры теоретической кривой и проверить правильность выдвинутой гипотезы о типе распределения данного ряда. При исследовании закономерностей распределения очень важно выдвинуть верную гипотезу о типе кривой распределения, так как, если кривая описана математически (с помощью уравнения) верно, она более точно отражает закономерности данного распределения и может быть использована в различных практических расчетах и прогнозах. Кроме того, в этом случае можно сформулировать рекомендации для принятия практических решений теоретическим распределение- это гипотетическое распределение вероятностей, которое предполагается для наблюдаемых частот вариационного ряда.
Общий порядок проверки статистических гипотез таков:
• формулируется основная (проверяемая) и альтернативная гипотезы;
• выбирается статистический критерий для проверки справедливости гипотезы;
• определяются критическая область и область допустимых значений, значения критерия в критических точках;
• проводится выборочное обследование, по результатам которого рассчитывается фактическое значение выбранного критерия;
• на основе сравнения фактического и критического значений критерия делается вывод о правдоподобности или необходимости отклонения выдвинутой гипотезы.
В зависимости от вида проверяемых гипотез (о среднем значении, законе распределения, взаимосвязи признаков и т.д.) выбираются разные критерии (t-статистика (или коэффициент доверия), t-статистика Стьюдента, χ2 -критерий Пирсона; F-критерий Фишера и др.), которые подразделяются на параметрические и непараметрические. Для проведения оценки с использованием параметрических критериев необходимо знать закон распределения генеральной совокупности. Непараметрические критерии могут применяться при любом законе распределения, но при этом сохраняется главное условие — независимость испытаний при формировании выборочной совокупности, на основе которой проверяется выдвинутая гипотеза.
Ошибки первого и второго рода при проверке статистических гипотез
Поскольку при проверке гипотезы используются данные выборочного наблюдения, вывод о ее допустимости носит вероятностный характер, т.е. не исключена возможность ошибки. При этом могут возникать следующие ошибки:
• ошибка первого рода — если в результате проверки делается вывод о необходимости отклонить нулевую гипотезу, которая в действительности верна;
• ошибка второго рода — если нулевая гипотеза не отклоняется, хотя на самом деле она ошибочна.
Критерий согласия Xи квадрат (Критерий к. Пирсона).
Так как все предположения о характере того или иного распределения — это гипотезы, а не категорические утверждения, то они, естественно, должны быть подвергнуты статистической проверке с помощью так называемых критериев согласия. Критерии согласия, опираясь на установленный закон распределения, дают возможность установить, когда расхождения между теоретическими и эмпирическими частотами следует признать несущественными (случайными), а когда — существенными (неслучайными). Таким образом, критерии согласия позволяют отвергнуть или подтвердить правильность выдвинутой при выравнивании ряда гипотезы о характере распределения в эмпирическом ряду и дать ответ, можно ли принять для данного эмпирического распределения модель, выраженную некоторым теоретическим законом распределения.
Существует ряд критериев согласия. Чаще других применяют критерии Пирсона, Романовского и Колмогорова. Рассмотрим их.
Критерий согласия Пирсона χ2 (хи-квадрат) — один из основных критериев согласия. Критерий предложен английским математиком Карлом Пирсоном (1857—1936) для оценки случайности (существенности) расхождений между частотами эмпирического и теоретического распределений. Критерий Пирсона
где
– число групп, на которые разбито эмпирическое распределение
- наблюдаемая частота признака в i–й группе
- теоретическая частота, рассчитанная по предполагаемому распределению
Для распределения χ2 составлены таблицы, где указано критическое значение критерия согласия χ2для выбранного уровня значимости а и данного числа степеней свободы v.
Уровень значимости а — вероятность ошибочного отклонения выдвинутой гипотезы, т.е. вероятность того, что будет отвергнута правильная гипотеза. В статистических исследованиях в зависимости от важности и ответственности решаемых задач пользуются следующими тремя уровнями значимости:
Например, вероятность 0,01 означает, что в одном случае из 100 может быть отвергнута правильная гипотеза. В экономических исследованиях считается практически приемлемой вероятность ошибки 0,05, т.е. в 5 случаях из 100 может быть отвергнута правильная гипотеза.
Кроме того, χ2 -критерий, определяемый по таблице, зависит и от числа степеней свободы. Число степеней свободы v определяется как число групп в ряду распределения к минус число связей z.
Под числом связей понимается число показателей эмпирического ряда, использованных при исчислении теоретических частот, т.е. показателей, связывающих эмпирические и теоретические частоты
Так, в случае выравнивания по кривой нормального распредегния имеется три связи:
Поэтому при выравнивании по кривой нормального распределения число степеней свободы определяется как v = к — 3, где к — число групп в ряду.
В случае выравнивания по кривой Пуассона v = к — 2, так как при построении частот используются две ограничивающие связи:
Для оценки существенности расчетное значение χ2. сравнивается с табличным χ2табл
При полном совпадении теоретического и эмпирического распределений χ2 = 0, в противном случае χ2 > 0.
Если χ2расч > χ2табл то при данном уровне значимости а и числе степеней свободы v гипотезу о несущественности (случайности) расхождений отклоняем.
В случае если χ2расч <χ2табл , заключаем, что эмпирический ряд хорошо согласуется с гипотезой о предполагаемом распределении и с вероятностью (1 — а) можно утверждать, что расхождение между теоретическими и эмпирическими частотами случайно.
Используя критерий согласия χ2 , необходимо соблюдать следующие условия:
1) обьем исследуемой совокупности должен быть достаточно большим (N > 50), при этом частота или численность каждой группы должна быть не менее 5. Если это условие нарушается, необходимо предварительно объединить маленькие частоты;
2) эмпирическое распределение должно состоять из данных, полученных в результате случайного отбора, т.е. они должны быть независимыми. Если в эмпирическом ряду распределение задано частостями следует исчисять по формуле