Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
биг шпора.doc
Скачиваний:
2
Добавлен:
22.09.2019
Размер:
2.04 Mб
Скачать

1. Статистика – наука о массовых явлениях.Статистика – наука и искусство сбора, обработки и анализа информации.Предмет статистики – количественная сторона массовых социально-экономических явлений в неразрывной связи с их качественной стороной. Статистика всегда оперирует цифрами, статистические показатели отражают качество, то есть суть явления. Статистические показатели – это единство количества и качества. Объект изучениястатистическая совокупность, это множество однокачественных, варьирующих явлений. Основная задача – выявление и характеристика закономерностей (статистическая закономерность проявляется только в массе явлений как тенденция). 2. Способы получения статистической информации (отчетность, обследования).В основе исследования лежит собирание данных. Достоверность результатов анализа зависит от качества, достоверности и точности данных. Отчетность – основная форма статистического наблюдения, является обобщением первичного учета. Отчетность – это официальный документ, подписанный лицами, отвечающими за точность и достоверность данных, и утвержденная органами гос статистики. Обследования – наблюдение, повторяющееся через равные промежутки времени, задачей которого является определение численности и состава совокупности и анализ количественных изменений между двумя обследованиями. 3. Статистическая совокупность (единицы совокупности, виды признаков).Статистическая совокупность – множество однокачественных варьирующих явлений. Является объектом изучения статистики. Однокачественность означает наличие у всех единиц в совокупности определенного набора основных свойств. Вариация – разлиция в индивидуальных значениях признаков у единиц совокупности. Единица совокупности – предел деления статистической совокупности при условии сохранения ее основных свойств. Единицы совокупности являются носителями различных признаков, которые могут быть классифицированы по различным признакам. Признаки бывают атрибутными (не поддающимися оценке) и количественные (дискретные и непрерывные). Дискретные признаки - значения которых различаются минимум на единицу (целочисленные показатели). Непрерывные – значения которых могут различаться на сколь угодно малую величину. Признаки бывают вторичные и первичные. Первичные признаки определяются подсчетом, измеряются абсолютными величинами. Вторичные признаки оцениваются путем специальных расчетов и измеряются чаще относительными показателями. 4. Виды статистического наблюдения (сплошное, не сплошное, виды не сплошного статистического наблюдения).Статистическое наблюдение – научно обоснованный сбор массовой информации, заключающейся в регистрации значений признаков каждой единицы совокупности. 1) Сплошное – признаки фиксируются у всех единиц изучаемой совокупности. 2) Несплошное – признаки фиксируются у части единиц совокупности. а)выборочное наблюдение (случайным образом формируется выборочная совокупность, по окончанию анализа с определенной вероятностью дается оценка генеральной совокупности; наиболее частый способ). б) наблюдение основного массива (признаки фиксируются у единиц совокупности, которые влияют на функционирование совокупности). в) монографическое ( углубленное изучение отдельных единиц совокупности). Статистическое наблюдение по времени наблюдения: 1) текущее 2)периодическое 3) единовременное. Статистическое наблюдение по форме наблюдения: 1)непосредственное (первичные данные), 2)документальное (вторичные данные), 3) опрос. 5. Ошибки статистического наблюдения.Ошибка наблюдения – расхождение между расчетным и действительным значениями величин. Различают ошибки регистрации и репрезентативности. Ошибка регистрации – отклонения между значением показателя, полученным в ходе наблюдения, и его действительным значением. Встречаются при сплошном и несплошном наблюдении. Делятся на случайные (результат действия различных факторов) и систематические ( только при несплошном наблюдении; причина в том, что отобранная и обследованная совокупность недостаточно точно воспроизводит генеральную совокупность). Ошибка репрезентативности - отклонение значения показателя обследованной совокупности от его величины по исходной совокупности. (случайные – если отобранная совокупность неполно отражает совокупность в целом; системные – если нарушен принцип отбора единиц из исходной совокупности). 6. Статистическая сводка и группировка (задачи, показатели, виды группировок).Сводка – процедура сжатия, уплотнения и упорядочивания информации. Основной прием – группировка. Группировка – разделение статистической совокупности на отдельные группы по одному или нескольким признакам. Группировочный признак – признак, положенный в основу группировки. Группировка по одному признаку – простая или монотетическая, по двум или более – комбинационная. Задачи группировки: 1) выделение и описание типов и групп (решается при помощи типологической групировки) 2) изучение структуры совокупности и оценка структурных сдвигов (при помощи структурной группировки, она строится на основе типологической, но с использованием относительных показателей). 3) Изучение связей и зависимостей между признаками. (решается с помощью аналитической группировки, которая строится на основе факторного признака). Для построения группировки: 1) выбор группировочного признака 2) определить число групп: а) фомула Стерджесса K=1+ 3,322lnN б) группировочный интервал h=(xmax-xmin)/K. Интервал группировки может быть равным, прогрессивно возрастающим или убывающим, специализированным. 7. Абсолютные и относительные статистические величины.Абсолютные показатели – характеризуют объем совокупности в целом, отдельные ее типы и группы. Это всегда именованные величины. Относительные показатели – отношение тех или иных абсолютных характеристик или ранее рассчитанных относительных средних величин. При сопоставлении одноименных абсолютных показателей получают относительный показатель динамики (сопоставление во времени), структуры (отношение части к целому), планового задания и выполнения плана, координации (соотношение двух частей одного целого), наглядности (сопоставление одноименных характеристик, относящихся к разным совокупностям). 8. Средние величины на базе степенной средней (способы определения, области использования, выбор типа средней).В средних величинах происходит погашение влияния случайных факторов, они выступают характеристикой типичного уровня признака. Научной основой этой роли средних величин является однокачественность и количественная однородность совокупности. Виды: а) степенные средние: среднее арифметическое, среднее гармоническое, среднее геометрическое, среднее квадратическое, кубическое, четвердой и более высоких степеней. б) структурные средние: мода, медиана. Называются структурными, так как их величина не зависит от значения признака у каждой единицы совокупности, а определяется составом совокупности. 9. Вычисление средней арифметической при различных вариантах задания исходных данных, ее свойства.Средняя арифметическая – отношение объема признака к объему совокупности. Используется для расчета средних значений абсолютных показателей по несгруппированным данным. Среднее арифметическое – это значение признака, которое имела бы каждая единица совокупности при равномерном распределении общего объема признака совокупности. Средняя арифметическая взвешенная – рассчитывает среднее значение абсолютных величин по сгруппированным данным, а так же срежнее значение значене относительных показателей при условии, что известен знаменатель исходной формулы усредняемого показателя. Средняя гармоническая – используется для рассчета среднего значения относительных величин при условии, что неизвестен числитель исходной формулы усредняемого показателя.

Средняя геометрическая – используется для расчета средних темпов роста в анализе рядов динамики.

Средняя квадратическая лежит в основе расчета дисперсии.

Свойства средней арифметической: 1) Произведение средней арифметической на сумму частот равно сумме произведения индивидуальных значений признака на соответствующие частоты. 2) Сумма отклонений индивидуальных значений признака от средней величины всегда равно нулю. 3) Сумма квадратов отклонений индивидуальных значений от средней величины всегда меньше суммы квадратов откланений индивидуальных значений от любой другой произвольной величины. 4) Если все индивидуальные значения увеличить или уменьшить на одну и ту же постоянную величину, то среднее арифметическое уменьшится или увеличится на эту же величину5) .Если все частоты умножить или разделить на одно и то же постоянное число, то среднее не изменится. 10. Порядковые статистики. Квартили. Децили. Способы определения по выборочным данным.Для более детальной характеристики структуры совокупности используются такие показатели как квартили, децили и перцентили. Они делят ранжированный ряд на 4 равные части, децили – на 10, перцентили – на 100. Для расчета первого (нижнего) квартиля сначала находят квартильный интервал, а затем значение первого квартиля.Первый нижний квартиль: Третий верхний квартль: Значение Q1 означает, что у 25% единиц овокупности значение показателя меньше квартильного, а у 75% - больше. Значение Q3 – у 25% единиц совокупности значение больше данного. Межквартильное расстояние Q3-Q1 характеризует размах вариации в центре распределения.

11. Мода, определение по статистическим данным, свойства, использование в статистическом анализе.Мода (Мо) – наиболее часто встречающееся значение признаков совокупности. Для расчета находится модальный интервал – интервал, которому соответствует максимальная частота. , гдеXmoo – нижняя граница модального рядаh – величина интервала, fmo-1 – частота интервала, предшествующего модальному, fmo – частота модального интервала, fmo+1 – частота интервала, следующего за модальным.

12. Медиана, определение по выборочным данным, свойства, использование в статистическом анализе.Медиана (Ме) - значение признака у единицы, делящей ранжированный ряд пополам. Определение медианы по ранжированному ряду без группировки: Если число единиц совокупности четное, то значение медианы определяется как среднее арифметическое двух центральных значений. Если медиана рассчитывается по интервальному вариационному ряду, то снала находят медианный интервал, а затем по форумуле находят значение медианы. Медианный интервал – первый интервал, в который попадает 50% совокупности. 13. Вариация потоков – важнейшее свойство единиц статистичской совокупности.Вариация – это различия в индивидуальных значениях признака у единиц совокупности. Вариация – основа развития различных систем. От степени вариации признаков совокупности зависит типичность показателей центра распределения. Чем меньше вариация, тем в большей степени средняя выполняет роль характеристики типического уровня признака. Следовательно, расчет показателй центра распределения, как правило, сопровождается расчетом показателей вариации. 14. Показатели вариации, наиболее употребительные в статистике.Абсолютные показатели:1)Размах вариации – разность между максимальным и минимальным значением признаков совокупности, хпрпктеризует на какую величину азличаются между собой крайние значения распределения. R = xmax-xmin.2)Среднее линейное отклонение. 3)Дисперсия. 4) Среднее квадратическое (стандартное отклонение)

Относительные показатели вариации. Рассчитываются на основе абсолютных показателей вариации путем сопоставления их со средней величиной показателя.1) коэффицент корреляции 2) относительное линейное отклонение 3)коэффицент вариации – характеризует относительную меру изменчивости. По его величине делается вывод об однородности или неоднородности совокупности. Если < 33% , то совокупность однородная. Используется для сравнения однородности совокупности по разным признакам и по разным совокупностям. 15. Дисперсия и среднее квадратичное отклонение (свойства, способы определения по выборке).Дисперсия – это средний квадрат отклонений. Среднее квадратическое (стандартное) отклонение – характеризует на сколько в среднем отклоняются индивидуальные значения признака от типического уровня признака по совокупности.

В нормально распределенной совокупности соотношение между средним квадратическим и средним линейным. По фактическому оотношений этих показателей можно судить о симметрии распределения.

Правило трех сигм: в пределах 1) находятся 68,3 % единиц совокности 2) – 95 % 3) – 97,7%.

16. Коэффициенты вариации, свойства, область применения.Относительные показатели вариации рассчитываются на основе абсолютных показателей вариации путем сравнения их со средней величиной показателя.на основе размаха вариациикоэффицент осцилляции :

относительное линейное отклонение : 2) на основе среднего квадратического отклонениякоэффицент вариации:

характеризует относительную меру изменчивости. По его величине делается вывод об однородности или неоднородности совокупности. Если < 33% , то совокупность однородная. Используется для сравнения однородности совокупности по разным признакам и по разным совокупностям.

17. Графическое представление вариационного ряда (гистограмма, полигон, кумулята). Построение графиков по исходным данным.

Полигон распределения строится для рядов, построенных по дискретному признаку. В качестве значений признака при построении берется середина каждого интервала. Открытые интервалы принимаются равными прочим интервалам. Гистограма – столбиковая диаграмма. Основания столбиков – величина интервалов, их высота – частота признака. Графики рядов распределения могут строиться с использованием частот или частостей. Частость — отношение частоты к общему количеству исследуемых элементовКумулята строится с использованием накопленных частот или частостей. По кумуляте можно определить значение показателей структуры. 18. Ассиметрия распределения.К показателям формы распределения относятся показатель ассиметрии и показатель эксцесса. Коэффициент ассиметрии: Этот прием называется нормированием. На основе этого показателя легко определяется вид ассиметрии. сли числитель положителен, то это положительная правосторонняя ассиметрия. И наоборот. Показатель ассиметрии Пирсона в большей степени оценивает ассиметрию в центра распределения. Чтобы узнать ассиметрию на концах распределения, используется показатель асимерии, рассчитанный на основе центраьного момента третьего порядка.Момент распределения порядка k – среднее арифметическое отклонение к-ой степени индивидуальных значений от некоторой величины А. k – порядок момента, опредеояется степенью.А=0 – начальный моментА= – центральный моментА не равно ни тому, ни другому – условный момент.

Величина коэфициента ассиметрии не имеет предела. Чтобы оценить статистическую значимость, то еть понять под влиянием каких факторов сформировано значение показателя, рассчитывают стандартизованный коэффициент ассиметрии: ,

( в знаменателе стандартная ошибка коэффициента ассиметрии).Коэффициент ассиметрии берется по модулю, так как может быть и положительным, и отрицательным. Если коэффициент больше или равен 3, то ассиметрия признается существенной, то еть сформированной под влиянием неслучайных факторов. Если меньше 3, то ассиметрия сформирована под влиянием случайных факторов.

19. Эксцесс распределения (куртозис).Характеризует выпад вершины эмпирического распределения вверх или вниз, относительно кривой нормального распределения. Коэф-т эксцесса может быть положительным, что означает выпад ершины вверх, и отрицательным – вниз. Для оценки существенности эксцесса рассчитывается так же стандартизованный эксцесс (куртозис): Если tex больше или равен 3, то эксцесс признается существенным, то есть сформированным под влиянием неслучайных факторов. 20. Сглаживание эмпирического распределения нормальным законом распределения.В анализе распределения большое значение имеет, насколько эмпирическое распределение признака соответствует нормальному. Для этого частоты фактического распределения нужно сравнить с теоретическими, которые характерны для нормального распределения. по фактическим данным вычислить теоретические частоты кривой нормального распределения, являющиеся функцией нормированных отклонений Порядок расчета теоретических частот кривой нормального распределения: 1) по эмпирическим данным рассчитывают среднюю арифметическую ряда  и среднее квадратическое отклонение s; 2)находят нормированное отклонение t каждой варианты от средней арифметической; 3) по таблице распределения функции  определяют ее значения; 4)вычисляют теоретические частоты по формуле: ,
где N – объем совокупности, 
і – длина интервала;5)строят и сравнивают графики эмпирические и теоретических частот. Сумма теоретических и эмпирических частот должна быть равной, но может не совпадать из-за округлений в расчетах.

21. Понятие статистической гипотезы и статистического критерия, как инструмента проверки статистических гипотез. Статистическая гипотеза - всякое высказывание о генеральной совокупности, проверяемое по выборке. Статистический критерий — строгое математическое правило, по которому принимается или отвергается та или иная статистическая гипотеза с известным уровнем значимости. Построение критерия представляет собой выбор подходящей функции от результатов наблюдений (ряда эмпирически полученных значений признака), которая служит для выявления меры расхождения между эмпирическими значениями и гипотетическими. 22. Проверка гипотезы о законе распределения.Для проверки гипотезы о соответствии эмпирического распределения закону нормального распределения необходимо частоты фактического распределения сравнить с частотами нормального распределения. Методика построения теоретического ряда:1)по фактическому интервальному ряду вычисляются значения для каждой группы хозяйств по формуле (для интервальных рядов) для начала и конца интервала.

2) вычисляется вероятность попадания единицы наблюдения в данный интервал при выполнении гипотезы о нормальном законе:

3) определяется теоретическая частота в данной группе, равная совокупности на вероятность попадания в данный интервал.

4) находится значене критерия хи квадрат по формуле Если фактическое значение хи квадрат превышает табличное при том же числе степеней свободы, то вероятность соответствия распределения нормальному закону меньше указанной. 23. Ошибки II рода при проверке статистических гипотез.Проверка статистической гипотезы означает проверку согласования исходных выборочных данных с выдвинутой основной гипотезой. При этом возможно возникновение двух ситуаций – основная гипотеза может подтвердиться, а может и опровергнуться. Следовательно, при проверке статистических гипотез существует вероятность допустить ошибку, приняв или опровергнув верную гипотезу.При проверке статистических гипотез можно допустить ошибки первого или второго рода. Ошибкой второго рода называется ошибка, состоящая в принятии ложной гипотезы. Вероятность совершения ошибки второго рода, т. е. принятия ложной гипотезы, обозначается β. 24. Критерий согласия Хи-квадрат (вычисление, использование).Критерий Пирсона, или критерий χ² (Хи-квадрат) — наиболее часто употребляемый критерий для проверки гипотезы о законе распределения. Он основан на сравнении эмпирических частот интервалов группировки с теоретическими (ожидаемыми) частотами, рассчитываемыми по формулам нормального распределения.Гипотеза Н0:  — плотность распределения  генеральной совокупности, из которой взята выборка, соответствует теоретической модели  нормального распределения.Альтернатива Н1: .Уровень значимости: a.Порядок, применения:1. Формулируется гипотеза, выбирается уровень значимости a.2. Получается выборка объема n 40 независимых наблюдений и представляется эмпирическое распределение в виде интервального вариационного ряда.3. Рассчитываются выборочные характеристики  и S. Их используют в качестве генеральных параметров  и  нормального распределения, с которым предстоит сравнить эмпирическое распределение.4. Вычисляются значения теоретических частот  попадания в i-й интервал группировки. Для этого необходимо вычислить:                                                                                    

где Ф0(u) — функции Лапласа, xвi и хнi — верхняя и нижняя границы i-го интервала группировки.

Если окажется, что вычисленные ожидаемые частоты  некоторых интервалов группировки меньше 5, то соседние интервалы объединяются так, чтобы сумма их ожидаемых частот была больше или равна 5. 5. Значение -критерия рассчитывается по формуле:

                                                                                                              

где ni — эмпирические частоты;  – ожидаемые (теоретические) частоты; k — число интервалов группировки после объединения.

6. Из таблиц распределения  находится критическое значение  критерия для уровня значимости а и числа степеней свободы n=n3.

7. Вывод: если  то эмпирическое распределение не соответствует нормальному распределению на уровне значимости.

25. Выборочный метод. Выборочное наблюдение – один из видов несплошного наблюдения. Приемущество выборочного наблюдения в экономии времени, трудовых ресурсов и возможности расширения программы наблюдения. Генеральная совокупность – совокупность, из которой осуществляется отбор единиц в выборочную совокупность. Выборочная совокупность – совокупность отобранных единиц, по которым в процессе наблюдения будут регистрироваться признаки или значения признаков. N – объем енеральной совокупности, n – объем выборочной совокупности. Задача организации выборочного наблюдения – формирование репрезентативной выборки. 26. Виды выборочного статистического наблюдения.1) собственно-случайная выборка. Без предварительной подготовки генеральной совокупности случайно или механически из нее извлекают единицы в выборочную совокупность. Единица отбора совпадает с единицей наблюдения.2) стратифицированная типологическая (районированная) выборка. В ген совокупности выделяются типы или страты, а затем из каждого типа извлекается число единиц, пропорционально доли каждого типа в общем объеме ген совокупности. Единица отбора совпадает с единицей наблюдения.3) Серийная выборка (гнездовая). В ген совокупности выбираются серии (гнезда) и в выборку случайно или механически производят отбор серий. Внутри серий, 4)опавших в выборку , проводится сплошное наблюдение.4) Многоступенчатая выборка. Связана со сложностью соц-эк явлений, что не поволяет на первом этапе сформировать окончательно выборочную совокупность. На каждом этапе меняется единица отбора.5) многофазная выборка. Каждая фаза отличается объемом программы наблюдения. Чем меньше объем выборки, тем шире программа наблюдения. 27. Способы обеспечения случайности отбора при формировании выборки.1) Случайный отбор. Реализуется с использованием жеребьевки или таблиц случайных чисел.2) Механический отбор. Частный случай лучайного отбора. Реализуется через расчет шага отбора:N/n , где N – ген овокупность, n – объем выборки. 28. Повторная и бесповторная выборки.Повторный отбор – единица ген совокупности, изъятая в выборку, возвращается назад в ген совокупность, и может быть повторно выбрана в выборочную совокупность.Бесповторный отбор – отобранная из ген совокупности единица не возвращается назад. При повторном отборе на протяжении всего отбора сохраняется неизменная вероятность попадания единицы в выборку: p = 1/N

При бесповторном отборе вероятность изменяется от 1/N для первой единицы до для последней единицы отбора. 29. Расслоенная выборка. Способы формирования выборки при расслоенном отборе.Выборка стратифицированная (расслоенная) – метод извлечения выборки, основанный на предварительном расслоении ген совокупноти на крупные группы. На разных слоях отбор проводится независимо, могут применяться разные способы отбора. Общий объем выборки распределяется между слоями пропорционально их численности. Рекомендуется применять если: 1) каждый слой внутренне однороден, 2) желательно получить репрезентативные данные не только о ген зависимости в целом, но и о ее структурных частях, 3) продиктовано организационными соображениями, 4) трудно получить основу выборки для ген совокупности, но можно для каждого ее слоя, 5) пробемы, связанные с отбором в различных частях ген совокупности сильно различаются. 30. Средняя ошибка выборки.Средняя ошибка выборки прямопропорциональна среднему квадратичному отклонению и обратно пропорциональна квадратному корню из численности выборки. Если выборка используется для определения доли признака, то средняя ошибка выборки определяется: 31. Предельная ошибка выборки.Расчет объема выборки оуществляется исходя из формулы ошибки выборки. Предельная ошибка выборки: Величина ошибки выборки обусловлена задачами исследования и задается на стадии проектирования. Значение т зависит от установленного уровня вероятности. Значение дисперсии берется по результатампредшествующих аналогичных исследований. Ошибка выборки берется как абсолютная величина, однако, на практике, размер ошибки задается, как правило, как отностельная величина.