
- •4Основными задачами статистики населения являются:
- •10. Формы представления статистических данных.
- •11. Понятие статистического закона распределения.
- •12. Графическое представление выборки (полигон, гистограмма). Их разновидности.
- •14. Определение эмпирической функции распределения.
- •15. Построение и свойства эмпирической функции распределения
- •16. Что такое параметры распределения.
- •17. Что выступает в качестве точечных оценок параметров?
- •18. Выборочные числовые характеристики, формулы для их подсчета.
- •20. Графическое представление экспериментальных данных
- •2.3.1. Гистограмма
- •2.3.2. Полигон частот
- •23.Классификация гипотез
- •27. Последовательность расчетов при проверке критериев Пирсона
1. Математи́ческая стати́стика — наука, разрабатывающая математические методы систематизации и использования статистических данных для научных и практических выводов. Математическая статистика — раздел математики, разрабатывающий методы регистрации, описания и анализа данных наблюдений и экспериментов с целью построения вероятностных моделей массовых случайных явлений[1]. В зависимости от математической природы конкретных результатов наблюдений статистика математическая делится на статистику чисел, многомерный статистический анализ, анализ функций (процессов) и временных рядов, статистику объектов нечисловой природы.
Выделяют описательную статистику, теорию оценивания и теорию проверки гипотез. Описательная статистика есть совокупность эмпирических методов, используемых для визуализации и интерпретации данных (расчет выборочных характеристик, таблицы, диаграммы, графики и т. д.), как правило, не требующих предположений о вероятностной природе данных. Некоторые методы описательной статистики предполагают использование возможностей современных компьютеров. К ним относятся, в частности, кластерный анализ, нацеленный на выделение групп объектов, похожих друг на друга, и многомерное шкалирование, позволяющее наглядно представить объекты на плоскости
2,Предмет и метод математической статистики. Статистич. описание совокупности объектов занимает промежуточное положение между индивидуальным описанием каждого из объектов совокупности, с одной стороны, и описанием совокупности по ее общим свойствам, совсем не требующим ее расчленения на отдельные объекты, с другой. По сравнению с первым способом статистич. данные всегда в большей или меньшей степени обезличены и имеют лишь ограниченную ценность в случаях, когда существенны именно индивидуальные данные (напр., учитель, знакомясь с классом, получит лишь весьма предварительную ориентировку о положении дела из одной статистики числа выставленных его предшественником отличных, хороших, удовлетворительных и неудовлетворительных оценок). С другой стороны, по сравнению сданными о наблюдаемых извне суммарных свойствах совокупности статистич. данные позволяют глубже проникнуть в существо дела. Напр., данные гранулометрич. анализа порвды (т. е. данные о распределении образующих породу частиц по размерам) дают ценную дополнит. информацию по сравнению с испытанием нерасчлененных образов породы, позволяя в нек-рой мере объяснить свойства породы, условия ее образования и пр.
Метод исследования, опирающийся на рассмотрение статистич. данных о тех или иных совокупностях объектов, наз. статистическим. Статистич. метод применяется в самых различных областях знания. Однако черты статистич. метода в применении к объектам различной природы столь своеобразны, что было бы бессмысленно объединять, напр., социально-экономич. статистику, физич. статистику, звездную статистику и т. п. в одну науку.
Общие черты статистич. метода в различных областях знания сводятся к подсчету числа объектов, входящих в те или иные группы, рассмотрению распределения количественных признаков, применению выборочного метода (в случаях, когда детальное исследование всех объектов обширной совокупности затруднительно), использованию теории вероятностей при оценке достаточности числа наблюдений для тех или иных выводов и т. п. Эта формальная математич. сторона статистич. методов исследования, безразличная к специфич. природе изучаемых объектов, и составляет предмет М. с.
3.Связь математической статистики с теорией вероятностей. Связь М. с. с теорией вероятностей имеет в разных случаях различный характер. Вероятнвстей теория изучает не любые массовые явления, а явления случайные и именно "вероятностно случайные", т. е. такие, для к-рых имеет смысл говорить о соответствующих им распределениях вероятностей. Тем не менее теория вероятностей играет определенную рель и при статистич. изучении массовых явлений любой природы, к-рые могут не относиться к категории вероятностно случайных. Это осуществляется через основанные на теории вероятностей теорию выборочного метода и ошибок теорию. В этих случаях вероятностным закономерностям подчинены не сами изучаемые явления, а приемы их исследования.
Более важную роль играет теория вероятностей при статистич. исследовании вероятностно случайных явлений. Здесь в полной мере находят применение такие основанные на теории вероятностей разделы М. с., как статистических гипотез проверка, статистическое оценивание распределений вероятностей и входящих в них параметров и т. д. Область же применения этих более глубоких статистич. методов значительно уже, т. к. здесь требуется, чтобы сами изучаемые явления были подчинены достаточно определенным вероятностным закономерностям. Напр., статистич. изучение режима турбулентных водных потоков или флюктуации в радиоприемных устройствах производится на основе теории стационарных случайных процессов. Однако применение той же теории к анализу экономических временных рядов может привести к грубым ошибкам в виду того, что входящее в определение стационарного процесса допущение наличия сохраняющихся в течение длительного времени неизменных распределений вероятностей в этом случае, как правило, совершенно неприемлемо. Вероятностные закономерности получают статистич. выражение (вероятности осуществляются приближенно в виде частот, а математич. ожидания - в виде средних) в силу закона больших чисел.
4Основными задачами статистики населения являются:
-определение численности населения и его размещение на территории страны,
-изучение состава населения (по полу, возрасту, национальности, образованию и т.д.),
-изучение естественного движения населения,
-изучение миграции населения.
Разделы статистики:
Матстатистика
Общая теория статистики
Статистика АПК
Социально-экономическая статистика
Статистика предприятия
5.Статистической совокупностью называют несколько статистических данных, объединенных в группу хотя бы одним статистическим признаком. Например, спортсмены, имеющие одинаковый разряд, пол, возраст. Общим признаком может служить и некоторый показатель: например, результаты прыжков в длину.Объемом статистической совокупности называют число данных, входящих в нее. Статистическая совокупность, из которой отбирают часть объектов, называется генеральной совокупностью. Множество объектов, случайно отобранных из генеральной совокупности, называется выборкой.Число объектов генеральной совокупности и выборки называется соответственно объемом генеральной совокупности и объемом выборки.Если выборку отбирают по одному объекту, который обследуют и снова возвращают в генеральную совокупность, то выборка называется повторной.Если объекты выборки уже не возвращаются в генеральную совокупность, то выборка называется бесповторной.На практике чаще используется бесповторная выборка.Свойства объектов выборки должны правильно отражать свойства объектов генеральной совокупности, или, как говорят, выборка должна быть репрезентативной (представительной).Считается, что выборка репрезентативна, если все объекты генеральной совокупности имеют одинаковую вероятность попасть в выборку, т. е. выбор производится случайно. статистике приняты следующие условные обозначения:
N - объем генеральной совокупности;
п - объем выборочной совокупности;
-
средняя в генеральной совокупности;
-
средняя в выборочной совокупности;
р - доля единиц в генеральной совокупности;
w - доля единиц в выборочной совокупности;
-
генеральная дисперсия;
S2 - выборочная дисперсия;
-
среднее квадратическое отклонение
признака в генеральной совокупности;
S - среднее квадратическое отклонение признака в выборочной совокупности.
6Сущность выборочного метода заключается в том, чтобы по свойствам части (выборки) судить о численных характеристиках целого (генеральной совокупности), по отдельным группам вариант-об их общей совокупности, которая иногда мыслится как совокупность неограниченно большого объема. Основу выборочного метода составляет та внутренняя связь, которая существует в популяциях между единичным и общим, частью и целым.
Выборочный метод имеет очевидные преимущества перед сплошным изучением генеральной совокупности, так как сокращает объем работы (за счет уменьшения числа наблюдении) позволяет экономить силы и средства, получать информацию о таких совокупностях, полное обследование которых практически невозможно или нецелесообразно.
К выборке обычно предъявляются требования ВАЛИДНОСТИ и РЕПРЕЗЕНТАТИВНОСТИ.
Под ВАЛИДНОСТЬЮ понимается следующее. Буквально: выборка должна работать, то есть отражать все характеристики генеральной совокупности. Она не может быть «с живой картины списком бледным», в выборке не должны пропадать какие-то свойства, присущие генеральной совокупности в целом. Выборка – это модель того, что она представляет. (Нельзя выносить суждение о том, что все дно мирового океана покрыто галькой – на том основании, что вы сидите на пляже и перебираете в руках камешки.)Требование РЕПРЕЗЕНТАТИВНОСТИ состоит в том, чтобы любой исследователь, желающий повторить этот эксперимент, имел возможность при сходных условиях сформировать подобную выборку (то есть выборку с теми же свойствами) и получить результат. Будет ли результат почти таким же или отличным – дело другое. Важно то, что условия эксперимента должны иметь возможность быть воспроизведенными.
Существует также требование НАДЕЖНОСТИ, но оно имеет отношение скорее к эксперименту в целом, нежели к формированию выборки. Состоит оно, во-первых, в возможности повторения эксперимента с получением близких (тех же) результатов, и, во-вторых, - в степени доверия к полученным результатам – точность, Этот момент тесно связан с таким понятием, как «уровень статистической значимости».
7Результаты сводки и группировки материалов статистического наблюдения оформляются в виде статистических рядов распределения. Статистические ряды распределения представляют собой упорядоченное распределение единиц изучаемой совокупности на группы по группировочному (варьирующему) признаку. Они характеризуют состав (структуру) изучаемого явления, позволяют судить об однородности совокупности, границах ее изменения, закономерностях развития наблюдаемого объекта.
В зависимости от признака статистические ряды распределения делятся на следующие:
- атрибутивные (качественные);
- вариационные (количественные)
- дискретные;
- интервальные.
Вариационные ряды строятся на основе количественного группировочного признака. При этом вариационные ряды по способу построения бывают дискретными (прерывными) и интервальными (непрерывными). Дискретный ряд распределения - ряд, который основан на прерывной вариации признака, т.е. в котором значение признака выражено целым числом (тарифный разряд рабочих, число касс в магазине, число раскрытых преступлений и т.д.).
Интервальный ряд распределения - ряд, базирующийся на непрерывно изменяющемся значении признака, имеющего любые (в том числе и дробные) количественные выражения, т.е. значение признаков таких рядах задается в виде интервала.
Вариационные ряды состоят из двух элементов: вариант и частот.
Варианта - это отдельное значение варьируемого признака, которое он принимает в ряду распределения. Частота - это численность отдельных вариант или каждой группы вариационного ряда. Частоты, выраженные в долях единицы или в процентах к итогу, называются частостями. Сумма частот составляет объем ряда распределения.
номер признака |
1 |
2 |
i |
n |
Значения признака xi |
x1 |
x2 |
xi |
xn |
|
|
|
|
|
|
|
|
|
|
Существуют пять основных способов организации выборочного наблюдения:
1.
простой случайный отбор, при котором
объектов
случайно извлекаются из генеральной
совокупности
объектов
(например с помощью таблицы или датчика
случайных чисел), причем каждая из
возможных выборок имеют равную
вероятность. Такие выборки называются
собственно-случайными;
2. простой отбор с помощью регулярной процедуры осуществляется с помощью механической составляющей (например, даты, дня недели, номера квартиры, буквы алфавита и др.) и полученные таким способом выборки называются механическими;
3.
стратифицированный отбор заключается
в том, что генеральная совокупность
объема
подразделяется
на подсовокупности или слои (страты)
объема
так
что
.
Страты представляют собой однородные
объекты с точки зрения статистических
характеристик (например, население
делится на страты по возрастным группам
или социальной принадлежности; предприятия
— по отраслям). В этом случае выборки
называются стратифицированными (иначе,
расслоенными, типическими, районированными);
4. методы серийного отбора используются для формирования серийных или гнездовых выборок. Они удобны в том случае, если необходимо обследовать сразу "блок" или серию объектов (например, партию товара, продукцию определенной серии или население при территориально-административном делении страны). Отбор серий можно осуществить собственно-случайным или механическим способом. При этом проводится сплошное обследование определенной партии товара, или целой территориальной единицы (жилого дома или квартала);
5. комбинированный (ступенчатый ) отбор может сочетать в себе сразу несколько способов отбора (например, стратифицированный и случайный или случайный и механический); такая выборка называется комбинированной.
9Первичная обработка выборочных данных состоит обычно в отыскании максимального — xmax и минимального xmin значений выборки, а также размаха варьирования R = xmax – xmin. Следующий этап первичной обработки выборки — группировка и ее графическое представление. Группировка выборки объема n состоит в следующем. Промежуток [xmin, xmax] разбивают на m интервалов группировки (чаще всего одинаковой длины и обычно 7£ m £20) и подсчитывают количество nj выборочных значений, которые попали в j-й интервал. Каждый интервал группировки Dj = (aj, bj) представлен своими левой aj и правой bj границами и числом nj элементов выборки, ему принадлежащих. Очевидно, что величина интервала группировки существенно влияет на вид гистограммы. При малой их ширине в каждый интервал попадает незначительное число наблюдений, или даже не попадает ни одного, гистограмма становится сильно «изрезанной» и плохо передает основные особенности изучаемого распределения. Несколько общих правил:
Перед началом группировки упорядочить выборочные значения по возрастанию (такая, упорядоченная по возрастанию выборка называется вариационным рядом).
При выборе числа интервалов группировки ориентироваться на 10-20 интервалов.