
- •Лекция 1
- •1.1. Введение в теоретические основы исследования статистических выборок.
- •1.1. Введение в теоретическин основы исследования статистических выборок.
- •1.2. Подходы статистического оценивания
- •1.3. Свойства среднего
- •1.4. Комплекс задач проблемы оценивания параметров закона распределения.
- •Лекция 2
- •2.1. Статистическая устойчивость выборочных характеристик.
- •2.2. Статистические оценки и их свойства.
- •2.1. Статистическая устойчивость выборочных характеристик
- •2.2. Статистические оценки и их свойства
- •Лекция 3
- •3.2. Распределение t-Стьюдента
- •3.4. Пример определения эмпирической дисперсии
- •3.2. Распределение t- стьюдента
- •3.4. Пример определения эмпирической дисперсии
- •Из этих условий следует, что
- •Лекция 4
- •4.1. Метод моментов Пирсона.
- •4 .2. Метод наименьших квадратов.
- •4.3. Метод максимального правдоподобия.
- •4.1. Метод моментов пирсона
- •4.2. Метод наименьших квадратов
- •4.3.Метод максимального правдоподобия
- •Лекция 5
- •5.1. Точность и достоверность оценок параметров распределения.
- •5.2. Доверительные оценки параметров распределения.
- •5.1. Точность и достоверность оценок параметров распределения.
- •5.2. Доверительные оценки параметров распределения
- •Лекция 6
- •6.2. Гипотеза независимости и стационарности обрабатываемого ряда наблюдений.
- •6.3. Анализ резко выделяющихся наблюдений
- •6.4. Гипотеза о типе закона распределения случайной величины.
- •6.5. Гипотезу об однородности двух или нескольких выборок.
- •6.6. Гипотезы о числовых значениях параметров генеральной совокупности.
- •Лекция 7
- •7.1. Сравнение доли признака с нормативом.
- •7.2. Сравнение статистических частот, вычисленных по двум выборкам.
- •7.1. Сравнение доли признака с нормативом
- •7.2. Сравнение статистических частот, вычисленных по двум выборкам.
- •Лекция 8
- •8.1. Сравнение двух средних нормальных генеральных совокупностей, дисперсии которых известны (выборки незпвисимы).
- •8.2. Сравнение двух средних, произвольно распределенных генеральных совокупностей (выборки большого объема и независимы).
- •8.3. Сравнение двых средних нормальных генеральных совокупностей, дисперсии которых неизвестны и одинаковы (малые независимые выборки).
- •8.4. Сравнение выборочной средней с гипотетичесчкой генеральной средней нормальной совокупности.
Министерство образования и науки Украины
НАЦИОНАЛЬНЫЙ ТЕХНИЧЕСКИЙ УНИВЕРСИТЕТ
«ХАРЬКОВСКИЙ ПОЛИТЕХНИЧЕСКИЙ ИНСТИТУТ»
Кафедра экономической кибернетики
и маркетингового менеджмента
КОНСПЕКТ ЛЕКЦИЙ
по курсу «Теоретические основы исследования статистических выборок.»
для студентов специальности 8.03050201
Экономическая кибернетика
Составитель д.т.н., проф. Гамбаров Л.А.
Харьков НТУ «ХПИ» 2013
СОДЕРЖАНИЕ
1. Задача статистического оценивания.
1.1. Введение в теоретические основы исследования статистических выборок.
1.2. Подходы статистического оценивания.
1.3. Свойства среднего.
1.4. Комплекс задач проблемы оценивания параметров закона распределения.
2. Статистическое оценивание параметров распределения.
2.1. Статистическая устойчивость выборочных характеристик.
2.2. Статистические оценки и их свойства.
3. Точные распределения выборочных характеристик.
3.1.
- распределение.
3.2. Распределение t-Стьюдента.
3.3. F – распределение.
3.4. Пример определения эмпирической дисперсии.
4. Методы определения оценок.
4.1. Метод моментов Пирсона.
4
.2.
Метод наименьших квадратов.
4.3. Метод максимального правдоподобия.
5. Оценивание параметров распределения.
5.1. Точность и достоверность оценок параметров распределения.
5.2. Доверительные оценки параметров распределения.
6. Типы гипотез, высказываемые в ходе статистической обработки данных.
6.1. Основные понятия процесса проверки статистических гипотез.
6.2. Гипотеза независимости и стационарности обрабатываемого ряда наблюдений.
6.3. Анализ резко выделяющихся наблюдений.
6.4. Гипотеза о типе закона распределения случайной величины.
6.5. Гипотезы об однородности двух или нескольких выборок.
6.6. Гипотезы о числовых значениях параметров генеральной совокупности.
7. Проверка гипотезы относительно вероятности.
7.1. Сравнение доли признака с нормативом.
7.2. Сравнение статистических частот, вычисленных по двум выборкам.
8. Проверка гипотез о среднем.
8.1. Сравнение двух средних нормальных генеральных совокупностей, дисперсии которых известны (выборки независимы).
8.2. Сравнение двух средних, произвольно распределенных генеральных совокупностей (выборки большого объема и независимы).
8.3. Сравнение двух средних нормальных генеральных совокупностей, дисперсии которых неизвестны и одинаковы (малые независимые выборки).
8.4. Сравнение выборочной средней с гипотетической генеральной средней нормальной совокупности.
Литература.
Лекция 1
Вопросы лекции:
1.1. Введение в теоретические основы исследования статистических выборок.
1.2. Подходы статистического оценивания .
1.3. Свойства среднего.
1.4. Комплекс задач проблемы оценивания параметров закона распределения.
1.1. Введение в теоретическин основы исследования статистических выборок.
Математическая статистика - это раздел математики, изучающий методы сбора, систематизации и обработки результатов наблюдений случайных массовых явлений с целью выявления соответствующих закономерностей. Эта учебная дисциплина должна быть неотъемлемой частью подготовки современного экономиста. Математическая статистика включает в себя различные аспекты обработки статистической информации. Одно из центральных мест математической статистики занимают задачи оценивания неизвестных параметров распределения. Проблема оценивания является многогранной и состоит из совокупности задач, среди которых:
определение оценки неизвестной вероятности появления случайного события,
вычисление оценок параметров закона распределения,
построение доверительных интервалов для оценок числовых характеристик случайных величин,
восстановление кривой плотности распределения и др.
Методам решения этих задач посвящена первая часть этого курса.
Другая часть настоящего лекционного курса посвящена задачам, в которых требуется по эмпирическим данным проверить то или иное предположение. Например,
используя полученную выборку, нужно установить, имеет ли некоторый параметр определенные значения;
для различающихся выборочных характеристик, соответствующим одинаковым теоретическим, нужно решить, следует ли их различие считать случайным или следует признать значимым и т.д.
Проверка статистических гипотез заключается в установлении согласованности данной последовательности наблюдений случайных величин или событий с гипотезами о распределении случайной величины и является одной из основных проблем, решаемых математической статистикой.
Результат сопоставления теоретической модели с исходными данными может быть либо отрицательным (данные наблюдения противоречат высказанной гипотезе и поэтому от гипотезы следует отказаться), либо неотрицательными (данные наблюдения не противоречат высказанной гипотезе, а поэтому ее можно принять в качестве одного из допустимых решений). При этом неотрицательный результат статистической проверки гипотезы не означает, что высказанное предположительное утверждение является наилучшим. Просто эта гипотеза не противоречит имеющимся выборочным данным, однако таким же свойством могут обладать и другие гипотезы. Поэтому, даже статистически проверенное предположение следует расценивать не как раз и навсегда установленный, абсолютный факт, а лишь как достаточно правдоподобное, не противоречащее опыту утверждение.
1.2. Подходы статистического оценивания
Современному экономисту в процессе своей деятельности необходимо решать задачу, состоящую в выявлении и исследовании закономерностей реальных процессов. Установленные закономерности имеют не только теоретическую, познавательную ценность, они широко применяются в практике - в планировании, управлении и прогнозировании. Как правило, экономические и социально - экономические процессы находятся под воздействием разнообразных факторов и многообразного переплетения взаимосвязей между отдельными элементами. В большинстве случаев закономерности могут быть обнаружены при целенаправленном статистическом изучении массовых явлений, включающем сбор данных, их систематизацию и упорядочение, и, наконец, статистический анализ. Поскольку наблюдаемый процесс или явление подвержено влиянию множества факторов, то каждое индивидуальное его проявление будет отличаться от другого. Лишь в массовой совокупности объектов наблюдений проявляются общие закономерности, в формирование которых каждая единица совокупности вносит свой вклад.
При достаточно большом объеме совокупности случайные воздействия в значительной мере взаимно поглощаются и результат (для совокупности в целом) становится мало зависящим от случая. Это явление лежит в основе образования статистических закономерностей. Статистические закономерности обладают известной статистической устойчивостью. Устойчивость закономерности относительна и связана с неизменностью условий ее формирования. Существенное изменение этих условий неизбежно приводит к изменению самих закономерностей. Со статистической устойчивостью мы сталкиваемся на практике довольно часто, основывая на ней многие решения практического порядка. Например, характеризуя деятельность предприятия и принимая решения на дальнейший период, исходят из целого ряда средних характеристик: средней выработки одного работающего, процента брака, расхода сырья и материалов и т. д. Оперируя средними показателями, руководствуются их устойчивостью, хотя в индивидуальном проявлении эти показатели будут колебаться в широких пределах.
Приемы и способы научного анализа данных, относящихся к массовым явлениям, служащие для определения некоторых обобщающих эти данные характеристик и выявления статистических закономерностей, составляют предмет математической статистики.
Математическая статистика занимается сбором данных, их анализом и интерпретацией. В настоящем курсе лекций мы не рассматриваем задачу сбора данных, но считаем, что они у нас уже есть, и задаемся вопросом о том, какую информацию они содержат. Ответ зависит не только от данных, но и от того, каким способом их обработать. Рассмотрим три подхода.
Анализ данных. Здесь данные анализируются на их собственной основе, по существу, без привлечения посторонних предположений. Главная цель - организация и такая обработка данных, которая выявляет их существенные черты и проясняет лежащую в их основе структуру.
Классические
статистические выводы и теория решений.
В этом случае постулируется, что
наблюдения — суть значения, принимаемые
случайными величинами, которые подчиняются
совместному распределению вероятностей
р, принадлежащему некоторому известному
классу Р. Распределения часто индексируются
параметром
, принимающим
значения в множестве
, так, что
.
Цель анализа состоит в том, чтобы указать правдоподобное значение параметра (это есть задача точечного оценивания), либо определить подмножество , о котором можно с известной долей уверенности утверждать, что оно содержит или не содержит истинное значение параметра (оценивание доверительными множествами или проверка гипотез). Подобное утверждение относительно параметра можно рассматривать как результат извлечения информации, содержащейся в статистических данных.
Байесовский анализ. Этот подход основан на том, что параметр есть случайная величина (хотя и ненаблюдаемая) с известным распределением. Это априорное распределение (априорное относительно наличия данных) затем модифицируется в соответствии с полученными данными, и тем самым определяется апостериорное распределение (условное распределение параметра относительно данных), которое и содержит в себе все, что можно сказать о на основе сделанных предположений и статистических данных.
Точечное и доверительное оценивание - это одна из наиболее употребительных форм обработки информации и получения статистических выводов. Например, измеряют физическую величину для того, чтобы оценить ее значение; проводят обследование с тем, чтобы оценить долю избирателей, отдающих предпочтение тому или иному кандидату; проводят агротехнические эксперименты, чтобы оценить эффект от нового удобрения; клинические эксперименты, чтобы оценить повышение продолжительности жизни или скорости выздоровления в результате применения того или иного способа лечения. В качестве прототипа задач оценивания рассмотрим определение неизвестной величины путем ее измерения и последующей обработки статистической информации.