![](/user_photo/2706_HbeT2.jpg)
- •Основные понятия статистики.
- •Предмет статистики. Цели. Составные части.
- •Статистическая закономерность. Закон больших чисел.
- •4 Этапа статистического анализа.
- •Виды рядов.
- •Классификация признаков.
- •Статистические показатели. Абсолютные и относительные показатели.
- •План статистического наблюдения
- •Виды статистического наблюдения
- •Контроль данных
- •3.4. Выбросы и стратегия их обработки
- •Понятие и виды вариационных рядов.
- •Построение вариационных рядов и их структурные характеристики (медиана, мода, квартили, квинтили…).
- •Графическое изображение вариационных рядов
- •Средние арифметические и их свойства.
- •Степенные средние.
- •Правило мажорантности средних.
- •6. Распределение наблюдений.
- •6.2. Основные параметры нормального распределения.
- •Показатели формы распределения (центральные моменты, показатели асимметрии, показатель эксцесса).
- •6.6. Доверительный интервал, определение необходимого размера выборки
- •6.8. Биномиальное распределение и его характеристики
- •6.9. Распределение Пуассона и его характеристики
- •6.10. Экспоненциальное распределение и его характеристики
- •7. Гипотезы.
- •7.1. Статистическая проверка гипотез. Классы гипотез.
- •7.2. Критерии согласия. Классификация методов проверки гипотез. Понятие числа степеней свободы.
- •7.3. Ошибка 1 рода и ошибка 2 рода.
- •7.5. Непараметрические методы проверки гипотез (Критерий Розенбаума , критерий Манна-Уитни, критерий χ2 Пирсона)
- •2. Критерий Манна – Уитни u
- •8.1. Понятие корреляции. Виды корреляционной связи (парная линейная, параболическая, гиперболическая, множественная, корреляция рангов).
- •8.2. Коэффициенты корреляции.
- •8.3. Оценка надежности коэффициента корреляции.
- •8.4. Измерение связи неколичественных признаков (к-нт ассоциации, к-нт контингенции, к-нт сопряженности Пирсона, к-нт сопряженности Чупрова, к-нт корреляции рангов Спирмена, к-нт корреляции Фехнера)
- •9. Регрессионный анализ.
- •9.1. Цели, виды.
- •9.2. Ошибка выбранной модели.
- •10. Кластерный анализ.
- •10.1. Цели. Евклидово расстояние. Стандартизация.
- •10.2. Методы объединения объектов.
- •10.3. Дендрограмма. Основные характеристики кластеров.
- •16.2. Индекс себестоимости.
- •16.5.3. Показатели дифференциации материальной обеспеченности населения:
- •1 6.6.2.Индекс объема потребления
9.1. Цели, виды.
При использовании методов корреляционно-регрессионного анализа можно выделить три группы решаемых практических задач.
Задачи, связанные с установлением наличия или отсутствия корреляционной зависимости. Решение этих задач предполагает расчет показателей корреляции.
Группа задач диктуется желанием управлять тем или иным объектом, или признаком через воздействие на факторы его определяющие. При этом строиться уравнение связи, называемое регрессионным, и производится ранжирование факторов по степени их влияния на результат.
Прогнозирование изменения того или иного явления или признака в условиях изменения соответствующих признаков-факторов. В основе решения данных задач лежат уравнения регрессии, которые в данном случае не являются самоцелью. Основное – это расчет прогнозируемых значений результативного признака с расчетом доверительных интервалов и указанием уровня доверительной вероятности.
Для решения всех задач используют методы корреляции и регрессии, но так как у них много общих вычислительных процедур, то принято говорить о корреляционно-регрессионном анализе.
Условия применения методов корреляционно-регрессионного анализа
Наличие статистической совокупности достаточно большого объема. Объем совокупности должен превышать в 5-6 раз (идеально в10 раз) число факторов, включенных в анализ.
Изучаемая совокупность должна быть однородна.
Независимость наблюдений и отсутствие мультиколлинеальности факторов.
Признаки, участвующие в анализе должны иметь количественное выражение.
Распределение единиц совокупности должно соответствовать нормальному закону распределения.
9.2. Ошибка выбранной модели.
10. Кластерный анализ.
Кластерный анализ: цели, Евклидово расстояние.
- это разделение выборки объектов на непересекающиеся подмножества (кластеры) так, чтобы каждый кластер состоял из схожих объектов, а объекты разных кластеров существенно отличались.
Кластерный анализ: методы объединения объектов.
1)«Ближнего соседа» (Расстояние между двумя кластерами определяется расстоянием между двумя наиболее близкими объектами (ближайшими соседями) в различных кластерах. Позволяет выделять кластеры сложной формы при условии, что части таких кластеров соединены цепочками близких друг к другу элементов.). 2)«Дальнего соседа» (Расстояние между двумя кластерами определяется расстоянием между двумя наиболее далекими объектами в различных кластерах. Хорошо использовать, когда объекты действительно происходят из различных "рощ") 3)Центроидный 4)Варда (В качестве расстояния между кластерами берется прирост суммы квадратов расстояний объектов до центров кластеров, получаемый в результате их объединения. Применим для малых выборок. Объединение близко расположенных кластеров и "стремление" создавать кластеры малого размера). 5)Невзвешенного попарного среднего 6)Взвешенного попарного среднего.
10.1. Цели. Евклидово расстояние. Стандартизация.
Цели: 1)Понимание данных (Каждому кластеру – свой метод анализа); 2)Сжатие данных (Один типичный представитель от каждого кластера); 3)Novelty Detection (Выделение нетипичных объектов).
Евклидово расстояние – мера расстояния между кластерами.
Р
асст-е
между точками в трёхмерном пр-ве
Кластерный анализ: стандартизация.
- выбор масштаба.
Из значений переменных вычитается их среднее, и эти значения делятся на стандартное отклонение.
Z-шкалы