- •1. Анализ пропущенных значений. Методы заполнения пропусков.
- •2. Непараметрические критерии различий двух выборок.
- •3. Графические и аналитические методы анализа.
- •4.Нормальный закон распределения и его значение для прикладной статистики.
- •5. Статистические гипотезы в задачах регрессии.
- •6.Непараметрические критерии однородности двух выборок.
- •9. Непараметрические критерии изменений.
- •8.Проверка гипотез о коэфицентах регрессии и коэфицентах корреляции.
- •7.Множественный дисперсионный анализ
- •10. Стандартизация исходных данных
- •11. Основные понятия и алгоритмы кластерного анализа
- •12. Проверка гипотез о коэффициентах регрессии и коэффициентах корреляции
- •Дисперсионный анализ при оценке качества регрессии.
- •Основные возможности пакета Excel для анализа статистических данных.
- •Однофакторный дисперсионный анализ.
- •16.История развития программного обеспечения по математической статистике.
- •18.Основные возможности пакета Statistica for Windows.
- •17.Корреляционный анализ. Диаграмма рассеяния.
- •19. Корреляционный анализ. Парный коэффициент корреляции.
- •20.Основные задачи математической статистики
- •1. Задача определения закона распределения случайной величины (или системы случайных величин) по статистическим данным
- •2. Задача проверки правдоподобия гипотез
- •3. Задача нахождения неизвестных параметров распределения
- •21. Критерий согласия распределения.
- •22. Основные понятия и алгоритмы кластерного анализа
- •23. Основные проверки статистических гипотез
- •24) Критерий Стьюдента (t-критерий) (проверка гипотез о равенстве средних).
- •25. Построение и трактовка главных факторов.
- •26. Многомерное шкалирование.
- •27. Метод кластеризации данных.
- •28. Параметрические и непараметрические методы.
18.Основные возможности пакета Statistica for Windows.
Statistica — пакет для всестороннего статистического анализа, разработанный компанией StatSoft. В пакете STATISTICA реализованы процедуры для анализа данных(data analysis), управления данными (data management), добычи данных (data mining), визуализации данных (data visualization). Существуют различные варианты пакета в зависимости от целей и задач пользователя:
однопользовательская версия (Single-User)
сетевая версия (Concurrent Network) — для использования в локальных вычислительных сетях
Enterprise версия — для использования в вычислительных системах и крупных организациях
Web-Based — для использования в крупных сетях через web-браузер.
Пакет STATISTICA имеет модульную структуру. Каждый модуль содержит уникальные процедуры и методы анализа данных:
Base — включает в себя обширный выбор основных статистик, широкий набор методов для разведочного анализа.
Advanced Linear/Non-Linear Models — предлагает широкий спектр линейных и нелинейных средств моделирования, регрессионный анализ, анализ компонент дисперсий, анализ временных рядов и т. д.
Multivariate Exploratory Techniques — многомерные разведочные технологии анализа STATISTICA предоставляет широкий выбор разведочных технологий, начиная с кластерного анализа до расширенных методов классификационных деревьев, в сочетании с бесчисленным набором средств интерактивной визуализации для построения связей и шаблонов.
QC — Контроль качества — предоставляет широкий спектр аналитических методов управления качеством, а также контрольные карты презентационного качества, непревзойденной гибкости и разнообразия.
Neural Networks — (отдельный модуль) единственный в мире программный продукт для нейросетевых исследований, полностью переведенный на русский язык.
Data Miner — интеллектуальный анализ данных .
Графические возможности
Пакет Statistica содержит разнообразное двумерное и трехмерное графическое представление данных. Он включает полный набор двумерных и трехмерных гистограмм рассеяния, функциональных графиков одной или нескольких переменных (с указанием стандартных ошибок или без него), столбиковых и круговых диаграмм, матричных графиков и др. Также пакет осуществляет различные типы сглаживания и построения графиков функций распределения и их производных для обширного класса вероятностных семейств. Данный пакет программ позволяет проводить настройку всех возможных элементов графика. Значения многочисленных параметров из меню настройки графического вывода хранятся в специальном файле и используются по умолчанию.
17.Корреляционный анализ. Диаграмма рассеяния.
Корреляционный анализ (correlation analysis) – подразумевает измерение силы связи между двумя или более переменными, при этом он рассматривает совместное изменение двух оцениваемых переменных.
Цели изучения взаимосвязей:
Описание и понимание взаимосвязей
Прогнозирование и предсказание нового наблюдения
Регулирование и управление процессом
Инструменты корреляционного анализа:
Построение диаграммы рассеяния (поле корреляции)(scattergam);
Расчет коэффициента парной корреляции R (regression coefficent)
Диаграмма рассеяния – графическое представление точек с координатами, определяемыми значениями двух переменных (независимой и зависимой), для всех наблюдений.
переменная, рассматриваемая как «причина», влияющая на другую переменную обозначается Х -горизонтальная ось
реагирующая на влияние переменная обозначается У -вертикальная ось
