
- •1. Характеристика учебной дисциплины
- •Назначение учебной дисциплины
- •Цель изучения дисциплины
- •Задачи изучения дисциплины
- •1.4. Методология
- •Календарно-тематический план курса
- •Темы (вопросы) для срс
- •4. Содержание программы
- •4.1. Планы лекций
- •4.2. Планы лабораторных занятий
- •4.3. Порядок изучения материала и выполнения заданий (срс)
- •5. Система оценки знаний студентов
- •Глоссарий
- •Базовые термины математической статистики и анализа данных
- •1.2 Краткая историческая справка[2]
- •1.4 Типы данных психолого-педагогического исследования
- •1.5 Описательная статистика
- •Случайная величина и вероятность события Математическая статистика тесно связана с другой математической наукой – теорией вероятности и базируется на ее математическом аппарате.
- •Математическое ожидание – числовая характеристика св, приближенно равная среднему значению св:
- •Закон распределения св
- •Биномиальное распределение (распределение Бернулли)
- •Распределение Пуассона
- •Нормальное (гауссовское) распределение
- •Распределение вероятностей непрерывной cв х, принимающие все свои значения из отрезка [а;b] называется равномерным, если ее плотность вероятности на этом отрезке постоянна, а вне его равна нулю:
- •Общие принципы проверки статистических гипотез
- •4.3 Понятие гипотезы в педагогике
- •Анализ одной и двух нормальных выборок
- •6.1 Параметрические критерии
- •6.1.1 Методы проверки выборки на нормальность
- •Случай независимых выборок
- •1. Что если полученное в опыте значение t окажется меньше табличного? Тогда надо принять нулевую гипотезу.
- •3. Что если в контрольной группе результаты окажутся выше, чем в экспериментальной? Поменяем, например, местами, сделав средней арифметической экспериментальной группы, a — контрольной:
- •Б) случай связанных (парных) выборок
- •Лекция_5 Однофакторный дисперсионный анализ для несвязанных выборок
- •Лекция_6 Дисперсионный анализ для связанных выборок
- •Двухфакторный анализ
- •Связь задач двухфакторного и однофакторного анализа
- •Аддитивная модель данных двухфакторного эксперимента при независимом действии факторов
- •Непараметрические критерии проверки гипотезы об отсутствии эффектов обработки
- •Лекция_8 Регрессионный анализ
- •1. Парная линейная регрессия
- •1.1. Взаимосвязи экономических переменных
- •Суть регрессионного анализа
- •1.3. Парная линейная регрессия.
- •8.1 Требования к статистическим пакетам общего назначения
- •8.2 Российские пакеты обработки данных
- •8.4 Пакет stadia
- •Лекция_10 Корреляционный анализ Понятие корреляционной связи
- •7.2.2 Коэффициент корреляции Пирсона
- •Параметрические критерии
- •6.1.1 Методы проверки выборки на нормальность
- •Анализ временных рядов на компьютере
- •Многомерный анализ и другие статистические методы
- •Многомерное шкалирование
- •1.1 Характеристика пакета Excel
- •1.2 Использование специальных функций
- •Задания для самостоятельной работы
- •1.2 Использование инструмента Пакет анализа
- •Задание для самостоятельной работы
- •2.1 Биномиальное распределение
- •Задания для самостоятельной работы
- •2.2 Нормальное распределение
- •Задания для самостоятельной работы
- •2.3 Генерация случайных величин
- •Задание для самостоятельной работы
Многомерное шкалирование
Во многих областях исследования (например, в психологии, биологии, социологии, лингвистике и т.д.) бывает затруднительно или невозможно проводить непосредственное измерение интересующих исследователя характеристик объектов из изучаемой совокупности, зато можно экспертным или каким-то другим путем оценивать степень сходства или различия между парами объектов. В этом случае для интерпретации получаемых данных используются методы многомерного шкалирования. Они позволяют представить совокупность интересующих исследователя.
объектов в виде некоторого набора точек многомерного пространства некоторой небольшой размерности, при этом каждому объекту соответствует одна точка. Координаты точек истолковываются как значения неких характеристик исходных объектов, которые и объясняют их свойства или взаимоотношения.
В случае удачного шкалирования, когда точки полученного пространства представляют объекты без серьезных погрешностей и размерность этого пространства невелика (равна, скажем, двум или трем), исследователь получает возможность представить изучаемую совокупность объектов наглядно. Часто это помогает по-новому осознать проблему, увидеть ее новые черты и особенности, либо осознать те скрытые признаки, которые и определяют видимые свойства объектов или их взаимоотношения.
Типичный пример использования методов многомерного шкалирования — изучение политических деятелей. Здесь исходными данными для анализа могут служить экспертные оценки сходства или различия взглядов политических деятелей по некоторому набору вопросов. Для депутатов парламента такими данными могут служить результаты голосований. И очень часто с помощью методов многомерного шкалирования удается объяснить исходные данные с помощью нескольких характеристик взглядов политических деятелей, которые и описывают (в основном) их поведение. Например, может оказаться, что результаты голосований депутатов в парламенте в основном объясняются всего двумя-тремя характеристиками. Исследователь может условно их назвать, скажем, «приверженность к либеральной или к государственной модели экономики» и «прозападная или почвенническая ориентированность», или как-то еще. Результаты подобных исследований иногда публикуются в газетах.
Часто в качестве исходных данных для шкалирования используются не сами оценки степени сходства объектов, а результаты их ранжирования. Соответствующие методы шкалирования называются неметрическими. Они были разработаны для решения проблем психологии: здесь исходными данными часто служат суждения человека (как испытуемого либо как эксперта), поэтому их количественные значения носят в значительной мере условный характер. Чтобы избавиться от этой условности, и прибегают к ранжированию. Сейчас неметрическое многомерное шкалирование широко применяется и для других данных.
Методы контроля качества
Из многочисленных специализированных разделов статистики мы рассмотрим один — методы контроля качества. Эти методы, как следует из их названия, предназначены для контроля качества выпускаемой продукции с целью выявления нарушений и узких мест в организации производства и в технологических процессах, ведущих к снижению качества продукции. Повсеместное применение научно обоснованных методов контроля качества явилось немаловажным фактором успехов стран — лидеров мировой экономики, в особенности Японии.
В отличие от большинства описанных выше многомерных методов методы контроля качества не требуют трудоемких вычислений — они исключительно просты и наглядны. Целью этих методов может быть:
получение наглядного представления о выборочном распределении зна чения некоторого параметра в выпускаемой продукции и сравнение этого распределения с границами допуска (гистограмма качества);
наглядное выделение наиболее важных факторов, влияющих на каче ство продукции (диаграмма Парето);
выявление необычных отклонений в параметрах выпускаемой продук ции и отделения случайных отклонений от неслучайных и требующих вмешательства тенденций (контрольные карты).
Простота, наглядность и эффективность статистических методов контроля качества сделали возможным и оправданным их повсеместное (вплоть до мастеров, а иногда и отдельных рабочих) применение в передовых странах.
Использование статистических пакетов
В пакетах STADIA и SPSS представлены все перечисленные выше методы, хотя реализации их в этих пакетах отличаются. Например, для кластерного анализа и шкалирования обеспечивается различный набор возможных расстояний, стратегий объединения объектов в кластеры и методов шкалирования.
В документации и во встроенном справочнике системы STADIA читатель сможет найти дополнительные пояснения по назначению и методике применения статистических методов, описанных в этой главе.
Лабораторная работа 1.
Использование электронных таблиц Excel 2000 для вычисления выборочных характеристик данных
1. ХАРАКТЕРИСТИКА УЧЕБНОЙ ДИСЦИПЛИНЫ 3
3. Темы (вопросы) для СРС 5
4. СОДЕРЖАНИЕ ПРОГРАММЫ 6
Линейный регрессионный анализ. 7
4.2. Планы лабораторных занятий 8
Случайная величина и вероятность события 21
Закон распределения СВ 22
Биномиальное распределение (распределение Бернулли) 23
Распределение Пуассона 23
Нормальное (гауссовское) распределение 24
2.6 Равномерное распределение 25
Общие принципы проверки статистических гипотез 25
4.3 Понятие гипотезы в педагогике 26
6.1 Параметрические критерии 28
6.1.1 Методы проверки выборки на нормальность 28
случай независимых выборок 29
б) случай связанных (парных) выборок 31
Лекция_5 33
Однофакторный дисперсионный анализ для несвязанных выборок 33
Лекция_6 36
Дисперсионный анализ для связанных выборок 36
Лекция_8 42
Регрессионный анализ 42
8.1 Требования к статистическим пакетам общего назначения 52
8.2 Российские пакеты обработки данных 52
8.3 Пакет STATISTICA 53
8.4 Пакет STADIA 54
Лекция_10 55
Корреляционный анализ 55
Понятие корреляционной связи 55
7.2.2 Коэффициент корреляции Пирсона 58
Многомерное шкалирование 75
1.1 Характеристика пакета Excel 78
1.2 Использование специальных функций 79
Задания для самостоятельной работы 79
1.2 Использование инструмента Пакет анализа 80
Задание для самостоятельной работы 80
2.1 Биномиальное распределение 82
Задания для самостоятельной работы 84
2.2 Нормальное распределение 84
Задания для самостоятельной работы 85
2.3 Генерация случайных величин 86
Задание для самостоятельной работы 87
Лабораторная работа №3 88
Применение инструментальных средств для решения основных задач математической статистики 88
Лабораторная работа №4 88
Алгоритмы параметрических критериев. Критерий Стьюдента. Критерий Фишера. 88
Лабораторная работа №5 90
Проверка гипотезы о нормальном распределении генеральной совокупности по критерию Пирсона 90
Лабораторная работа №6 91
Выявление различий в уровне исследуемого признака. Q-критерий Розенбаума, U-критерий Манна-Уитни, H-критерий Крускала-Уолиса, S-критерий тенденций Джонкира. 91
Лабораторная работа №7 93
Оценка достоверности сдвига в значениях исследуемого признака.G-критерий знаков. G-критерий Вилкоксона.Критерий Фридмана. L-критерий тенденций Пейджа. 93
Математическая статистика подразделяется на две основные области: описательную и аналитическую статистику. Описательная статистика охватывает методы описания статистических данных, представления их в форме таблиц, распределений.
Аналитическая статистика или теория статистических выводов ориентирована на обработку данных, полученных в ходе эксперимента, с целью формулировки выводов, имеющих прикладное значение для самых различных областей человеческой деятельности.