
- •1.Психология и математика.
- •2. Генеральная совокупность и выборка.
- •3. Измерение. Шкалы измерения.
- •4. Таблицы и графики.
- •Статистические ряды
- •5. Первичные описательные статистики.
- •6. Нормальный закон распределения и его применение.
- •7. Статистические гипотезы и критерии.
- •8. Статистическое решение и вероятность ошибки.
- •Билет 10 Классификация задач и методов их решения
- •Билет 11 Параметрический критерий различий и сдвигов: т - Критерий Стьюдента
- •Билет 12 Непараметрические методы. Поиск критерия, адекватного задаче исследования.
- •Билет 14 оценка достоверности сдвига в значениях исследуемого признака
- •Билет 15 Выявление различий в распределении признака.
- •Билет 16 Многофункциональные статистические критерии
- •18Вопрос: Регрессионный анализ.
- •19Вопрос:Дисперсионный анализ.
- •20. Назначеные и классификация многомерных методов.
- •22.Дискриминантный анализ.
- •24. Кластерный анализ.
- •25. Моделирование психических процессов и поведения.
- •Детерминированные модели. Модели рефлексии.
- •«Формула человека» в.Лефевра.
- •Модели теории графов и геометрическое моделирование.
- •Кластерный анализ (ка).
- •Многомерное шкалирование (мш).
- •Стохастические модели. Вероятностные модели. Модели с латентными переменными.
- •Модели факторного анализа (фа).
- •Метод главных компонент.
- •Конфирматорный факторный анализ.
- •Модель латентных классов.
- •Модели научения.
- •Модели принятия решения.
- •Теория принятия решений.
- •Теория полезности.
- •Теория игр.
- •Динамическое программирование. Модели целенаправленного поведения.
- •Модели научения.
- •Модели интеллекта.
- •Перцептронные модели.
- •Моделирование естественного языка.
- •Нетрадиционные методы моделирования. Моделирование на «размытых» множествах.
- •Синергетика в психологии.
- •26. Теории искусственного интеллекта
8. Статистическое решение и вероятность ошибки.
Уровень значимости - это вероятность того, что мы сочли различия существенными, а они на самом деле случайны.
Когда мы указываем, что различия достоверны на 5%-ом уровне значимости, или при р<0,05, то мы имеем виду, что вероятность того, что они все-таки недостоверны, составляет 0,05.
Когда мы указываем, что различия достоверны на 1%-ом уровне значимости, или при р<0,01, то мы имеем в виду, что вероятность того, что они все-таки недостоверны, составляет 0,01.
Если перевести все это на более формализованный язык, то уровень значимости - это вероятность отклонения нулевой гипотезы, в то время как она верна.
Ошибка, состоящая в том, что мы отклонили нулевую гипотезу, в то время как она верна, называется ошибкой 1 рода.
Вероятность такой ошибки обычно обозначается как а. В сущности, мы должны были бы указывать в скобках не р<0,05 или р<0,01, а а<0,05 или <Х<0,01. В некоторых руководствах так и делается (Рунион Р., 1982; Захаров В.П., 1985 и др.).
Если вероятность ошибки - это а, то вероятность правильного решения: 1—а. Чем меньше а, тем больше вероятность правильного решения.
Исторически сложилось так, что в психологии принято считать низшим уровнем статистической значимости 5%-ый уровень (р<0,05): достаточным - 1%-ый уровень (р^О.01) и высшим 0,1% -ый уровень (р<0,001), поэтому в таблицах критических значений обычно приводятся значения критериев, соответствующих уровням статистической значимости р<0,05 и р<0,01, иногда - р<0,001. Для некоторых критериев в таблицах указан точный уровень значимости их разных эмпирических значений. Например, для ф*=1,56 р=0,06.
До тех пор, однако, пока уровень статистической значимости не достигнет р=0,05, мы еще не имеем права отклонить нулевую гипотезу.
Правило отклонения HQ и принятия Hi
Если эмпирическое значение критерия равняется критическому значению, соответствующему р^0,05 или превышает его, то HQ отклоняется, но мы еще не можем определенно принять W\.
Если эмпирическое значение критерия равняется критическому значению, соответствующему р<0,01 или превышает его, то HQ отклоняется и принимается Н^.
Исключения: критерий знаков G, критерий Т Вилкоксона и критерий U Манна-Уитни. Для них устанавливаются обратные соотношения. Для облегчения процесса принятия решения можно всякий раз вычерчивать "ось значимости".
Критические значения критерия обозначены как Qo,O5 и Qo,O1> эмпирическое значение критерия как QaMn. Оно заключено в эллипс.
Вправо от критического значения Qo.oi простирается "зона значимости" - сюда попадают эмпирические значения, превышающие Qooi и, следовательно, безусловно значимые.
Влево от критического значения Qo,O5 простирается "зона незначимое™", - сюда попадают эмпирические значения Q, которые ниже Qo,O5' и≫ следовательно, безусловно незначимы. Мы видим, что Qo,o5=6; Qo.oi=9; Q9Mn=8.
Эмпирическое значение критерия попадает в область между Qo,O5 и Qo.oi- Это зона "неопределенности": мы уже можем отклонить гипотезу о недостоверности различий (HQ), НО еще не можем принять гипотезы об их достоверности (Hf).
Практически, однако, исследователь может считать достоверными уже те различия, которые не попадают в зону незначимости, заявив, что они достоверны при р<0,05, или указав точный уровень значимости полученного эмпирического значения критерия, например: р=0,02. С помощью таблиц Приложения 1 это можно сделать по отношению к критериям Н Крускала-Уоллиса, у}г Фридмана, L Пейджа, ф* Фишера, X Колмогорова.
Уровень статистической значимости или критические значения критериев определяются по-разному при проверке направленных и ненаправленных статистических гипотез. При направленной статистической гипотезе используется односторонний критерий, при ненаправленной гипотезе - двусторонний критерий. Двусторонний критерий более строг, поскольку он проверяет различия в обе стороны, и поэтому то эмпирическое значение критерия, которое ранее соответствовало уровню значимости р<0,05, теперь соответствует лишь уровню р<0,10.
Билет 9 Параметрические и непараметрические методы. Мощность критериев
Параметрические и непараметрические методы
Методы обучения, т.е. нахождения достаточно хорошей распознающей функ-
ции f 2 F, традиционно подразделяются на параметрические и непарамет-
рические в соответствии с тем, просто или сложно устроено пространство F.
Параметрические — это те методы, в которых F = fF(w; ¢)jw 2 Wg для неко-
торого достаточно удобного (например, евклидова) пространства параметров
W и некоторой функции F: W £ X ! Y, а непараметрические — это мето-
ды, в которых, якобы, пространство F не зафиксировано заранее, а зависит
от обучающего набора T. На самом деле разница между параметрическими и
непараметрическими методами — только в употребляемых словах.
Полезный пример параметрических методов — методы обучения линейных
распознавателей, которых даже для простейшей линейной регрессии (X = Rd,
Y = R, W = R £ Rd, F(w; x) = w0 +Pdj=1 wjxj) довольно много. Подробнее
эти методы рассматриваются в разделе 2.
[А.Б. Мерков]
непараметрические методы в математической статистике, методы непосредственной оценки теоретического распределения вероятностей и тех или иных его общих свойств (симметрии и т.п.) по результатам наблюдений. Название Н. м. подчёркивает их отличие от классических (параметрических) методов, в которых предполагается, что неизвестное теоретическое распределение принадлежит какому-либо семейству, зависящему от конечного числа параметров (например, семейству нормальных распределений, и которые позволяют по результатам наблюдений оценивать неизвестные значения этих параметров и проверять те или иные гипотезы относительно их значений. Разработка Н. м. является в значительной степени заслугой советских учёных.
Мощность критериев
Мощность критерия - это его способность выявлять различия, если они есть. Иными
словами, это его способность отклонить нулевую гипотезу об отсутствии различий, если
она неверна.
Ошибка, состоящая в том, что мы приняли нулевую гипотезу, в то время как
она неверна, называется ошибкой II рода.
Вероятность такой ошибки обозначается как β. Мощность критерия - это его
способность не допустить ошибку II рода, поэтому:
Мощность=1—β
Мощность критерия определяется эмпирическим путем. Одни и те же задачи могут
быть решены с помощью разных критериев, при этом обнаруживается, что некоторые
критерии позволяют выявить различия там, где другие оказываются неспособными это
сделать, или выявляют более высокий уровень значимости различий. Возникает вопрос: а
зачем же тогда использовать менее мощные критерии? Дело в том, что основанием для
выбора критерия может быть не только мощность, но и другие его характеристики, а
именно:
а) простота;
б) более широкий диапазон использования (например, по отношению к данным,
определенным по номинативной шкале, или по отношению к большим n);
в) применимость по отношению к неравным по объему выборкам;
г) большая информативность результатов.