Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Скачиваний:
61
Добавлен:
11.03.2016
Размер:
2.54 Mб
Скачать

7.1.5. Число степеней свободы

Число степеней свободы определяет то количество сведений, которое остаётся свободным после использования всей совокупности сведений для определения некоторой статистической характеристики.

Фиксирование объёма выборки и суммирование её значений накладывает на совокупность сведений одну линейную связь (всегда можно вычислить любое значение выборки, если другие значения известны и известно ). Значит число степеней свободы ν=n-1.

В биномиальном распределении и в распределении Пуассона учитываются 2 связи – одна связь, которая возникает при суммировании частот, вторая – связь, которая образуется при определении теоретических параметров распределения (р – при биномиальном и а для распределения Пуассона). Здесь число степеней свободы ν=n-2. При нормальном распределении ν=n-3, т.к.число параметров нормального распределения равно двум ().

7.1.7. Определение минимально достаточного объёма выборки в грамматических, фонетико-фонологических и лексикологических исследованиях.

Величина абсолютной ошибки, которая допускается при использовании частоты события А вместо его вероятности, равна , отсюда . Эта формула применяется при исследованиях употребительности грамматических, фонетических и фонологических единиц, которые обычно дают нормальное распределение и вероятность которых не очень мала.

Пример. По данным предварительного исследования относительная частота употребления мягких согласных фонем в украинских драматургических текстах равна 0,0828. Необходимо при заранее заданных максимальной абсолютной ошибке и надёжности определить минимально достаточный объём выборки для получения достоверных сведений об употребительности мягких согласных фонем в украинских драматургических текстах.

Подставляя данные в предыдущую формулу, получаем

Ответ: объём выборки должен быть больше 60 тыс. фонем.

В ходе лексикологических исследований нужно принять во внимание, что относительные частоты лексических единиц обычно очень малы, следовательно разности близки к 1 и.

Пример. Относительная частота словосочетания split cylinder «разрезной цилиндр» в английских текстах по строительным материалам составляет 0,000175. Необходимо определить минимально достаточный объём выборки, удовлетворяющий надёжности 0,95 и 33% относительной ошибке Ответ:

7.2. Проверка статистических гипотез. Исследование вероятностных свойств языка и статистики текста с помощью метода гипотез.

Одна из основных задач применения статистических методов в языкознании состоит в решении вопроса о том, можно ли на основании выборки принять некоторое предположение (гипотезу) относительно генеральной лингвистической совокупности.

7.2. Проверка статистических гипотез.

Одна из основных задач применения статистических методов состоит в решении вопроса о том, можно ли на основании выборки принять некоторое предположение (гипотезу) относительно генеральной лингвистической совокупности.

7.2.1. Статистические гипотезы.

Статистическая гипотеза – всякое предположение о генеральной совокупности, проверяемое по выборке. Гипотезу нельзя доказать, её можно только принять или опровергнуть.

Проверкой статистических гипотез называется процедура сопоставления статистической гипотезы с выборочными данными.

Простая гипотеза –об одном значении параметра, в противном случае - сложная гипотеза.

Выделяют гипотезы : - основная или нулевая гипотеза H0 и

H1- альтернативная гипотеза - логическое отрицание гипотезы H0.

Например, H0: М(Х1)=М(Х2) (различие средних значений двух совокупностей не значимо).

Тогда H1: различие средних статистически значимо.

Параметрические гипотезы - о параметрах распределения генеральной совокупности.

Непараметрические гипотезы - о неизвестном законе распределения генеральной совокупности.

Тут вы можете оставить комментарий к выбранному абзацу или сообщить об ошибке.

Оставленные комментарии видны всем.