Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
матан.doc
Скачиваний:
0
Добавлен:
01.03.2025
Размер:
164.86 Кб
Скачать

30. Меры центральной тенденции.

Назначение М. ц. т. - служить сводными количественными характеристиками, обеспечивающими наилучшее описание множества наблюдений или оценок одним единственным числом. Термины М. ц. т. и «средняя величина» часто употребляются как равнозначные, хотя некоторые авторы сужают объем понятия «средняя величина» до среднего арифметического. Несмотря на разнообразие М. ц. т., чаще всего встречаются мода, медиана и среднее.

Мода - это просто наиболее часто встречающееся в определенной совокупности наблюдений значение переменной. При сгруппированных данных мода определяется как середина интервала группирования, содержащего наибольшее число значений наблюдаемой переменной.

Медиана - это значение переменной, делящее упорядоченную совокупность наблюдений пополам, так что одна половина значений в этой совокупности лежит ниже медианы, а др. их половина - выше медианы. Если совокупность образована нечетным числом значений наблюдаемой переменной, то медиана равна значению переменной, являющемуся серединой упорядоченной совокупности наблюдений. Если же совокупность образована четным числом значений, то медиана определяется значением, лежащим посередине между двумя значениями, находящимися в центре упорядоченной совокупности наблюдений. Медиана - более полезная мера, чем мода, и часто используется в случае скошенного (асимметричного) распределения данных. Следует, однако, отметить, что медиана нечувствительна к величине крайних значений упорядоченной совокупности наблюдений.

Среднее арифметическое - самая распространенная мера центральной тенденции - определяется как сумма значений наблюдаемой переменной, разделенная на их число. (В данной статье под «средним» подразумевается среднее арифметическое.) Использование среднего дает исследователю ряд преимуществ. В отличие от др. М. ц. т., среднее чувствительно к точному положению каждого значения в распределении переменной. Правда, это достоинство среднего арифметического оборачивается недостатком в виде повышенной чувствительности к крайним значениям переменной, и потому его иногда избегают использовать в случае сильно скошенных распределений.

Среднее - особенно полезная мера в области статистических выводов, поскольку выборочное среднее является относительно эффективной оценкой генерального среднего. Если из генеральной совокупности значений наблюдаемой переменной случайно извлечь даже большое количество выборок, не следует ожидать точного равенства выборочных средних между собой или генеральному среднему. Однако, можно доказать, что выборочные средние отклоняются от генерального среднего меньше, чем выборочные медианы отклоняются от медианы генеральной совокупности. Можно также доказать (центральная предельная теорема), что выборочное распределение среднего приближается к нормальному распределению по мере увеличения объема выборки.

№31. Мода

Другой мерой центральной тенденции является мода (Мо) - наиболее часто встречающийся результат. В интервальном частотном распределении мода определяется как середина интервала, для которого частота максимальна.

Пример: В ряду значений 2, 3, 4, 5, 5, 6, 6, 6, 7, 7, 8, 9 модой является 6, потому, что 6 встречается чаще любого другого числа.

Обратите внимание, что мода представляет собой наиболее часто встречающееся значение (в данном примере это 6), а не частоту встречаемости этого значения (в данном примере равную 3).

Когда два соседних значения имеют одинаковую частоту и их частота больше частот любых других значений, мода вычисляется как среднее арифметическое этих двух значений.

Пример: в выборке 1, 2, 2, 2, 5, 5, 5, 6 частоты рядом расположенных значений 2 и 5 совпадают и равняются 3. Эта частота больше, чем частота других значений 1 и 6 (у которых она равна 1). Следовательно, модой этого ряда будет величина 

№32.Медиана

медиана – среднее по порядку значение (принятые обозначения: Median, m). Медиана - это "серединное" значение признака в том смысле, что у половины объектов совокупности значения этого признака меньше, а у другой половины - больше медианы. Приближенно вычислить медиану можно, упорядочив все значения признака по возрастанию (убыванию) и найдя число в этом вариационном ряду, которое либо имеет номер (n+1)/2 - в случае нечетного n, либо находится посередине между числами с номерами n/2 и (n+1)/2 - в случае четного n.

Не все из перечисленных характеристик можно вычислять для качественных признаков. Если признак качественный и номинальный, то для него можно найти только моду (ее значением будет название наиболее часто встречающейся категории номинального признака). Если признак ранговый, то кроме моды для него можно найти еще и медиану. Среднее арифметическое значение можно вычислять только для количественных признаков.

В случае количественных данных все характеристики среднего уровня измеряются в тех же единицах, что и сам исходный признак.

Значения коэф-тов совпадают, если график распределения симметричен.

медиана (Ме), - результат, находящийся в середине последовательности показателей, если их расположить в порядке возрастания или убывания. Справа и слева от медианы (Ме) в упорядоченном ряду остается по одинаковому количеству данных (50% и 50%). Если ряд включает в себя четное количество признаков, то медианой (Ме) будет среднее, взятое как полусумма двух центральных значений ряда.

Пример: Найдем медиану выборки: 5, 4, 5, 6, 7, 3, 6, 2, 8, 6, 9, 7.

Упорядочим выборку: 2, 3, 4, 5, 5, 6, / 6, 6, 7, 7, 8, 9. Поскольку здесь имеется четное число элементов, то существует две ``середины'' - 6 и 6. В этом случае медиана определяется как среднее арифметическое этих значений.

Ме 

Пример: Найдем медиану выборки с нечетным количеством значений: 9, 3, 5, 8, 4, 11, 13.

Сначала упорядочим выборку по величинам входящих в нее значений. Получим: 3, 4, 5, 8, 9, 11, 13. Поскольку в выборке семь элементов, четвертый по порядку элемент будет серединой ряда. Таким образом, медианой будет четвертый элемент - 8

Значения Ме и Мо полезны для того, чтобы установить является ли распределение частных значений изучаемого признака симметричным и приближающимся к нормальному распределению. Среднее арифметическое (М), медиана (Ме) и мода (Мо) для нормального распределения обычно совпадают или очень мало отличаются друг от друга. При нормальном распределении результатов график распределения имеет форму колокола (рис. 2).

33. Среднее арифметическое

Среднеарифметическое (или выборочное среднее) значение представляет собой среднюю оценку изучаемого в эксперименте психологического качества. Эта оценка характеризует степень его развития в целом у той группы испытуемых, которая была подвергнута исследованию (выборка испытуемых). Сравнивая среднее значение двух или нескольких групп, мы можем судить об относительной степени развития у людей, составляющих эти группы, оцениваемого качества

Среднеарифметическое определяется по следующей формуле:

М = 

где М - среднеарифметическое значение

n - количество испытуемых

Пример: В исследовании объема вербальной механической памяти, тест ``10 слов'' в группе из 12 испытуемых (n = 12), получены следующие результаты (количество запомненных слов): 5, 4, 5, 6, 7, 3, 6, 2, 8, 6, 9, 7

Среднеарифметическое значение (М) 

Для данной выборки среднеарифметическое значение (М) = 5,6

37 дисперсия

Таким образом, для того чтобы найти дисперсию, достаточно вычислить сумму произведений возможных значений квадрата отклонения на их вероятност

38 стандартное отклонение

- это очень распространенный показатель рассеяния в описательной статистике. Но, т.к. технический анализ сродни статистике, данный показатель можно (и нужно) использовать в техническом анализе для обнаружения степени рассеяния цены анализируемого инструмента во времени.

1.вычисляем среднее арифметическое выборки данных

2.отнимаем это среднее от каждого элемента выборки

3.все полученные разницы возводим в квадрат

4.суммируем все полученные квадраты

5.делим полученную сумму на количество элементов в выборке (или на n-1, если n>30)

6.вычисляем квадратный корень из полученного частного (именуемого дисперсией)

39 коэф вариацииКоэффициент вариации используют для сравнения рассеивания двух и более признаков, имеющих различные единицы измерения. Коэффициент вариации представляет собой относительную меру рассеивания, выраженную в процентах. Он вычисляется по формуле: вэ равно о с хвостиком поделить на х с палочкой и умножить на 100%

где ВЭ - искомый показатель, О с хвостиком - среднее квадратичное отклонение, х и над ней палка - средняя величина.Пример: Определяется воспроизводимость двух методов измерения СОЭ. Первый метод (модифицированный метод Вестергрина) дал величину = 1,0 мм при = 10 мм, а второй (метод Линсенмайера) - =15 минут и = 180 минут.

Непосредственное сравнение средних квадратичных отклонений не дает ответа, так как речь идет о двух величинах, выраженных в разных единицах измерения. Следовательно, необходимо прибегнуть к коэффициенту вариации: V1=(1/10)*100=10%; V2=(15/180)*100=8,33%.

Воспроизводимость первого проверяемого метода ниже по сравнению со вторым (10% > 8,33%).

34Меры вариации

Колеблемость или изменяемость величин признака у единиц совокупности называется вариацией. Вариация порождается комплексом условий, действующих на совокупность и ее единицы. Например, вариация оценок на экзамене в вузе порождается различными способностями студентов, неодинаковым временем, затрачиваемым на самостоятельную работу, различием социально-бытовых условий и т.д.

Вариация существует и в пространстве и во времени. Под вариацией в пространстве понимается колеблемость значений признака по отдельным территориям. Под вариацией во времени подразумевают изменение значений признака в различные моменты времени. Так, со временем изменяются средняя продолжительность жизни, мнения людей и т.д. Показатели вариации делятся на две группы: абсолютные и относительные. К абсолютным относятся размах вариации, среднее линейное отклонение, дисперсия и среднеквадратическое отклонение. Вторая группа показателей вычисляется, как отношение абсолютных показателей к средней арифметической (медиане). Относительными показателями вариации являются коэффициенты осцилляции, вариации, относительное линейное отклонение и др. Простой абсолютный показатель - размах вариации (R). Размах вариации рассчитывается как разность между наибольшим (Xmax) и наименьшим (Xmin) значениями варьирующего признака, т.е. R=Xmax-Xmin.. Прежде, чем определить величину размаха вариации необходимо очистить совокупность от аномальных наблюдений. Например, нельзя вычислять размах вариации работников какого-либо частного предприятия, если наряду с заработками его работников включен заработок его владельца. Размах вариации – важный показатель колеблемости признака, но не исчерпывающий его характеристику.

№42 доверительный интервал

Доверительный интервал — термин, используемый при интервальной оценке статистических параметров, что предпочтительнее при небольшом объёме выборки. Доверительным называют интервал, который покрывает неизвестный параметр с заданной надёжностью.

ОпределениеДоверительным интервалом параметра θ распределения случайной величины X с уровнем доверия 100p% порождённым выборкой (x1,…,xn), называется интервал с границами (x1,…,xn) и (x1,…,xn), которые являются реализациями случайных величин L(X1,…,Xn) и U(X1,…,Xn), таких, чтоГраничные точки доверительного интервала и называются доверительными пределами. Интерпретация доверительного интервала, основанная на интуиции, будет следующей: если p велико (скажем, 0,95 или 0,99), то доверительный интервал почти наверняка содержит истинное значение θ.[ссылка 2]Еще одно истолкование понятию доверительного интервала: его можно рассматривать как интервал значений параметра θ, совместимых с опытными данными и не противоречащих им.

№45 предельная ошибка выборки

Предельная ошибка - максимально возможное расхождение средних или максимум ошибок при заданной вероятности ее появления.

Если чо ищи тут еще http://helpstat.ru/2011/12/oshibka-vyborki/

№49 РЕПРЕЗЕНТАТИВНОСТЬ

РЕПРЕЗЕН ВЫБОРКА СОХРАНАЯЕТ ОСНОВНЫЕ ХАРАКТЕРИСТИКИ ГЕН СОВОКУПНОСТИ С ОПРЕДЕЛЕННОЙ ТОЧНОСТЬЮ (ПРОВОРЦИИ ПО ВАЖ ХАРАКТЕРИСТИКАМ ВОЗРАСТ И Т.Д.Репрезентати́вность — соответствие характеристик выборки характеристикам популяции или генеральной совокупности в целом. Репрезентативность определяет, насколько возможно обобщать результаты исследования с привлечением определённой выборки на всю генеральную совокупность, из которой она была собрана.Также репрезентативность можно определить как свойство выборочной совокупности представлять параметры генеральной совокупности, значимые с точки зрения задач исследования.примерПредположим, совокупность — это все учащиеся школы (600 человек из 20 классов, по 30 человек в каждом классе). Предмет изучения — отношение к курению. Выборка, состоящая из 60 учеников старших классов, гораздо хуже представляет совокупность, чем выборка из тех же 60 человек, в которую войдут по 3 ученика из каждого класса. Главной причиной тому — неравное возрастное распределение в классах. Следовательно, в первом случае репрезентативность выборки низкая, а во втором случае репрезентативность высокая (при прочих равных условиях).

№47 выборка

Выборка - та часть генерал совокупности котор мы непосредственно наблюдаем .Выборка должна быть1) нерепрезентативной 2) обеспечить необходим точность в вычислении показателей. Выборочное наблюдение — это такой вид несплошного наблюдения, при котором отбор подлежащих обследованию единиц осуществляется в случайном порядке, отобранная часть изучается, а результаты распространяются на всю исходную совокупность. Наблюдение организуется таким образом, что эта часть отобранных единиц в уменьшенном масштабе репрезентирует (представляет) всю совокупность. Совокупность, из которой производится отбор, называется генеральной, и все ее обобщающие показатели — генеральными.

48 генерал совокупность

Это прообщность которую мы изучаем при слови места и времени .

Пример. Практически одна и та же случайно отобранная совокупность объектов — коммерческих банков одного административного округа Твери, может рассматриваться как выборка из генеральной совокупности всех коммерческих банков этого округа, и как выборка из генеральной совокупности всех коммерческих банков Твери, а также как выборка из коммерческих банков страны и т.д.

Генеральной совокупностью называют совокупность всех мысленно возможных объектов данного вида, над которыми проводятся наблюдения с целью получения конкретных значений случайной величины, или совокупность результатов всех мыслимых наблюдений, проводимых в неизменных условиях над одной из случайных величин, связанных с данным видом объектов.

Замечание: Часто генеральная совокупность содержит конечное число объектов. Однако если это число достаточно велико, то иногда в целях упрощения вычислений допускают, что генеральная совокупность состоит из бесчисленного множества объектов. Такое допущение оправдывается тем, что увеличение объема генеральной совокупности (достаточно большого объема) практически не сказывается на результатах обработки данных выборки.

50 Ошибка Репрезентативности

- мера отклонения статистической структуры выборки от структуры соответствующей генеральной совокупности. Ошибками репрезентативности называют расхождения между средними величинами или долями признака выборочной и генеральной совокупности. Они присущи только несилошным наблюдениям. Ошибки репрезентативности могут быть: систематическими и случайными.Систематическими называются ошибки, которые возникают из-за нарушения научного принципа отбора единиц в выборочную совокупность. Они возникают в тех случаях, когда в результате непрпавильного отбора в выборочную совокупность попали наилучшие или наихудшие единицы. В результате такого отбора средние и относительные показатели, полученные по выборочной совокупности, будут искаженно характеризовать генеральную совокупность.Случайные ошибки репрезентативности – это неточности, которые возникают из-за того, что выборочная совокупность не совсем правильно отражает средние величины и величины доли признака генеральной совокупности. Такие ошибки возникают даже при самом строгом соблюдении принципов и правил отбора единиц в выборочную совокупность.