Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Ермолаев О.Ю. Математическая статистика.doc
Скачиваний:
309
Добавлен:
13.08.2019
Размер:
23.04 Mб
Скачать

4.3. Среднее арифметическое

Среднее арифметическое ряда из п числовых значений X1 Х2, ..Xп обозначается и подсчитывается как:

Здесь величины 1, 2...п являются так называемыми индексами. В том случае, если отдельные значения выборки повторяют­ся, среднюю арифметическую вычисляют по формуле:

(4.2)

в таком случае называют взвешенной средней, где fi — ча­стоты повторяющихся значений.

Знак ∑ является символом операции суммирования. Он озна­чает, что все значения Xi должны быть просуммированы. Числа, стоящие над и под знаком ∑ называются пределами суммирова­ния и указывают наибольшее и наименьшее значения индекса суммирования, между которыми расположены его промежуточ­ные значения.

Например, в формуле (4.1) суммирование начинается с пер­вого элемента выборки, поэтому и пишется так: i = 1, и закан­чивается последним, поэтому наверху символа суммирования X стоит величина п.

Если же мы запишем так:

46

то, поскольку нижний индекс суммирования / равен 4, а верх­ний равен 6, то будут просуммированы следующие элементы ряда Х4, Х5 и Х6, и в результате будет получено: Х45 + Х6. Или, если будет написано следующее выражение:

то, поскольку нижний индекс суммирования i равен 1, а верх­ний равен 3, то будут просуммированы следующие элементы ряда Х1, Х2 и X3, и в итоге будет получено: Х12 + X3

В дальнейшем мы будем пользоваться сокращением, которое состоит в том, что если производится суммирование всех эле­ментов выборки от первого до последнего, то верхний и нижний пределы суммирования указываться не будут, а пишется просто:

Х или ∑Xi .

При вычислении величины средней по таблице чисел в даль­нейшем будет использоваться следующая формула:

(4.3)

где х — значения всех переменых, полученных в эксперименте, или все элементы таблицы;

при этом индексу меняется от 1 до р, где р число стол­бцов в таблице, а индекс / меняется от 1 до п, где п — число испытуемых или число строк в таблице.

Тогда общая средняя всей анализируемой совокупности данных; N — общее число всех элементов в таблице (анализиру­емой совокупности экспериментальных данных) и в общем слу­чае N = р • п.

Символическое обозначение хij очень удобно. Например, пусть перед нами стоит задача — указать конкретный элемент нашей таблицы. Для этого мы должны знать номер столбца, на­пример 4, и номер строки (или порядковый номер испытуемо­го), например 5. Тогда его обозначение будет таково: х54. Это значит, что выбран пятый элемент в строчке из четвертого столбца.

47

Символ ∑∑ (двойная сумма) означает, что вначале осуще­ствляется суммирование всех элементов таблицы по индексу i -т.е. по строкам, затем полученные суммы по строчкам складыва­ются по столбцам, или, иначе говоря, по индексу у.

Следует подчеркнуть, что средние величины характеризуют выборку одним (средним) числом. Преимущество, или иначе, информативная значимость, средних величин заключается в их способности аккумулировать или уравновешивать все индивиду­альные отклонения, в результате чего проявляется то наиболее устойчивое и типичное, что характеризует качественное своеоб­разие варьирующего объекта, позволяя отличить одну выборку от другой, а на этой основе, например, одно измеренное психо­логическое свойство от другого.

Однако среднее как статистический показатель не лишено недостатков. Так, например, при вычислении среднего количе­ства ошибок при выполнении корректурной пробы может быть получена величина равная 1,3 ошибки или при определении среднего числа учеников, обучающихся в пятых классах данной школы, может быть получена величина равная 30,07. Конечно, с точки зрения статистика эти величины обычны, но для психо­логических задач они могут быть неприемлемы.

Кроме того, среднее оказывается достаточно чувствительным к очень маленьким или очень большим величинам, отличаю­щимся от основных значений измеренных характеристик. Приве­дем пример из книги Дж. Б. Мангейма и Ричарда К. Рича: «Поли­тология. Методы исследования» М., 1997 г. «Пусть 9 человек име­ют доход от 4500 до 5200 тыс. долларов в месяц. Величина их среднего дохода равняется 4900 долларов. Если же к этой группе добавить человека, имеющего доход в 20000 тыс. долларов в ме­сяц, то средняя всей группы сместится и окажется равной 6410 долларов, хотя никто из всей выборки (кроме одного человека) реально не получает такой суммы. Понятно, что аналогичное смещение, но в противоположную сторону можно получить и в том случае, если добавить в эту группу человека с очень малень­ким годовым доходом».

Важно подчеркнуть, что подобные крайние величины, т.е. те, которые существенно искажают величину средней, оказываются в то же время и наименее характерными для изучаемой генераль-

48

ной совокупности. Именно поэтому в статистике, кроме средней величины, используются и другие характеристики «типичных значений» выборки, такие, как мода, медиана и ряд других ха­рактеристик.