- •Тема 1. Графическое представление и первичная обработка фондовых данных.
- •1.1. Общие сведения.
- •Непрерывные и дискретные данные.
- •Данные кросс-секций и временных рядов.
- •1.2. Представление данных.
- •1.3. Описательные статистические показатели.
- •Показатели центра распределения.
- •Интервалы цен некоторой акции.
- •1.4. Дисперсия и среднее квадратическое отклонение.
- •1.5. Показатели статистической связи.
- •1.6. Показатели, характеризующие тенденцию динамики.
- •Абсолютные и относительные показатели тенденции.
Показатели центра распределения.
Практически каждый человек знаком с понятием средней величины, будь это "средний" размер остатка по кредитной карте, "среднее" число операций по счету и т.д. Фактически существует несколько показателей "средней", которые особенно интересны в сфере финансов. Это:
мода;
медиана;
средняя арифметическая;
средняя геометрическая.
Мода - это наиболее часто наблюдаемая величина изучаемой переменной. Для ее иллюстрации рассмотрим следующие данные, которые показывают цену акции, выраженную в рублях, в течение 15-дневного периода:
100, 120, 90, 80, 100, 150, 140, 120, 110, 100, 120, 120, 100, 120, 110.
Модой, т.е. наиболее часто повторяющимся наблюдением, является величина 120.
Медиана - это значение наблюдения, которое находится в середине ранжированного ряда данных, т.е. наблюдение, занимающее срединное положение.
Медиана для несгруппированных данных. Для определения медианы в случае несгруппированных данных мы сначала должны расположить их в возрастающем порядке. Покажем это на примере, использованном при рассмотрении моды
80, 90, 100, 100, 100, 100, 110, 110, 120, 120, 120, 120, 120, 140, 150.
Так как присутствуют 15 наблюдений, медианой является значение восьмого наблюдения, т.е. величина признака, равная 11.
Если бы в примере было четное число наблюдений, то отсутствовало бы "срединное" наблюдение, поэтому была бы рассчитана средняя из двух значений, стоящих посередине. Результатом может являться число, не присутствующее на самом деле в ряду данных.
Средняя арифметическая — наиболее часто используемый показатель центра распределения, именно ее большинство людей рассматривают в качестве средней.
Средняя арифметическая для несгруппированных данных. Средние показатели динамики - средний уровень ряда, средние абсолютные изменения и ускорения, средние темпы роста - характеризуют тенденцию. Они необходимы при обобщении характеристик тенденции за длительный период, по различным периодам; они незаменимы при сравнении развития за неодинаковые по длительности отрезки времени и при выборе аналитического выражения тренда. При наличии в динамическом ряду существенных колебании уровней определение средних показателей тенденции требует применения специальных методов статистики. В данном разделе рассматриваются только математические свойства средних показателей динамики и простейшие приемы их вычисления, применимые па практике к рядам со слабой колеблемостью.
Средняя арифметическая рассчитывается суммированием всех значений отдельных наблюдений и последующим делением полученной суммы на количество наблюдений. Например, допустим, что мы желаем подсчитать среднюю арифметическую цены какого-либо актива в течение пяти дней. В данный период мы наблюдаем следующие цены
225 225 240 215 230
Найдем среднюю арифметическую, складывая эти пять значений и деля сумму на число наблюдений. В формализованном виде средняя арифметическая выглядит так:
(1.2).
Здесь
показано, что
- это сумма
(отдельных
наблюдений X),
поделенная на количество наблюдений.
Греческая заглавная буква сигма
(
)
- оператор суммирования, означает, что
все
необходимо
сложить вместе. Так как в нашем примере
всего пять
,
то оператор
суммирования будет выглядеть следующим
образом
,
показывая, что первые пять
должны
быть сложены друг с другом. Сейчас
мы можем подсчитать среднюю арифметическую
пяти цен ценной бумаги: (225
+
225 + 240 + 215 + 230)/5
= 227.
Таким образом, средняя арифметическая цена равняется 227.
В моментном ряду смысл среднего уровня заключается в том, что он характеризует уже не состояние объекта в отдельные моменты, а его среднее, обобщенное состояние между начальным и конечным моментами учета. Из этого следует, что уровни, относящиеся к начальному и конечному моментам, играют не ту роль, что уровни, относящиеся к моментам внутри изучаемого отрезка времени. Начальный и конечный уровни находятся на границе изучаемого интервала, они наполовину относятся к предыдущему и последующему интервалам и лишь наполовину к изучаемому. Уровни, относящиеся к моментам внутри осредняемого интервала, целиком относятся только к нему. Отсюда получаем особую форму средней арифметической величины, называемой хронологической средней:
(1.3).
Проблема вычисления среднего уровня моментного ряда при неравных промежутках между моментами является спорной и здесь не рассматривается. Если известны точные даты изменения уровней моментного ряда, то средний уровень определяется как
(1.4).
Средний абсолютный прирост (абсолютное изменение) определяется как простая арифметическая средняя из абсолютных изменений за равные промежутки времени (цепных абсолютных изменений) или как частное от деления базисного абсолютного изменения на число осредняемых отрезков времени от базисного до сравниваемого периода:
(1.5).
Средняя арифметическая для сгруппированных данных. Часто верхние и нижние пределы крайних интервалов остаются открытыми. Следовательно, необходимо сделать допущение о границах интервалов. Это допущение должно базироваться на характеристиках анализируемых данных. Например, данные из табл. 1.2. относятся к рыночной цене акции, которую наблюдали некоторое время аналитики. Нижний интервал обозначен "До 260 руб.", а верхний — "Более 550 руб.".
Таблица 1.2.
