- •Тема 1. Графическое представление и первичная обработка фондовых данных.
- •1.1. Общие сведения.
- •Непрерывные и дискретные данные.
- •Данные кросс-секций и временных рядов.
- •1.2. Представление данных.
- •1.3. Описательные статистические показатели.
- •Показатели центра распределения.
- •Интервалы цен некоторой акции.
- •1.4. Дисперсия и среднее квадратическое отклонение.
- •1.5. Показатели статистической связи.
- •1.6. Показатели, характеризующие тенденцию динамики.
- •Абсолютные и относительные показатели тенденции.
Тема 1. Графическое представление и первичная обработка фондовых данных.
1.1. Общие сведения.
Термин «первичные данные» - это общий термин, относящийся к группе сводных показателей, каждый из которых одним числом определяет какое-либо качество совокупности данных. Например, при анализе рынка ценных бумаг часто необходимо подсчитать некоторую форму среднего значения группы активов или среднюю цену активов в данном периоде. Также финансовым аналитикам часто приходится измерять, как рассеяны доходности и цены фондовых инструментов. На практике часто требуется узнать, как распределены доходности и цены симметрично вокруг средней величины, имеется ли скошенность в распределении доходов и имеет ли их распределение пик, выраженный больше или меньше, чем предполагалось.
Статистики определяют средние значения как показатели центра распределения. Статистические показатели, которые описывают или измеряют, как данные распределены вокруг среднего значения, известны как показатели вариации. Величины, определяющие симметричность данных, называются показателями асимметрии или мерами скошенности, а выражающие пиковость данных — показателями эксцесса.
Данные могут иметь различный вид, который иногда диктует выбор методов статистического анализа или по меньшей мере влияет на него. Таким образом, до начала изучения различных методов статистического анализа следует рассмотреть различные виды данных.
Непрерывные и дискретные данные.
Данные могут быть классифицированы как непрерывные и дискретные. Непрерывные данные могут принимать любые значения на множестве действительных чисел, т.е. они измеряются на непрерывной шкале, а их значения ограничены только степенью точности. Типичным примером является процентная ставка дохода по инвестициям. Она может составлять 12%, 12,3% или вообще 12,0675%. Данные, относящиеся ко времени, расстоянию и скорости, также попадают в эту категорию.
Дискретные данные связаны с процессом счета. Например, число финансовых сделок дискретно, потому что их половины или четверти не имеют рационального смысла. Данные, связанные с ценами активов, могут быть дискретными из-за установленных на индивидуальных рынках правил котировки и минимальных ценовых изменений. Например, в Великобритании государственные облигации котируются в тридцать вторых (1/32) долях фунта. Следовательно, ценовые данные здесь дискретны и изменяются только в тридцать вторых долях или кратных им значениях. Рынки корпоративных облигаций, акций, фьючерсов и опционов служат другими примерами, где правила минимальных ценовых изменений определяют дискретность данных.
Данные кросс-секций и временных рядов.
Кросс-секционные (cross-sectional) данные представляют собой информацию в группе переменных в каждый отдельный момент времени. Например, данные, связанные с ценами акций каждой из входящих в расчет, например, индекса FTSE 100 в конкретный момент времени, являются кросс-секционными. Списки цен акций, процентных ставок или обменных курсов, публикуемые в деловых разделах газет, также представляют собой кросс-секционные данные, потому что относятся к ценам или ставкам нескольких переменных (акций, валют и т. п.) в данный момент времени.
Временные ряды отражают колебания какой-либо переменной на промежутке времени. Например, данные о цене акции, обменном курсе валюты или уровне индекса за каждый день (неделю или месяц) в течение некоторого интервала времени будут ежедневным (еженедельным или ежемесячным) временным рядом. Временной ряд - это последовательность упорядоченных во времени числовых показателей, характеризующих уровень
Всякий временной ряд включает два обязательных элемента: во-первых, время и, во-вторых, конкретное значение показателя, или уровень ряда. Временные ряды различаются по следующим признакам:
1) по времени - моментные и интервальные. Интервальный ряд - последовательность, в которой уровень явления относят к результату, накопленному или вновь произведенному за определенный интервал времени. Таковы, например, ряды показателей объема продукции предприятия по месяцам года, количества отработанных человеко-дней по отдельным периодам (месяцам, кварталам, полугодиям, годам, пятилетиям и т.п.) и т.д. Если же уровень ряда характеризует изучаемое явление в конкретный момент времени, то совокупность уровней образует моментами ряд. Примерами моментных рядов могут быть последовательность показателей численности населения на начало года, поголовье скота в фермерских хозяйствах на 1 сентября и т.д. Важное отличие моментных рядов от интервальных состоит в том, что сумма уровней интервального ряда дает вполне реальный показатель – общий выпуск продукции за год (пятилетие, десятилетие), общие затраты рабочего времени, общин объем продаж акций и т.д., сумма же уровней моментного ряда иногда и подсчитывается, но реального содержания, как правило, не имеет;
по форме представления уровней – ряды абсолютных, относительных и средних величин;
по расстоянию между датами или интервалами времени выделяют полные и неполные временные ряды. Полные ряды имеют место, когда даты регистрации или окончания периодов следуют друг за другом с равными интервалами, неполные - когда принцип равных интервалов не соблюдается;
по содержанию показателей - ряды частных и агрегированных показателей. Частные показатели характеризуют изучаемое явление односторонне, изолированно. Например, среднесуточный объем выпуска промышленной продукции дает возможность оцепить динамику промышленного производства, численность граждан, состоящих на учете в службе занятости; показывает эффективность социальной политики государства; остатки наличных денег у населения и вклады населения в банках отражают платежеспособность населения и т.д. Агрегированные показатели основаны на частных показателях и характеризуют изучаемый процесс комплексно. Так, чтобы иметь представление о состоянии фондового рынка России в целом, необходимо определять агрегированный показатель экономической конъюнктуры, включающий в себя и вышеперечисленные частные показатели. Широкое применение агрегированных показателей стало возможным с развитием факторного и компонентного анализа.
Важнейшим условием правильного формирования временных рядов является сопоставимость уровней, образующих ряд. Уровни ряда, подлежащие изучению, должны быть однородны по экономическому содержанию и учитывать существо изучаемого явления и цель исследования.
Статистические данные, представленные в виде временных рядов, должны быть сопоставимы по территории, кругу охватываемых объектов, единицам измерения, моменту регистрации, методике расчета, ценам, достоверности.
Несопоставимость по территории возникает в результате изменений границ стран, регионов, хозяйств и т.п. Для приведения данных к сравнимому виду производится пересчет прежних данных с учетом новых границ.
Полнота охвата различных частей явления - важнейшее условие сопоставимости уровней ряда.
Познание закономерностей изменения фондовых переменных во времени – сложная и трудоемкая процедура исследования, так как любое изучаемое явление формирует множество факторов, действующих в разных направлениях. По характеру непосредственного воздействия эти факторы могут быть разделены на две группы. К первой группе относятся факторы, определяющие основную тенденцию динамики (рост или снижение уровнен). Вторая группа факторов, вызывающая случайные колебания, отклоняет уровни от тенденции то в одном, то в другом направлении. Например, тенденция динамики объемов продаж ценных бумаг на фондовой бирже связана с укреплением экономики страны, с прогрессом развития информационных каналов связи, с совершенствованием организации и управления производством тех предприятий, чьи ценные бумаги представлены на рынке. Колеблемость динамики вызвана влиянием, например, мирового фондового рынка, неустойчивостью валютного курса и цен на сырье, неожиданными политическими решениями экономических вопросов.
При статистическом изучении динамики необходимо четко разделять два основных ее элемента - тенденцию и колеблемость, чтобы дать каждому из них количественную характеристику с помощью специальных показателей.
Основной тенденцией, или трендом, называется характеристика процесса изменения явления за длительное время, освобожденная от случайных колебаний, создаваемых второй группой факторов. В отличие от тенденции колеблемостью следует называть отклонения уровней отдельных периодов времени от тенденции динамики (тренда).
Сгруппированные и несгруппированные данные.
Только когда обрабатывается небольшое количество исходных данных, они могут быть оставлены в необработанном или несгруппированном виде, при этом знакомящиеся с ними будут в состоянии их усвоить. Понятно, что когда набор данных велик, необходимо изложить его в виде таблицы для лучшего восприятия. Данные в таблице могут разбиваться на группы и объединяться в интервалы. Пример сгруппированных непрерывных данных показан в табл. 1.1.
Таблица 1.1
Представление сгруппированных данных.
-
Месячный доход
Число
наблюдений
Относительная частота
До -8%
0
0
Более -8% и до -7%
2
0,039216
Более-7% и до -6%
1
0,019608
Более -6% и до -5%
5
0,098039
Более -5% и до -4%
2
0,039216
Более -4% и до - 3%
2
0,039216
Более -3% и до -2%
3
0,058824
Более -2% и до -1%
3
0,058824
Более - 1% и до 0%
5
0,098039
Более 0% и до + 1%
3
0,058824
Более + 1%идо + 2%
7
0,137255
Более + 2% и до + 3%
4
0,078431
Более. + 3% и до + 4%.
3
0,058824
Более + 4% и до + 5%
4
0,078431
Более + 5% и до + 6%
1
0,019608
Более + 6% и до + 7%
2
0,039216
Более + 7% и до + 8%
0
0
Более + 8% и до + 9%
0
0
Более + 9% и до + 10
2
0,039216
Более + 10% и до + 11%
0
0
Более + 11%идо+ 12%
2
0,039216
Итого
51
1
При группировке данных необходимо уделить особое внимание интервалам. Во-первых, они не должны перекрываться. Во-вторых, они должны быть одинаковых размеров, если не существует специфической потребности в выделении данных в рамках какой-либо "подгруппы", либо если данные в группе настолько малочисленны, что могут быть безопасно слиты с предыдущей или последующей группой без потери информации. В-третьих, интервалы не должны быть столь большими, чтобы скрывать характерные изменения в рамках группы. И, наконец, число интервалов должно быть компромиссом между необходимостью передачи деталей и возможностью для аналитика охватить эти детали.
