Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Программирование на C / C++ / C++ for real programmers.pdf
Скачиваний:
262
Добавлен:
02.05.2014
Размер:
2.04 Mб
Скачать

Коллекции,

8

 

курсоры и

 

итераторы

 

Проблема проектирования и реализации классов-коллекций (совокупностей объектов, находящихся под управлением другого объекта) стара, как само объектно-ориентированное программирование. Нет смысла повторять здесь все, что можно прочитать в других книгах о всевозможных коллекциях — изменяемых, сериализуемых, индексируемых и т. д. Если вам нужна информация о структурах данных и сопутствующих трансформациях, начните с изучения классов-коллекций SmallTalk и затем переходите к коммерческим библиотекам классов C++, рекламой которых забиты все журналы по программному обеспечению. Я же собираюсь сосредоточить ваше внимание на тех С++-измах, благодаря которым коллекции укладываются в мистическое учение программирования на C++ независимо от используемых структур данных и иерархий классов.

В начале этой главы рассматриваются индексируемые коллекции — то есть те, в которых некоторый объект используется в качестве индекса для получения другого объекта, скрытого глубоко в недрах коллекции. Мы воспользуемся оператором [], чтобы коллекция выглядела как абстрактный массив. Дело даже не в том, что программа от этого обычно становится более понятной — в этом подходе задействованы многие идиомы, используемые для коллекций. После знакомства с курсорами и их собратьями итераторами мы перейдем к изощренным коллекциям, модифицируемым в процессе перебора.

Массивы и оператор []

Оператор [] чрезвычайно гибок и универсален. К сожалению, большинство программистов C++ об этом и не подозревает.

Проверка границ и присваивание

Ниже приведен простой пример перегрузки оператора [] — массив, который при обращении к элементу проверяет, принадлежит ли индекс границам массива, и в любых ситуациях ведет себя более или менее разумно (или по крайней мере безопасно).

class ArrayOfFoo {

 

private:

 

int entries;

 

Foo** contents;

// Вектор Foo*

static Foo* dummy;

// Для индексов, выходящих за границы массива

public:

ArrayOfFoo() : entries(0), contents(NULL) {};

ArrayOfFoo(int size) : entries(size), contents(new Foo*[size]) {}; ~ArrayOfFoo() { delete contents; }

Foo*& operator[](int index)

112

{

return (index < 0 || index >= entries) ? dummy : contents[index];

}

};

// Где-то в файле .cpp

Foo* ArrayOfFoo::dummy = NULL;

Оператор [] возвращает Foo*&, ссылку на адрес Foo. Эта идиома часто встречается при работе с коллекциями, и одна из причин — в том, что возвращаемое значение может использоваться как в левой, так и в правой части выражения присваивания.

Foo* foo = array[17];

array[29] = foo; // Работает — можно присваивать по конкретному индексу

Если бы оператор [] возвращал просто Foo*, то содержимое элемента массива копировалось бы, а копия возвращалась вызывающей стороне. Возвращая Foo*&, мы позволяем вызывающей стороне изменить содержимое элемента, а не только прочитать хранящееся в нем значение. Для индекса, выходящего за границы массива, возвращается адрес фиксированной переменной класса, значение которой на самом деле нас не очень интересует. По крайней мере, ваша программа сможет хромать дальше (возможно, при правильно расставленных #ifdef в отладочном режиме), а не извлекать из памяти номер телефона вашей тетушки или другую случайную информацию.

Если вы обеспокоены накладными расходами такого варианта по сравнению с обычными массивами C/C++, заключите все дополнительные вычисления и переменные между директивами #ifdef. В одном варианте компиляции ваш массив будет абсолютно безопасным, а в другом будет иметь те же размер и быстродействие, что и обычный массив.

Оператор [] с нецелыми аргументами

Оператор [] перегружается для аргументов любого типа, а не только для целых. Тогда оператор [] можно использовать для представления словаря — коллекции, в которой один ключевой объект однозначно идентифицирует другой. Ниже приведен набросок ассоциативного класса, в котором хранятся пары строковых объектов String, при этом первая строка каждой пары является индексом второй.

class Association {

//Пропускаем подробности реализации public:

const String& operator[](const String& key);

};

//В клиентской программе

String str = assotiation[another_string];

Такой вариант выглядит намного элегантнее и лучше выражает намерения разработчика, нежели интерфейс, построенный только на функциях класса:

String str = assotiation.LookUp(another_string);

Имитация многомерных массивов

В любом варианте перегрузки оператор [] вызывается с одним аргументом произвольного типа. Например, компилятор лишь посмеется над следующей попыткой создания многомерного массива, потому что в ней оператор [] имеет несколько аргументов:

class WontWork { public:

Foo& operator[](int x, int y); // Ха-ха-ха

113

};

Компиляторы обожают подобные ситуации — вроде бы все выглядит вполне логично, но как-то выпало из спецификации языка. Это дает им возможность поразмяться и вывалить все туманные сообщения об ошибках, которые они приберегли на черный день. Но когда сообщения перестанут сыпаться, наступает ваш черед смеяться, поскольку существует простой обходной путь.

struct Index { int x;

int y;

Index(int ex, int why) : x(ex), y(why) {}

bool operator==(const Index& i) { return x == i.x && y == i.y; }

};

class WorksFine { public:

Foo& operator[](Index i);

};

array[Index(17, 29)].MemberOfFoo();

// Работает

Index представляет собой структуру с тривиальным конструктором. Причина перегрузки оператора == станет ясна позже. Выражение Index(17,29) создает анонимный экземпляр, который упаковывает два измерения массива в один аргумент. Правда здорово? Получай, компилятор!

Множественные перегрузки оператора []

Оператор [] может иметь и несколько вариантов перегрузки для данного класса при условии, что сигнатуры остаются уникальными. Например, одна версия может получать аргумент типа int, а другая

— аргумент char*, который преобразуется к int функцией atoi(). Скорее всего, ваша коллекция может индексироваться несколькими способами.

class StringArray { public:

const String& operator[](int index); int operator[](const String&);

};

 

String str = array[17];

// Первая форма

int index = array[String(“Hello”)];

// Вторая форма

Первый оператор [] реализует семантику массива: по целому индексу возвращается значение элемента с этим индексом. Второй оператор обеспечивает обратную возможность: по значению находится соответствующий индекс массива. В этой схеме используется пара допущений (например, уникальное целое, которое возвращается в качестве индекса несуществующего значения), но в целом идея вполне понятна.

Виртуальный оператор []

Оператор [], как и любой другой оператор или функцию, можно объявить виртуальным и переопределить в производных классах. В некотором базовом классе определяется абстрактный интерфейс, а все подробности реализации предоставляются в производных классах. Такая схема хорошо сочетается с гомоморфными иерархиями классов, описанными в части 3.