Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Введение в С++. Страуструп..doc
Скачиваний:
63
Добавлен:
02.05.2014
Размер:
3.46 Mб
Скачать

7.5 Большие объекты

При выполнении любой бинарной операции для типа complex реализующей

эту операцию функции будут передаваться как параметры копии обоих

операндов. Дополнительные расходы, вызванные копированием двух

значений типа double, заметны, хотя по всей видимости допустимы.

К сожалению представление не всех классов является столь удобно

компактным. Чтобы избежать избыточного копирования, можно

определять функции с параметрами типа ссылки:

class matrix {

double m[4][4];

public:

matrix();

friend matrix operator+(const matrix&, const matrix&);

friend matrix operator*(const matrix&, const matrix&);

};

Ссылки позволяют без излишнего копирования использовать

выражения с обычными арифметическими операциями и для больших

объектов. Указатели для этой цели использовать нельзя, т.к.

невозможно переопределить интерпретацию операции, если она

применяется к указателю. Операцию плюс для матриц можно определить

так:

matrix operator+(const matrix& arg1, const& arg2)

{

matrix sum;

for (int i = 0; i<4; i++)

for (int j=0; j<4; j++)

sum.m[i] [j] = arg1.m[i][j] + arg2.m[i][j];

return sum;

}

Здесь в функции operator+() операнды выбираются по ссылке, а

возвращается само значение объекта. Более эффективным решением

был бы возврат тоже ссылки:

class matrix {

// ...

friend matrix& operator+(const matrix&, const matrix&);

friend matrix& operator*(const matrix&, const matrix&);

};

Это допустимо, но возникает проблема с выделением памяти. Поскольку

ссылка на результат операции будет передаваться как ссылка на

возвращаемое функцией значение, оно не может быть автоматической

переменной этой функции. Поскольку операция может использоваться

неоднократно в одном выражении, результат не может быть и

локальной статической переменной. Как правило, результат будет

записываться в отведенный в свободной памяти объект. Обычно

бывает дешевле (по затратам на время выполнения и память данных

и команд) копировать результирующее значение, чем размещать его

в свободной памяти и затем в конечном счете освобождать выделенную

память. К тому же этот способ проще запрограммировать.

7.6 Присваивание и инициализация

Рассмотрим простой строковый класс string:

struct string {

char* p;

int size; // размер вектора, на который указывает p

string(int size) { p = new char[size=sz]; }

~string() { delete p; }

};

Строка - это структура данных, содержащая указатель на вектор

символов и размер этого вектора. Вектор создается конструктором и

удаляется деструктором. Но как мы видели в $$5.5.1 здесь могут

возникнуть проблемы:

void f()

{

string s1(10);

string s2(20)

s1 = s2;

}

Здесь будут размещены два символьных вектора, но в результате

присваивания s1 = s2 указатель на один из них будет уничтожен,

и заменится копией второго. По выходе из f() будет вызван для s1

и s2 деструктор, который дважды удалит один и тот же вектор,

результаты чего по всей видимости будут плачевны. Для решения

этой проблемы нужно определить соответствующее присваивание

объектов типа string:

struct string {

char* p;

int size; // размер вектора, на который указывает p

string(int size) { p = new char[size=sz]; }

~string() { delete p; }

string& operator=(const string&);

};

string& string::operator=(const string& a)

{

if (this !=&a) { // опасно, когда s=s

delete p;

p = new char[size=a.size];

strcpy(p,a.p);

}

return *this;

}

При таком определении string предыдущий пример пройдет как

задумано. Но после небольшого изменения в f() проблема возникает

снова, но в ином обличии:

void f()

{

string s1(10);

string s2 = s1; // инициализация, а не присваивание

}

Теперь только один объект типа string строится конструктором

string::string(int), а уничтожаться будет две строки. Дело в

том, что пользовательская операция присваивания не применяется

к неинициализированному объекту. Достаточно взглянуть на функцию

string::operator(), чтобы понять причину этого: указатель p

будет тогда иметь неопределенное, по сути случайное значение.

Как правило, в операции присваивания предполагается, что ее

параметры проинициализированы. Для инициализации типа той, что

приведена в этом примере это не так по определению. Следовательно,

чтобы справиться с инициализацией нужна похожая, но своя функция:

struct string {

char* p;

int size; // размер вектора, на который указывает p

string(int size) { p = new char[size=sz]; }

~string() { delete p; }

string& operator=(const string&);

string(const string&);

};

string::string(const string& a)

{

p=new char[size=sz];

strcpy(p,a.p);

}

Инициализация объекта типа X происходит с помощью конструктора

X(const X&). Мы не перестаем повторять, что присваивание и

инициализация являются разными операциями. Особенно это важно в тех

случаях, когда определен деструктор. Если в классе X есть нетривиальный

деструктор, например, производящий освобождение объекта в свободной

памяти, вероятнее всего, в этом классе потребуется полный набор

функций, чтобы избежать копирования объектов по членам:

class X {

// ...

X(something); // конструктор, создающий объект

X(const X&); // конструктор копирования

operator=(const X&); // присваивание:

// удаление и копирование

~X(); // деструктор, удаляющий объект

};

Есть еще два случая, когда приходится копировать объект:

передача параметра функции и возврат ею значения. При передаче

параметра неинициализированная переменная, т.е. формальный параметр

инициализируется. Семантика этой операции идентична другим видам

инициализации. Тоже происходит и при возврате функцией значения,

хотя этот случай не такой очевидный. В обоих случаях используется

конструктор копирования:

string g(string arg)

{

return arg;

}

main()

{

string s = "asdf";

s = g(s);

}

Очевидно, после вызова g() значение s должно быть "asdf". Не трудно

записать в параметр s копию значения s, для этого надо вызвать

конструктор копирования для string. Для получения еще одной копии

значения s по выходе из g() нужен еще один вызов конструктора

string(const string&). На этот раз инициализируется временная

переменная, которая затем присваивается s. Для оптимизации одну,

но не обе, из подобных операций копирования можно убрать. Естественно,

временные переменные, используемые для таких целей, уничтожаются

надлежащим образом деструктором string::~string() (см. $$R.12.2).

Если в классе X операция присваивания X::operator=(const X&)

и конструктор копирования X::X(const X&) явно не заданы программистом,

недостающие операции будут созданы транслятором. Эти созданные

функции будут копировать по членам для всех членов класса X. Если

члены принимают простые значения, как в случае комплексных чисел,

это, то, что нужно, и созданные функции превратятся в простое и

оптимальное поразрядное копирование. Если для самих членов

определены пользовательские операции копирования, они и будут

вызываться соответствующим образом:

class Record {

string name, address, profession;

// ...

};

void f(Record& r1)

{

Record r2 = r1;

}

Здесь для копирования каждого члена типа string из объекта r1

будет вызываться string::operator=(const string&). В нашем первом

и неполноценном варианте строковый класс имеет член-указатель

и деструктор. Поэтому стандартное копирование по членам для

него почти наверняка неверно. Транслятор может предупреждать

о таких ситуациях.

7.7 Индексация

Операторная функция operator[] задает для объектов классов

интерпретацию индексации. Второй параметр этой функций (индекс) может

иметь произвольный тип. Это позволяет, например, определять

ассоциативные массивы. В качестве примера можно переписать

определение из $$2.3.10, где ассоциативный массив использовался

в небольшой программе, подсчитывающей число вхождений слов в файле.

Там для этого использовалась функция. Мы определим настоящий тип

ассоциативного массива:

class assoc {

struct pair {

char* name;

int val;

};

pair* vec;

int max;

int free;

assoc(const assoc&); // предотвращает копирование

assoc& operator=(const assoc&); // предотвращает копирование

public:

assoc(int);

int& operator[](const char*);

void print_all();

};

В объекте assoc хранится вектор из структур pair размером max.

В переменной free хранится индекс первого свободного элемента

вектора.

Чтобы предотвратить копирование объектов assoc, конструктор

копирования и операция присваивания описаны как частные. Конструктор

выглядит так:

assoc::assoc(int s)

{

max = (s<16) ? 16 : s;

free = 0;

vec = new pair[max];

}

В реализации используется все тот же неэффективный алгоритм поиска,

что и в $$2.3.10. Но теперь, если вектор переполняется, объект

assoc увеличивается:

#include <string.h>

int& assoc::operator[](const char* p)

/*

работает с множеством пар (структур pair):

проводит поиск p, возвращает ссылку на

целое значение из найденной пары,

создает новую пару, если p не найдено

*/

{

register pair* pp;

for (pp=&vec[free-1]; vec<=pp; pp-- )

if (strcmp(p,pp->name) == 0) return pp->val;

if (free == max) { //переполнение: вектор увеличивается

pair* nvec = new pair[max*2];

for (int i=0; i<max; i++) nvec[i] = vec[i];

delete vec;

vec = nvec;

max = 2*max;

}

pp = &vec[free++];

pp->name = new char[strlen(p)+1];

strcpy(pp->name,p);

pp->val = 0; // начальное значение = 0

return pp->val;

}

Поскольку представление объекта assoc скрыто от пользователя, нужно

иметь возможность напечатать его каким-то образом. В следующем разделе

будет показано как определить настоящий итератор для такого объекта.

Здесь же мы ограничимся простой функцией печати:

void assoc::print_all()

{

for (int i = 0; i<free; i++)

cout << vec[i].name << ": " << vec[i].val << '\n';

}

Наконец, можно написать тривиальную программу:

main() // подсчет числа вхождений во входной

// поток каждого слова

{

const MAX = 256; // больше длины самого длинного слова

char buf[MAX];

assoc vec(512);

while (cin>>buf) vec[buf]++;

vec.print_all();

}

Опытные программисты могут заметить, что второй комментарий можно

легко опровергнуть. Решить возникающую здесь проблему предлагается

в упражнении $$7.14 [20]. Дальнейшее развитие понятие ассоциативного

массива получит в $$8.8.

Функция operator[]() должна быть членом класса. Отсюда следует,

что эквивалентность x[y] == y[x] может не выполняться, если

x объект класса. Обычные отношения эквивалентности, справедливые

для операций со встроенными типами, могут не выполняться для

пользовательских типов ($$7.2.2, см. также $$7.9).

7.8 Вызов функции

Вызов функции, т.е. конструкцию выражение(список-выражений), можно

рассматривать как бинарную операцию, в которой выражение является

левым операндом, а список-выражений - правым. Операцию вызова

можно перегружать как и другие операции. В функции operator()()

список фактических параметров вычисляется и проверяется по типам

согласно обычным правилам передачи параметров. Перегрузка операции

вызова имеет смысл прежде всего для типов, с которыми возможна

только одна операция, а также для тех типов, одна из операций над

которыми имеет настолько важное значение, что все остальные в

большинстве случаев можно не учитывать.

Мы не дали определения итератора для ассоциативного массива

типа assoc. Для этой цели можно определить специальный класс

assoc_iterator, задача которого выдавать элементы из assoc в некотором

порядке. В итераторе необходимо иметь доступ к данным, хранимым

в assoc, поэтому он должен быть описан как friend:

class assoc {

friend class assoc_iterator;

pair* vec;

int max;

int free;

public:

assoc(int);

int& operator[](const char*);

};

Итератор можно определить так:

class assoc_iterator {

const assoc* cs; // массив assoc

int i; // текущий индекс

public:

assoc_iterator(const assoc& s) { cs = &s; i = 0; }

pair* operator()()

{ return (i<cs->free)? &cs->vec[i++] : 0; }

};

Массив assoc объекта assoc_iterator нужно инициализировать, и при каждом

обращении к нему с помощью операторной функции () будет возвращаться

указатель на новую пару (структура pair) из этого массива. При достижении

конца массива возвращается 0:

main() // подсчет числа вхождений во входной

// поток каждого слова

{

const MAX = 256; // больше длины самого длинного слова

char buf[MAX];

assoc vec(512);

while (cin>>buf) vec[buf]++;

assoc_iterator next(vec);

pair* p;

while ( p = next(vec) )

cout << p->name << ": " << p->val << '\n';

}

Итератор подобного вида имеет преимущество перед набором

функций, решающим ту же задачу: итератор может иметь собственные

частные данные, в которых можно хранить информацию о ходе итерации.

Обычно важно и то, что можно одновременно запустить сразу несколько

итераторов одного типа.

Конечно, использование объектов для представления итераторов

непосредственно никак не связано с перегрузкой операций. Одни

предпочитают использовать тип итератора с такими операциями, как

first(), next() и last(), другим больше нравится перегрузка операции

++ , которая позволяет получить итератор, используемый как указатель

(см. $$8.8). Кроме того, операторная функция operator() активно

используется для выделения подстрок и индексации многомерных массивов.

Функция operator() должна быть функцией-членом.

7.9 Косвенное обращение

Операцию косвенного обращения к члену -> можно определить как унарную

постфиксную операцию. Это значит, если есть класс

class Ptr {

// ...

X* operator->();

};

объекты класса Ptr могут использоваться для доступа к членам класса

X также, как для этой цели используются указатели:

void f(Ptr p)

{

p->m = 7; // (p.operator->())->m = 7

}

Превращение объекта p в указатель p.operator->() никак не зависит от

члена m, на который он указывает. Именно по этой причине operator->()

является унарной постфиксной операцией. Однако, мы не вводим новых

синтаксических обозначений, так что имя члена по-прежнему должно

идти после -> :

void g(Ptr p)

{

X* q1 = p->; // синтаксическая ошибка

X* q2 = p.operator->(); // нормально

}

Перегрузка операции -> прежде всего используется для создания

"хитрых указателей", т.е. объектов, которые помимо использования как

указатели позволяют проводить некоторые операции при каждом обращении

к указуемому объекту с их помощью. Например, можно определить класс

RecPtr для организации доступа к объектам класса Rec, хранимым на

диске. Параметром конструктора RecPtr является имя, которое будет

использоваться для поиска объекта на диске. При обращении к объекту

с помощью функции RecPtr::operator->() он переписывается в основную

память, а в конце работы деструктор RecPtr записывает измененный

объект обратно на диск.

class RecPtr {

Rec* in_core_address;

const char* identifier;

// ...

public:

RecPtr(const char* p)

: identifier(p) { in_core_address = 0; }

~RecPtr()

{ write_to_disc(in_core_address,identifier); }

Rec* operator->();

};

Rec* RecPtr::operator->()

{

if (in_core_address == 0)

in_core_address = read_from_disc(identifier);

return in_core_address;

}

Использовать это можно так:

main(int argc, const char* argv)

{

for (int i = argc; i; i--) {

RecPtr p(argv[i]);

p->update();

}

}

На самом деле, тип RecPtr должен определяться как шаблон типа

(см. $$8), а тип структуры Record будет его параметром. Кроме

того, настоящая программа будет содержать обработку ошибок и

взаимодействие с диском будет организовано не столь примитивно.

Для обычных указателей операция -> эквивалентна операциям,

использующим * и []. Так, если описано

Y* p;

то выполняется соотношение

p->m == (*p).m == p[0].m

Как всегда, для определенных пользователем операций такие соотношения

не гарантируются. Там, где все-таки такая эквивалентность требуется,

ее можно обеспечить:

class X {

Y* p;

public:

Y* operator->() { return p; }

Y& operator*() { return *p; }

Y& operator[](int i) { return p[i]; }

};

Если в вашем классе определено более одной подобной операции,

разумно будет обеспечить эквивалентность, точно так же, как разумно

предусмотреть для простой переменной x некоторого класса, в котором

есть операции ++, += = и +, чтобы операции ++x и x+=1 были

эквивалентны x=x+1.

Перегрузка -> как и перегрузка [] может играть важную роль для

целого класса настоящих программ, а не является просто экспериментом

ради любопытства. Дело в том, что в программировании понятие

косвенности является ключевым, а перегрузка -> дает ясный, прямой

и эффективный способ представления этого понятия в программе.

Есть другая точка зрения на операцию ->, как на средство задать

в С++ ограниченный, но полезный вариант понятия делегирования

(см. $$12.2.8 и 13.9).

7.10 Инкремент и декремент

Если мы додумались до "хитрых указателей", то логично попробовать

переопределить операции инкремента ++ и декремента -- , чтобы

получить для классов те возможности, которые эти операции дают для

встроенных типов. Такая задача особенно естественна и необходима, если

ставится цель заменить тип обычных указателей на тип "хитрых указателей",

для которого семантика остается прежней, но появляются некоторые

действия динамического контроля. Пусть есть программа с распространенной

ошибкой:

void f1(T a) // традиционное использование

{

T v[200];

T* p = &v[10];

p--;

*p = a; // Приехали: `p' настроен вне массива,

// и это не обнаружено

++p;

*p = a; // нормально

}

Естественно желание заменить указатель p на объект класса

CheckedPtrToT, по которому косвенное обращение возможно только

при условии, что он действительно указывает на объект. Применять

инкремент и декремент к такому указателю будет можно только в том

случае, что указатель настроен на объект в границах массива и

в результате этих операций получится объект в границах того же

массива:

class CheckedPtrToT {

// ...

};