- •Глава 17
- •Указатель к главе 17
- •17А. Плавные компоненты и неровности квадратных корней (ячейки одинаковых размеров)
- •17Б. Подсчеты базисных подсчетов
- •17В. Аппроксимация сглаженных корней
- •Вычисления при подгонке прямой линии для графика илл. 14 (первая подгонка)
- •17Г. Зерновые точильщики, цены на пшеницу и модельный эксперимент стьюдента
- •Пробная аппроксимация данных о зерновых точильщиках (плавная компонента из илл. 7, точка максимума, равная 1,3, — из текста)
- •Остатки: вверху — только они, внизу — с плавной компонентой (по результатам илл. 18)
- •17Д. Ячейки неравных размеров
- •17Е. Двойные корни
- •Данные Резерфорда и Гейгера о радиоактивном распаде полония (события — сцинтилляции, вызываемые а-частицами)
- •17Ж. Предостерегающие примеры
- •Снова длина предплечья
- •Иллюстрация 29 главы 17: длина предплечья Вычисления для величин, обратных корням подсчетов
- •Уточнение положения максимума (дополнительный материал)
- •Иллюстрация 30 главы 17: длина предплечья и сцинтилляции полония Остатки для двух различных аппроксимаций (по данным илл. 29 и 31)
- •Анализ желательных точек максимума по данным илл. 31 и график получающихся остатков
- •Обзорные вопросы
- •17И. Чего мы достигли?
- •Глава 18
- •18А. Размеры и подсчеты
- •Остатки после аппроксимации данных, сгруппированных по ячейкам в виде октав, для трех примеров илл. 1
- •18Б. Анализ произведений-отношений
- •График корней из произведения в зависимости от логарифма отношения (по данным илл. 3)
- •18В. Выделение необычного, требующего внимания
- •Иллюстрация 9 главы 18: упражнения Несколько упражнений на использование графиков произведений-отношений
- •18Г. Сравнение различных совокупностей данных
- •Три множества данных, согласованные в точке базисного подсчета, равного 6 (а—ь— 6)
- •18Д. Особенности наименьшего базисного подсчета
- •Начальная часть графиков илл. 10 — точки, соответствующие альтернативным п-рантам для единичного базисного подсчета
- •18Е. Нулевые базисные подсчеты
- •Некоторые данные, в которых сдвиг подсчетов позволяет улучшить графики произведений-отношений:
- •Четыре множества подсчетов, сдвинутые на 4 и согласованные при базисном подсчете, равном 3
- •Обзорные вопросы
- •Остатки для корней из произведений (при сдвиге на 4 и согласовании при а—ь— 3) после вычитания общей аппроксимирующей прямой (формулу см. В тексте)
- •18И. Чего мы достигли?
Остатки после аппроксимации данных, сгруппированных по ячейкам в виде октав, для трех примеров илл. 1
По-видимому, мы должны искать такой алгоритм анализа, который О оперирует с комбинациями таких пар;
<> обеспечивает симметричную их обработку;
0^ использует квадратный корень из наибольшего числа появлений (корень из наибольшего базисного подсчета) как одно крайнее значение и квадратный корень из общего числа наблюдаемых объектов (корень из наибольшего ранга) как другое крайнее значение,
ОБЗОРНЫЕ ВОПРОСЫ
Почему необходим особый способ графического изображения и анализа распределений с длинными хвостами? С какого примера мы начали? Что показали остатки? Что показали наибольшие значения базисных подсчетов? Как наиболее эффективно представить информацию, содержащуюся в этих наибольших значениях? Какие две величины, в некотором отношении симметричные друг другу, соответствуют каждому базисному подсчету? Что такое п-ранг?
18Б. Анализ произведений-отношений
Как можно объединять х и у с целью их симметричной обработки? Один из простейших способов —- образовать величины х-\-у и х—у, однако в данном случае он не кажется многообещающим. Другой способ, применимый, когда и х и у отличны от нуля,— это образовать величины ху и х!у. Если х и у всегда положительны (как в нашей задаче), лучше вместо х/у использовать log (х/у). Это уже более обещающее начало. Наконец, при х=1, как уже говорилось, целесообразно использовать |f у, апри у— 1 — величину ]/ х. Поэтому вместо ху нам более подходит Уху, Гаким образом, в окончательной форме наш анализ заключается в исследовании поведения величины
|/(базисный подсчет) • (полный ранг сверху) как функции от
log (базисный подсчет/полный ранг),
т. е. корня от ПРОИЗВЕДЕНИЯ как функции от логарифма ОТНОШЕНИЯ- По-видимому, эта зависимость — как раз то, что нам нужно, особенно если вспомнить, какое значение Зипф придавал ПРОИЗВЕДЕНИЮ. (Конечно, мы далеко не так оптимистичны, как он. Мы надеемся, что зависимость произведения от отношения будет достаточно простой, но вряд ли произведение окажется константой.)
На илл. 3 демонстрируются все этапы анализа произведений- отношений на примере с не очень большим количеством данных. Иллюстрация содержит и детальные вычисления, помещенные в первых четырех столбцах, и расчеты, основанные на двух полуоктавных
Иллюстрация 3 главы 18: научная активность в эконометрике
Число авторов, имеющих различное число публикаций за период с 1933 по 1952 г.
(Публикацией считается выступление на заседании Общества эконометрики или статья на страницах журнала «Эконометрика»)
А) ВЫЧИСЛЕНИЯ (детальные и по полуоктавам)
х> Полуоктавные последовательности ПРОИЗВЕДЕНИЙ и ОТНОШЕНИЙ объединяются друг с другом.
2> Примеры: 6,8= }Г46Л; 8,6= УЗЙ2 и т. д. до 26,9= УГ-72Т.
3) Примеры: l,66=lg46/l; 1,27= lg37/2 и т. д. до —2,86=lgl/721.
Б) УПРАЖНЕНИЯ
За) Проведите прямую линию через точки (1,66; 6,8) и (—2,86; 26,9) и, используя ее, найдите аппроксимацию для корней. Вычислите остатки и начертите их график. Прокомментируйте результаты.
36) Интерполируйте значения для базисного подсчета, равного 1п, и п-ранга, равного 1п, и сгладьте полученные последовательности базисных подсчетов и п-рангов. Сравните их с исходными и прокомментируйте результаты.
В) ИСТОЧНИК: Leavens D, Ht (Communication), Econometrica, 21, 630—632, 1953,
подмножествах данных (согласно методу, описанному ниже), Отметим, что в столбце с названием «Корень из произведения» помещены квадратные корни произведений данного базисного подсчета на число наблюдаемых объектов (здесь — авторов), имеющих базисные подсчеты, большие или равные данного (п-ранг). Этот столбец начинается с V46, где 46 — наибольший базисный подсчет, и кончается ]/"721, где 721 — общее число авторов (в соответствии с описанным выше алгоритмом).
ВЫЧИСЛЕНИЯ НА ПОЛУОКТАВАХ
Зачастую достаточно брать только те пары (базисный подсчет, п-ранг), для которых базисный подсчет или п-ранг равен (или близок) полуоктавным значениям (т. е. 1, 1 п, 2, 3, 4, 6, 8, 11, 16, 22, ...), начиная выбор одновременно с двух сторон: о минимальных значений базисных подсчетов и минимальных п-рангов — и останавливаясь на месте их пересечения, в котором базисный подсчет приблизительно равен п-рангу, Практически это означает, что можно делать вычисления только в тех строках илл. 3, которые соответствуют двум множествам полуоктавных значений, экономя на вычислениях в семи строках илл. 3 (и в значительно большем числе строк в случае примера о большим объемом данных).
ГРАФИЧЕСКОЕ ИЗОБРАЖЕНИЕ
На илл. 4 приведен график зависимости корней из ПРОИЗВЕДЕНИЙ от логарифмов ОТНОШЕНИЙ. Совершенно очевиден прямолинейный характер этой зависимости. Положение двух крайних точек, соответствующих общему числу авторов 721 и максимальному «вкладу» одного автора, равному 46, по существу, полностью определяет всю зависимость. (Видно, что в данном случае зависимость весьма проста, но далеко не постоянна.)
Несколько упражнений помещено на илл. 5.
ОБЗОРНЫЕ ВОПРОСЫ
Как мы комбинируем базисные подсчеты и п-ранги? Почему мы выбрали именно такой способ их объединения? Что такое анализ произведений-отношений? Должны ли мы принимать во внимание каждый из базисных подсчетов? Как можно использовать полуоктав- ные «ступени»? Насколько строго они должны соблюдаться? Какой пример мы рассматривали? Как выглядел график произведения- отношения?