Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
IMG.docx
Скачиваний:
6
Добавлен:
04.02.2016
Размер:
554.56 Кб
Скачать

Глава 17

ГРУППИРОВАНИЕ ПОДСЧЕТОВ ПО ЯЧЕЙКАМ

Указатель к главе 17

"•«и * 3

Раздел, к изучению которого мы приступаем, посвящен распреде­лениям величин. В этой главе рассматривается один из наиболее об­щих подходов, когда распределение величины исследуется на основе подсчетов ее попадания в заданную систему «клеток», или «ячеек». Последовательности таких подсчетов образует, например, число се­мей с 0, 1, 2, 3 и т. д. детьми или число баскетболистов Национальной баскетбольной ассоциации, рост которых заключен в пределах каж­дого из последовательных дюймов.

Мы начнем с обычного анализа исходных данных и при этом сразу же убедимся, что уже знакомые нам приемы (например, вычисление квадратных корней из подсчетов, усовершенствованная техника сгла­живания, описанная в предыдущей главе, и т. д.) окажутся весьма полезными.

Получив достаточно гладкую плавную компоненту и тщательно рассмотрев неровности, мы будем далее стараться аппроксимировать ее простой функциональной зависимостью. В данной главе, как и во всей книге, мы ограничиваемся (за несколькими исключениями) за­висимостями, графики которых симметричны относительно максиму­ма. В большинстве случаев этого оказывается вполне достаточно.

ОБЗОРНЫЕ ВОПРОСЫ

Какой новый раздел мы начинаем? В чем состоит общий подход к проблеме, рассматриваемый в настоящей главе? Что нужно сделать в первую очередь? Насколько полезны при этом предыдущие главы? Что мы будем делать затем? При каких ограничениях?

17А. Плавные компоненты и неровности квадратных корней (ячейки одинаковых размеров)

Теперь мы можем перейти к обработке последовательностей под­счетов. Как возникают такие последовательности? Обычно благодаря тому, что возможные значения наблюдаемой величины (например, рост баскетболистов, число вспышек света в единицу времени, число книг в доме) естественным образом подразделяются на интервалы (часто называемые «клетками», или «ячейками») и регистрация сво­дится к записи числа событий, попавших в каждую из ячеек. (Мы бу­дем использовать слово «ячейка», а не «клетка», поскольку у него меньше альтернативных значений.)

Часто принимается, что все ячейки имеют одинаковые размеры. Конечно, это именно так, например, при разбиении баскетболистов по дюймам роста. Равновеликие ячейки — простейшая ситуация, с ко­торой естественно начать, и с нею мы будем иметь дело в настоящем разделе.

Иллюстрация 1 главы 17: длина предплечья

Сглаженные корни и их неровности для данных Пирсона и Ли относительно длин предплечья для 1050 мужчин

(Общее число) (1050)

1) «Сумма» есть окончательная плавная к0МП?“нЛ^гТ'(<™2аГ СТ°ЛбЦ°В

ЗПРРГ «Окончательные неровности»=«корень» МИ,;УС «сумма .

этими соседними ячейками.

Б) БУКВЕННЫЕ ЗНАЧЕНИЯ для НЕРОВНОСТЕЙ (с учетом нулевых строк в начале и в конце)

&

В) УПРАЖНЕНИЯ

»ШЯпГе;;р«=То»уя 3”,

"•«и *

Иллюстрация 1 (продолжение)

1в) Проверьте первый столбец ЗПРРГ в таблице п. А.

1г) Проверьте второй столбец ЗПРРГ в таблице п. А,

1д) Составьте модифицированную буквенно-числовую диаграмму (см. разд. к). Прокомментируйте результаты.

П ИСТОЧНИК- Pearson К., Lie A. On the laws of inheritance in man. 1 Inheritance of physical characters. BMTA 2, 357-462, 1903 (таблица в тексте на с. 367).

Общий принцип остается прежним: имея дело с ПОДСЧЕТАМИ, мы всегда НАЧИНАЕМ с их преобразо­вания — по меньшей мере с вычисления их квадратных КОРНЕИ. R нашем первом примере подсчеты основаны на измерениях.

ДЛИНА ПРЕДПЛЕЧЬЯ

На илл. 1 представлены результаты обработки данных Пирсона и Ли, полученных на основе измерений длины предплечья у 1050 муж­чин. Процедура сглаживания стандартная (см. гл. 7 и 16). Мы доба­вили по две строки нулей выше и ниже строк с ненулевым подсчетом, поскольку, конечно, могут существовать люди с предплечьями длин­нее или короче измеренных в данном эксперименте.

Результаты графически изображены на илл. 2 (плавная компонен­та) и 3 (неровности). Обратите внимание на гладкость и симметричность кривой илл. 2, а также на способ, которым указаны на илл. 3 буквен­ные значения неровностей: барьеры, восьмые доли, сгибы и медиана.

Иллюстрация 2 главы 17: длина предплечья

Плавная компонента: результаты сглаживания корней от подсчетов В полудюймовых ячейках для данных Пирсона и Ли (на основе вычислений илл. 1)


Ближайшие к неровностям горизонтальные метки соответствуют зна­чениям, приведенным на илл. 1, Б, а более удаленные - эталонным буквенным значениям, с которыми мы будем сравнивать буквенные значения каждого множества неровностей квадратных корней,

И /[люстрация 3 главы 17: длина предплечья

Неровности (в стандартной форме изображения) для плавной компоненты илл, 2 (с учетом нулевых строк в начале и в конце)

а именно:

М=0,

С=±0,34,

В=±0,58, б=±1,36.

По опыту мы знаем, что точки неровностей должны быть сосредо­точены в пределах этих стандартных отклонений, однако слишком компактное расположение неровностей (их малый разброс) в данном примере заставляет подозревать, что пример специально подооран с целью иллюстрации полного соответствия с некоторой функциональ­ной зависимостью.

СИММЕТРИЯ

Ясно, что гораздо легче описать структуру подсчетов, когда она симметрична. Если симметрии можно добиться каким-либо простым преобразованием данных, то несомненно имеет смысл его применить. При обработке результатов измерений в большинстве случаев при­ходится использовать преобразования данных. Типичный пример представляют измерения концентрации химических веществ в горных породах, в воде, зерне, крови или тканях животных (если эти кон­центрации не слишком велики или не слишком малы), при таких данных исследователь должен, почти не задумываясь, брать лога­рифмы.

Иллюстрация 4 главы 17: пробы золота

“тжта'дакггавдаг

А) ДАННЫЕ* КОРНИ, ПЛАВНЫЕ КОМПОНЕНТЫ . НЕРОВНОСТИ

  1. Мы не можем Д^а^ ™ ^е°5а",^^х дравши Й“^мьку неизвестно, центрации (в то время как выше на!иоольши 5 действительности имело

?„“отА»» »"г 5'»“ “=»»«« Данные сгР1„„»ров.» по инт.р.<»а„ «о.-

  1. !ЯьТоГ.Г,^5',.=

", БУКВЕННЫЕ ЗНАЧЕНИЯ МНОЖЕСТВА ОКОНЧАТЕЛЬНЫХ НЕРОВ­НОСТЕЙ

#8

М4п

С2П

Bln

-1,3

XXX

1.1

ххк

.6

1.0П

-.4

-.6

.2

.4п

В) УПРАЖНЕНИЯ MIngth, local distribution of Rib».

0 1 2-3 4-7 8-15 16-31 32-63 64-127 128-255 =- 256

, .от A X » 16

Участки 4 о

Проанализируйте данные по описанной выше методике.

Г) ИСТОЧНИК: Koch G. S., Jr., Link R. F. Statistical Analysis ot Geological . T.i.„ ллШрк,, г,^а Слпс Mpw Ynrk. 1970 (табл. 6.5 на с. 216),

„ 551

Группирование подсчетов по ячейкам

КОНЦЕНТРАЦИЯ ЗОЛОТА На илл. 4 анализируются резулы^S^SSS

гГрсрМ? лшш- коииентра'

ВЫРЙГ„"ллВ

ветственно. Мы мало что м ает своего максимума. Что ка-

кривой, поскольку она даже _ ^ достаточно нерегулярными и

сается неровностей, то 1) они выгл д Д ьк0 наскоЛько можно 2) их буквенные значения■ разнесе сравненйю со стандартными

«« “ “ 3 В °бЩ6М °НИ ВЫГЛЯ'

дят более или менее естественно.

ОБЗОРНЫЕ ВОПРОСЫ

Как возникают последователы1° ^нщш ^пр^ГоТработке^од*

ребляем термин «ячейка»? Каков общ Р^ ^ ^ анализир0вали? счетов? С какого примера нащ стаНдартный способ оценки

Что получили в результате. Ка й подсчетов? Как мы исполь-

разброса неровностей сгла «вСМСБб? В чем польза симметрии

зуем эталонные знатен Каконы наши рекомендации при обработке

плавной компоненты? Каковы * и, к чему относился наш

его анзлиз? Чта

получили в результате?

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]