Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
компьютерное представление молекул_26.03.13.docx
Скачиваний:
0
Добавлен:
01.05.2025
Размер:
6.01 Mб
Скачать

Алгоритм кодирования в wln

После того как записана структурная формула, вычленяем функциональные группы и записываем графическую формулу. Затем выбираем направление записи по правилу «старшинства» (группы располагаем по старшинству и алфавиту - бóльшая цифра и обратный алфавит). Для молекулы гидроксиацетилхлорида запись в формате WLN получилась следующая:

А для 1-бром-2-хлорпропанола:

Разветвления в цепи обозначают “&” или “/” .

Знаки X и К имеют по 2 & (/).

Знаки Y и N имеют по 1 & (/).

После терминальной группы & не ставится.

Когда в молекуле имеется несколько разветвлений с разными центрами, их указывают в обратном порядке, возвращаясь по направлению записи к началу молекулы, после того как обозначена основная цепь.

Примеры алгоритма кодирования в WLN.

Алгоритм декодирования в wln

Записываем код соединения, вычленяем функциональные структурные фрагменты и преобразуем их в химическую формулу:

Запись заместителей в бензольном кольце осуществляется следующим образом: первый заместитель помечают как позицию а, затем по алфавиту:

Запись ведут соответствующей заглавной буквой через пробел.

QR C1 ZR CVQ WNR CV1 DQ

Запись карбоциклов имеет свои особенности: буквой L обозначают начало цикла, числом отмечают размер цикла, конец цикла - J .

Если цикл полностью гидрированный – добавляют букву T .

Если цикл гидрирован частично и в случае если только один атом углерода насыщен, то его обозначают символов Н.

Если в цикле более одного насыщенного атома, отмечают положение двойных связей и добавляют букву T

Гетероциклы записываются с буквы T (начало цикла), числом отмечают размер цикла, обозначаются гетероатомы и их положение, конец цикла - J

T5N СNJ A2Q B1 ENW

T5O BV EHJ

T5M CN BUTJ B1NR&1R

T5S CNJ BMNUY1&1 DVZ

T5NYMV EHJ A1 BUM E1R

I1Y1&MVR CV1MR DG& DN1&1

Z1YVQM1VMY1VQ1VQ

Бициклические соединения записывают начиная с буквы L или T, в зависимости от того входит в состав конденсированного соединения гетероцикл или нет, следующие две цифры обозначают размер сочлененных циклов и окончания цикла J, положения замещения начинают нумеровать с атома сочленения так, чтобы заместители имели наименьшую букву.

L66J BMR & DSWQ IN1&1

T56 BN T&J BV1 HNW

При записи в линейном виде полициклических соединений выбирают первые два конденсированных цикла (например 65), нумеруют буквами по кругу, третий цикл записывают с буквой соединения.

L C665 T&&J

L B665 T&&J

L665 HH &T&J

T C565 BN DS HN LOJ

L I5 G6 D6 B665J

Representation of Organic Structure Description Arranged Linearly (rosdal)

Данная кодировка была создана в 1985 году в Beilstein Institute. Применяется для названий соединений в программе ISISDraw и в базе данных Beilstein.

Правила rosdal.

  1. Вся структура нумеруется;

  2. Символы атомов пишутся сразу после номера (символ углерода С не пишется);

  3. Водороды не обозначается или нумеруются наравне со всеми атомами;

  4. Одинарные связи обозначаются , двойные =, тройные #,

другие ?;

  1. Разветвления перечисляются через запятые.

Рассмотрим алгоритм кодирования в формате ROSDAL на примере молекулы фенилаланина.

После того как структура пронумерована начинаем запись кода молекулы, с учетом кратности связи. Сначала записываем бензольное кольцо, начиная с углерода под номером 1, затем через запятую все оставшиеся звенья молекулы.: 1=2-3=4-5=6-1,5-7-8-9=12O,8-10N,9-11O.

1N-2-4-5N=6-7S-8=4, 2=3O, 6-8N-10N=11-12, 11-13.