
- •Оглавление
- •Введение
- •Представление информации в компьютере, единицы измерения информации
- •Информационно-поисковые языки
- •Представление молекул в компьютерном виде
- •Линейные нотации
- •Линейная нотация Висвессера - Wiswesser Line Notation (wln)
- •Правила wln
- •Алгоритм кодирования в wln
- •Алгоритм декодирования в wln
- •Representation of Organic Structure Description Arranged Linearly (rosdal)
- •Правила rosdal.
- •Smiles (Simplified Molecular Input Line Entry System)
- •Правила smiles.
- •Sln Sybyl Line Notation
- •Правила sln.
- •Табличные представления
- •Xyz координаты
- •1. Nsc7594 acetaldehyde
- •Xyz координаты
- •1. Nsc7594 acetaldehyde
- •Алгоритм Моргана
- •Cangen алгоритм (caNonically geNerated)
- •InChI - International Chemical Identifier
- •Правила InChI
- •InChIKey – ключ для поиска структуры
- •Iupac International Chemical Identifier (InChI) Program Version 1, Software version 1.01
- •InChI Software Version 1.02 – final, implemented for Standard InChI/ InChIKey, January 2009
- •Задачи для самостоятельной работы
- •Задание 2.
Алгоритм кодирования в wln
После того как записана структурная формула, вычленяем функциональные группы и записываем графическую формулу. Затем выбираем направление записи по правилу «старшинства» (группы располагаем по старшинству и алфавиту - бóльшая цифра и обратный алфавит). Для молекулы гидроксиацетилхлорида запись в формате WLN получилась следующая:
А для 1-бром-2-хлорпропанола:
Разветвления в цепи обозначают “&” или “/” .
Знаки X и К имеют по 2 & (/).
Знаки Y и N имеют по 1 & (/).
После терминальной группы & не ставится.
Когда в молекуле имеется несколько разветвлений с разными центрами, их указывают в обратном порядке, возвращаясь по направлению записи к началу молекулы, после того как обозначена основная цепь.
Примеры алгоритма кодирования в WLN.
Алгоритм декодирования в wln
Записываем код соединения, вычленяем функциональные структурные фрагменты и преобразуем их в химическую формулу:
Запись заместителей в бензольном кольце осуществляется следующим образом: первый заместитель помечают как позицию а, затем по алфавиту:
Запись ведут соответствующей заглавной буквой через пробел.
QR C1 ZR CVQ WNR CV1 DQ
Запись карбоциклов имеет свои особенности: буквой L обозначают начало цикла, числом отмечают размер цикла, конец цикла - J .
Если цикл полностью гидрированный – добавляют букву T .
Если цикл гидрирован частично и в случае если только один атом углерода насыщен, то его обозначают символов Н.
Если в цикле более одного насыщенного атома, отмечают положение двойных связей и добавляют букву T
Гетероциклы записываются с буквы T (начало цикла), числом отмечают размер цикла, обозначаются гетероатомы и их положение, конец цикла - J
T5N
СNJ
A2Q
B1
ENW
T5O
BV EHJ
T5M
CN BUTJ B1NR&1R
T5S
CNJ BMNUY1&1 DVZ
T5NYMV
EHJ A1 BUM E1R
I1Y1&MVR CV1MR DG& DN1&1
Z1YVQM1VMY1VQ1VQ
Бициклические соединения записывают начиная с буквы L или T, в зависимости от того входит в состав конденсированного соединения гетероцикл или нет, следующие две цифры обозначают размер сочлененных циклов и окончания цикла J, положения замещения начинают нумеровать с атома сочленения так, чтобы заместители имели наименьшую букву.
L66J
BMR & DSWQ IN1&1
T56
BN T&J BV1 HNW
При записи в линейном виде полициклических соединений выбирают первые два конденсированных цикла (например 65), нумеруют буквами по кругу, третий цикл записывают с буквой соединения.
L
C665
T&&J
L
B665
T&&J
L665
HH &T&J
T
C565
BN DS HN LOJ
L
I5 G6 D6 B665J
Representation of Organic Structure Description Arranged Linearly (rosdal)
Данная кодировка была создана в 1985 году в Beilstein Institute. Применяется для названий соединений в программе ISISDraw и в базе данных Beilstein.
Правила rosdal.
Вся структура нумеруется;
Символы атомов пишутся сразу после номера (символ углерода С не пишется);
Водороды не обозначается или нумеруются наравне со всеми атомами;
Одинарные связи обозначаются –, двойные =, тройные #,
другие ?;
Разветвления перечисляются через запятые.
Рассмотрим алгоритм кодирования в формате ROSDAL на примере молекулы фенилаланина.
После того как структура пронумерована начинаем запись кода молекулы, с учетом кратности связи. Сначала записываем бензольное кольцо, начиная с углерода под номером 1, затем через запятую все оставшиеся звенья молекулы.: 1=2-3=4-5=6-1,5-7-8-9=12O,8-10N,9-11O.
1N-2-4-5N=6-7S-8=4, 2=3O, 6-8N-10N=11-12, 11-13.