
- •Оглавление
- •Введение
- •Представление информации в компьютере, единицы измерения информации
- •Информационно-поисковые языки
- •Представление молекул в компьютерном виде
- •Линейные нотации
- •Линейная нотация Висвессера - Wiswesser Line Notation (wln)
- •Правила wln
- •Алгоритм кодирования в wln
- •Алгоритм декодирования в wln
- •Representation of Organic Structure Description Arranged Linearly (rosdal)
- •Правила rosdal.
- •Smiles (Simplified Molecular Input Line Entry System)
- •Правила smiles.
- •Sln Sybyl Line Notation
- •Правила sln.
- •Табличные представления
- •Xyz координаты
- •1. Nsc7594 acetaldehyde
- •Xyz координаты
- •1. Nsc7594 acetaldehyde
- •Алгоритм Моргана
- •Cangen алгоритм (caNonically geNerated)
- •InChI - International Chemical Identifier
- •Правила InChI
- •InChIKey – ключ для поиска структуры
- •Iupac International Chemical Identifier (InChI) Program Version 1, Software version 1.01
- •InChI Software Version 1.02 – final, implemented for Standard InChI/ InChIKey, January 2009
- •Задачи для самостоятельной работы
- •Задание 2.
Алгоритм Моргана
Алгоритм Моргана для нумерации атомов в молекуле был предложен в 1965 году. Основан на нумерации атомов по принципу числа продленных связанностей (EC – extended connectivity).
Рассмотрим пошагово принцип нумерации согласно алгоритму Моргана.
Шаг 1. Поиск первого атома
Сначала пронумеровывают все атомы по количеству связанных с ними атомов (n1).
Например, если атом связан с тремя атомами, то он имеет номер n1=3, если с одним – то n1=1. Кратность связи в расчет не принимается. Также и атомы водорода можно не учитывать, так как они могут быть определены исходя из правил валентности.
ЕС 3 (1,2,3)
Проводят расчет числа продленных связанностей (ЕС) каждого атома, которое будет равно сумме всех соседних n1.
ЕС 3 (1,2,3) ЕС 4 (3,4,5,6)
После сравнивают между собой все ЕС(1), если нет наибольшего среди них, то проводят вторую итерацию расчета ЕС(2).
ЕС 4 (3,4,5,6) ЕС 7 (5,6,8,9,10,12,14,16)
Этот шаг повторяют до тех пор пока не получится одно из значений ЕС(i) больше других, или пока количество продленных связанностей (ЕС) не станет постоянным.
Шаг 2. Нумерация атомов.
Атому, имеющего наивысшее количество продленных связанностей (ЕС), присваивают первый номер.
После нахождения атома с наивысшим ЕС, проводят нумерацию всех атомом по принципу увеличения номера атома у ближайших атомов к наименьшему номеру:
Атом, имеющий наивысшее значение ЕС, имеет номер 1.
Рассматривают все соединенные с ним атомы, номер 2 получает атом с наибольшим ЕС, номера 3, 4 (и.т.д.) получают все остальные соединенные атомы с первым по уменьшению ЕС.
Если два и более атомов, соединенных с первым, имеют одинаковое количество продленных связанностей ЕС, то нумерация производят по следующим правилам, в соответствии с типом связи, атома или связи:
1. По типу атома
Чем меньше номер атома, тем он младше, например, углерод С младше азота N, который младше кислорода О, который младше серы S.
Если атомы одинаковы, то старше наименьший изотоп (12С старше 13C).
Чем больше заряд на атоме, тем старше атом (О2- младше О1+).
2. По типу связи:
Одинарная связь старше двойной, которая старше тройной.
Cangen алгоритм (caNonically geNerated)
Существуют некоторые отличия алгоритма CANGEN от алгоритма Моргана:
Алгоритм Моргана рассматривает сумму близлежащих связей, CANGEN кроме этого, учитывает также порядок связей, атомы, заряды и количество присоединенных атомов водорода Н.
Рассмотрим пошагово принцип нумерации согласно алгоритму CANGEN.
Шаг 1. Введение атомных инвариантов.
К атомным инвариантам относятся:
число соединений у атома,
число связей с тяжелыми атомами,
атомный номер,
знак заряда,
значение заряда по модулю,
количество атомов водорода.
Группа инварианты номер
1) 2) 3) 4) 5) 6)
-СН2- 2 2 6 0 0 2 20306002
-СН3 1 1 6 0 0 3 10106003
3
4 6 0 0 0 30406000
1
2 8 0 0 0 10208000
1 1 8 1 1 0 10108110
3 4 7 2 1 0 30407210
1 2 8 0 0 0 10208000
Шаг 2. Присваивают номера по ранжированию.
Рассмотрим на примере н-пентана:
СН3СН2СН2СН2СН3
-СН3 10106003 →1
-СН2- 20306002 → 2
Таким образом молекула пентана сначала преобразуется в вид:
10106003-20206002-20206002-20206002-1016003.
Далее присваиваем номера по рангу:
1-2-2-2-1
Шаг 3. Суммирование всех соседних номеров.
Проводим суммирование всех соседних номеров и «молекула» преобразуется в вид:
1-2-2-2-1
2-3-4-3-2
Проводим ранжирование. Номер два стал наименьшим – ему присваиваем значение 1, номеру 3 присваиваем значение 2 и номеру 4 - 3:
2-3-4-3-2
1-2-3-2-1
Если структура симметрична, получаем конечную нумерацию:
1-3-5-4-2
Рассмотрим принцип нумерации согласно алгоритму CANGEN.
На примере еще одного соединения:
6-амино-2-этил-5-(аминоэтил)-1-гексанол
Присваиваем каждому атому свой номер согласно инвариантам:
С
Н3
10106003
N 10107002
О 10108001
СН2 20206002
СН 30306001
И далее ранжируя, получаем окончательную нумерацию атомов в молекуле.