
- •Основные направления и перспективы создания лекарственных средств источники получения лекарственных средств
- •Основные направления и этапы поиска лекарственных средств
- •Связь между химической структурой, свойствами веществ и их действием на организм
- •Некоторые аспекты микробиологического синтеза лекарственных средств
- •Эмпирический и направленный поиск лекарственных веществ
- •Основные принципы компьютерного поиска и конструирования новых лекарственных средств
- •Вычислительные и информационные методы конструирования лекарств
Основные принципы компьютерного поиска и конструирования новых лекарственных средств
Одним из наиболее перспективных и все более широко применяемых методов рационального конструирования и поиска новых ЛС является использование компьютерных технологий. Это привело к созданию путей направленного поиска ЛВ — конструирования лекарств. Процесс конструирования состоит из двух этапов: предположения о существовании перспективных биологически активных химических соединений и отсеивания из них бесперспективных с помощью математических методов прогнозирования. Затем осуществляют проверку биологической активности перспективных веществ (доклинические испытания).
Они позволяют эффективно решать многие проблемы ФХ, например такие, как:
• хранение и обработка информации о структуре и биологической активности соединений;
• поиск оригинальных базовых структур во внутрифирменных и коммерчески доступных банках данных;
• установление связи «структура - свойство» и оптимизация свойств активных субстанций;
• анализ структурных особенностей новых биологических мишеней действия ЛС;
• моделирование взаимодействия «лиганд - рецептор»;
• комбинаторная химия.
Вычислительные методы используют для конструирования лекарств в двух направлениях: для поиска наиболее активного вещества в заданном ряду и для выявления биологически активных веществ среди ранее не изучавшихся групп соединений.
Для установления связей между биологическими свойствами молекул и их химической структурой предложены различные математические модели. Биологическое действие согласно этим моделям является аддитивной суммой вкладов различных факторов:
,
где С - концентрация вещества, вызывающего биологический эффект; Xi — параметры, характеризующие физико-химические свойства этого вещества; аi — коэффициенты, устанавливаемые методами регрессионного анализа.
Из большого числа методов, применяемых для конструирования лекарств, наиболее часто используют регрессионный анализ, методы теории распознавания образов, дискриминантный анализ.
Регрессионный анализ. Математический метод, основанный на предположении, что между биологическими параметрами и физико-химическими свойствами существует линейная зависимость. Одним из вариантов регрессионного анализа, наиболее часто применяемым для установления соотношения структуры и биологической активности, является полуэмпирический метод Ханша. Другой вариант — многопараметрическая регрессионная модель — дает возможность коррелировать вклад введения или изменения положения заместителя в молекуле на биологический эффект. Область применения регрессионного анализа в основном ограничена рамками какого-то одного ряда соединений.
Методы теории распознавания образов. Сущность методов заключается в установлении правила, позволяющего относить объекты к соответствующему классу. Исходную информацию получают, используя представительный набор объектов различных классов. В задаче распознавания образами являются виды биологической активности, объектами — химические соединения, а их описанием — различные способы представления информации о структуре и физико-химических свойствах соединений. Методы распознавания образов позволяют определять, какие из свойств исследуемых объектов являются общими. Когда эти соотношения установлены, с их помощью можно предсказать свойства объектов, которые не входили в исходную группу данных. Преимущество этих методов заключается в возможности предсказания активности значительно различающихся классов соединений и включения в общий массив исследования неактивных соединений. Это позволяет на основании небольшой выборки объектов получить характеристики, присущие всему классу исследуемых веществ.
Дискриминантный анализ. Метод позволяет относить испытуемые вещества к той или иной фармакологической группе на основании обработки результатов большого числа количественных испытаний. Одновременно с помощью дискриминантных функций оценивается до 30-40 тестов, а расчеты ведутся на ЭВМ.
Помимо выполнения рассмотренных вычислительных функций, одним из направлений использования ЭВМ является создание «банка» данных, т.е. использование информационных технологий. В таком банке накапливаются и хранятся сведения о химическом строении и биологическом действии нескольких тысяч различных веществ. Они определенным образом классифицированы и позволяют с помощью ЭВМ оценивать вновь синтезированные соединения. Новые сведения систематически пополняют банк. Проведение массовых испытаний с помощью банка данных экономит значительное количество времени и средств, так как выполнение биологических испытаний осуществляется для малого числа отобранных потенциальных БАВ.
Наличие банка данных, накопленных в ЭВМ, позволяет создать информационно-поисковую систему. Она дает возможность проводить так называемый информационный анализ химического соединения на основе использования той обширной информации, которая заложена в банке данных. Чем больше информации будет находиться в нем, тем достовернее будет прогнозирование биологической активности.
Очень важно провести точное и полное индексирование информации, занесенной в информационно-поисковую систему. Поэтому создаются специальные информационно-поисковые тезаурусы — словари, в которых систематизированы термины, отражающие биологическую активность химических соединений, и связь между этими терминами.
Статистическая обработка большой информации, накопленной в банке данных с помощью ЭВМ, позволяет прогнозировать биологическую активность синтезированных соединений. Применяя простой логический алгоритм, исследователь осуществляет отбор, оценку и использование для прогноза структурных признаков биологической активности химических соединений. По этим признакам можно провести направленный синтез новых соединений, обладающих заданным спектром фармакологического действия, т.е. оптимизированный процесс поиска новых ЛВ.
В последние годы для прогнозирования биологической активности химических соединений используют систему Интернет. Разработана Интернет-версия программы PASS, обеспечивающая с помощью имеющейся базы данных возможность получения по структурной формуле химического соединения прогноза спектра биологической активности, включающего более 700 фармакологических эффектов и механизмов действия.
Разработан и отлажен сервер прогноза биологической активности химических соединений. При входе на сайт программы PASS пользователь может получить информацию о программе и выполнить прогноз спектра биологической активности интересующего его вещества. Для этого он посылает на прогноз структуру молекулы и принимает результаты прогноза.
Квантовомеханические методы (метод Хюккеля, расширенный метод Хюккеля, метод полного пренебрежения дифференциальным перекрыванием и его модификации, метод молекулярных орбиталей и др.) обычно используются для решения двух задач: расчета теоретических параметров, связанных с биологической активностью, и определения устойчивых конформаций биологически активных молекул.
Современным методом прогнозирования биологической активности и конструирования ЛС является метод распознавания образов (структуры). Принцип такого метода достаточно простой: в память компьютера вносятся соответствующим образом обработанные данные о химической структуре, токсичности и биологической активности уже известных ЛС. В настоящее время определяются следующие виды биологической активности: противоопухолевая, антибактериальная, противовирусная, противосудорожная, антигипертензивная, антиоксидантная, противогельминтная, радиопротекторная, наркотическая, эстрогенная, транквилизирующая, иммунодепрессивная, коронаровазодилататорная, анальгезирующая, противовоспалительная и др. Банк данных (обычно более 10 тыс. ЛС) систематически пополняется и уточняется. В качестве дескриптора в компьютерной программе может выступать любой признак. В системах прогнозирования биологической активности по структурной формуле в качестве дескрипторов обычно используются:
• параметры молекулы - молекулярная масса, наличие оптических изомеров, активных центров, липофильность, полярность и т.д.;
• параметры заместителей - количество атомов элементов, кратных связей, стерические параметры и т.д.;
• взаимодействие заместителей - количество атомов-соседей, их тип, взаимное пространственное расположение и другие геометрические характеристики;
• электронные характеристики - потенциал ионизации, электронная плотность, дипольный момент;
• спектральные характеристики и другие данные.
Из перечисленных выше дескрипторов чаще применяются (в частности, в QSAR) такие, как липофильность, электронные эффекты, стерические особенности структуры. Они играют важную роль при оценке способности ЛС преодолевать клеточные мембраны, степени ионизации соединения, а также прочности его связывания в активном центре фермента или рецептора. Следует особо подчеркнуть роль в системе прогнозирования фрагментных дескрипторов, которые оценивают вклад различных частей молекулы в общее свойство, поскольку таким образом можно определить функциональные группы, ответственные за проявление определенной физиологической активности данным соединением (фармакофорные группы).
В компьютер вводятся данные о структуре и физико-химических свойствах соединения, затем машина обрабатывает информацию и выдает заключение о возможной биологической активности данного соединения, о предполагаемых изменениях структуры для ее повышения, уменьшения токсичности, увеличения растворимости и т.д. После этого синтезируется вещество с предложенной оптимальной структурой, устанавливаются его свойства, и проводится новый диалог с компьютером. С учетом полученных данных вещество или его синтетические аналоги подвергаются биологическим испытаниям, на основании которых отбираются наиболее перспективные для фармакологических испытаний вещества.
Проблема поиска и совершенствования ЛС настолько сложна, что исследователь никогда не будет знать, нашел ли он, наконец, наилучшее соединение в данной серии. При конструировании ЛС немалую роль играет и счастливый случай. Однако использование компьютеров и мощного математического аппарата уже сейчас значительно облегчает работу исследователей и снижает стоимость разработок.
До последнего времени наблюдалась разобщенность работ по проблеме количественных соотношений «структура-активность», которые проводились в разных лабораториях обособленно по несогласованным тематикам. В 1989 г. было организовано международное общество по анализу количественных соотношений «структуpa - активность» и моделированию (QSAR). С 1996 г. работает и Российская секция этого общества. Цель общества - создание новых ЛС методами химического и биологического синтеза, а также более глубокое понимание соотношений между химической структурой вещества и его биологической активностью. Последнее является фундаментальной проблемой для химии, биологии и медицины, ее разрешение может способствовать рациональному дизайну новых ЛС.
QSAR предполагает идентификацию и количественное выражение структурных параметров или каких-либо физико-химических свойств физиологически активных веществ в виде дескрипторов для оценки влияния каждого из них на наличие биологической активности. При выявлении такой зависимости составляются уравнения, позволяющие просчитать заранее биологическую активность новых аналогов, что позволит сократить количество аналогов, которые должны быть синтезированы. Обнаружение аналога, не попадающего под корреляцию, означает, что для проявления молекулой биологической активности важны какие-то другие ее характеристики. В этом случае аналог может стать новым соединением-лидером для последующей разработки. Поэтому QSAR применяется для поиска соединений-лидеров, если известна только структура лиганда, а структура рецептора неизвестна. Таким образом, характер поиска и оптимизация соединений-лидеров с помощью методов QSAR и компьютерного моделирования в значительной степени зависят от исходных данных.
Уже на начальной стадии разработки новых ЛС весьма желательно иметь всестороннюю характеристику биологической активности вещества, данные о всех лечебных и возможных отрицательных эффектах. Компьютерная система предсказания спектра биологической активности вещества по его структурной формуле PASS (Prediction of Activity Spectra for Substance), которая стала применяться с 1995 г, является самообучающейся программой (в настоящее время используется версия PASS-C). Она комбинирует метод распознавания образов, логико-структурный подход, квантовомеханические методы и предоставляет возможность предсказывать свыше 400 видов фармакологической активности, механизм действия и специфические токсические эффекты (канцерогенность, мутагенность, тератогенность) потенциального ЛВ на основе его структурной формулы. Показано, что средняя точность прогноза основного и сопутствующих эффектов - 83,4%, эффект применения этого подхода к планированию скрининга новых ЛС - 500-800%, а точность компьютерного подхода в 3—4 раза превосходит точность предсказания экспертов. Тем не менее, окончательное решение в отношении интерпретации и использования результатов прогноза должно приниматься квалифицированными специалистами, которые будут учитывать всю имеющуюся в их распоряжении информацию.
В конце 1990-х годов для оценки состава коллекций соединений сформировались два основных критерия:
• коллекция должна быть достаточно разнообразна, чтобы активность соединений проявлялась чаще;
• коллекция должна состоять из «лекарственно-подобных» молекул, похожих по структуре на известные ЛС.
Существует много компаний по производству программного обеспечения, предлагающих для определения разнообразия молекул программные продукты, основанные на принципах, которые фармацевтическая промышленность считает полезными для поиска новых ЛС; причем большинство фармацевтических компаний используют несколько таких программных продуктов, приспосабливая их к своим нуждам. Так, пакет программ SORT&gen оценивает качество коллекций структурных формул на основе анализа циклов, составляющих скелет молекулы, и представляет эти структуры в двумерном пространстве. Используя SORT&gen, специалисты по компьютерной химии могут составить оценку качества своей коллекции соединений, а также получить представление о виртуальных или реальных структурах, которые могли бы пополнить коллекцию. Подборки соединений сравниваются с другими подборками, и результат сравнения используется для принятия решения. Например, пакет программ способствует решению непростого вопроса о том, какие соединения нужно заказать, у какого поставщика и что получится в результате.
Для пополнения коллекции на основе второго вышеуказанного критерия - лекарственного подобия - наиболее часто используются три базы данных по ЛВ: World Drug Index (WDI), MACCS-II Drug Data Report (MDDR) и Comprehensive Medicinal Chemistry (CMC). Они содержат соответственно 38000, 75000 и 5000 веществ с разной степенью детальности характеристик, которые могут быть использованы для сравнительного анализа. Обычно проводится сравнительный анализ этих баз данных и других коллекций соединений, в частности соединений из «Справочника доступных химических соединений» (Available Chemical Directory, ACD). В настоящее время для такого отбора соединений (для скрининга или закупки образцов) используются количественные параметры (так называемые «правила Липински»), которые содержат некоторые общие свойства лекарственно-подобных молекул, но фактически лишь облегчают теоретическую часть поиска ЛВ и характеризуют такие свойства, как адсорбция и проницаемость. Кроме того, эти правила имеют следующие недостатки:
• они неприменимы к природным веществам;
• правила нарушаются в 28% случаев при анализе коммерческих ЛС по базе данных CMC.
Виртуальный мир химических соединений огромен: в зависимости от способа вычислений результат может доходить до 10 соединений, и для синтеза образцов в достаточном для скрининга количестве потребовалось бы больше вещества, чем есть во Вселенной. Подборки соединений для поиска ЛВ всегда будут оставаться ничтожно малыми по сравнению с виртуальным миром. Но несмотря на это, постоянное увеличение количества соединений, проходящих скрининг, гарантирует улучшение любых моделей независимо от их недостатков. До сих пор не существует общего метода надежного прогнозирования и изобретения ЛС. Тем не менее, информационные технологии будут определять качество коллекций соединений, которое во многом станет решающим фактором конкуренции на фармацевтическом рынке, при гармоничном сочетании исследований в биологии, химии и компьютерной химии.