Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Шпаргалки по биофизике.docx
Скачиваний:
60
Добавлен:
14.04.2019
Размер:
157.66 Кб
Скачать

42. Как влияет удаление малозначащих признаков из обучающей выборки на процесс обучения нейросети. Пример на эвм.

Искусственная нейронная сеть (ANN — artificial neural network) представляет собой вычислительную архитектуру для обработки сложных данных с помощью множества связанных между собой процессоров и вычислительных путей. Искусственные нейронные сети, созданные по аналогии с человеческим мозгом, способны обучаться и анализировать большие и сложные наборы данных, которые с помощью более линейных алгоритмов обработать крайне сложно.  Для обучения нейронной сети необходима обучающая выборка (задачник), состоящая из примеров. Каждый пример представляет собой задачу одного и того же типа с индивидуальным набором условий (входных параметров) и заранее известным ответом. Например, в качестве входных параметров в одном примере могут использоваться данные обследования одного больного, тогда заранее известным ответом в этом примере может быть диагноз. Несколько примеров с разными ответами образуют задачник. Задачник располагается в базе данных, каждая запись которой является примером. Не останавливаясь на математических алгоритмах, подробно описанных в монографии [5.45], рассмотрим общую схему обучения нейросети. 1.      Из обучающей выборки берется текущий пример (изначально, первый) и его входные параметры (представляющие в совокупности вектор входных сигналов) подаются его на входные синапсы обучаемой нейросети. Обычно каждый входной параметр примера подается на один соответствующий входной синапс. 2.      Нейросеть производит заданное количество тактов функционирования, при этом вектор входных сигналов распространяется по связям между нейронами (прямое функционирование). 3.      Измеряются сигналы, выданные теми нейронами, которые считаются выходными. 4.      Производится интерпретация выданных сигналов, и вычисляется оценка, характеризующая различие между выданным сетью ответом и требуемым ответом, имеющимся в примере. Оценка вычисляется с помощью соответствующей функции оценки. Чем меньше оценка, тем лучше распознан пример, тем ближе выданный сетью ответ к требуемому. Оценка, равная нулю, означает что требуемое соответствие вычисленного и известного ответов достигнуто. Заметим, что только что инициализированная (необученная) нейросеть может выдать правильный ответ только совершенно случайно. 5.      Если оценка примера равна нулю, ничего не предпринимается. В противном случае на основании оценки вычисляются поправочные коэффициенты для каждого синаптического веса матрицы связей, после чего производится подстройка синаптических весов (обратное функционирование). В коррекции весов синапсов и заключается обучение. 6.      Осуществляется переход к следующему примеру задачника и вышеперечисленные операции повторяются. Проход по всем примерам обучающей выборки с первого по последний считается одним циклом обучения. При прохождении цикла каждый пример имеет свою оценку. Вычисляется, кроме того, суммарная оценка множества всех примеров обучающей выборки. Если после прохождения нескольких циклов она равна нулю, обучение считается законченным, в противном случае циклы повторяются. Количество циклов обучения, также как и время, требующееся для полного обучения, зависят от многих факторов - величины обучающей выборки, количества входных параметров, вида задачи, типа и параметров нейросети и даже от случайного расклада весов синапсов при инициализации сети.  

43. Пространственная конфигурация биополимеров. Типы объемных взаимодействий в белковых макромолекулах. Водородные связи. Общие черты пространственных структур различных белков были установлены в работах Л.Полинга и Р.Кори: 1. Длины связей и величины валентных углов всех пептидых груп - одинаковы. 2. Все атомы пептидной группы расположены в одной плоскости и предпочтительной конфигурацией пептидной группы является транс-конфигурация 3. Полипептидная цепь полностью насыщена водородными связями 4. Двухгранные углы вращения вокруг связей N - Cа и Cа - С' отвечают минимумам торсионных потенциалов, а расстояния между всеми валентно не связанными атомами превышают суммы ван-дер-ваальсовых радиусов. 5. Конформационные состояния всех звеньев полипептидной цепи эквивалентны. Полинг и Кори, сформулировали гипотезу, согласно которой альфа-спираль и складчатая бэта-структура имеют фундаментальное значение в пространственной организации белковых молекул и что структуры фибриллярных, глобулярных белков и синтетических пептидов могут быть описаны с помощью небольшого числа канонических форм - некоторых структурных блоков. В результате стереохимических преобразований в структуре белковой молекулы формируются соответствующие молекулярные органы и исполнительные механизмы, а на локальных и поверхностных участках возникает такая пространственно-упорядоченная организация боковых атомных R-групп элементов, которая в живой системе играет роль стереохимических кодовых информационных сигналов. К таким сигналам могут относиться: стереохимические команды управления активного центра фермента (адресный код и код химической операции; различные сигнальные и регуляторные кодовые компоненты; коммуникативные локальные и поверхностные кодовые стереохимические матрицы (микроматрицы), служащие для информационного взаимодействия белковых молекул с их молекулярными партнёрами и т. д. При этом, сама программа функционирования белковой молекулы (благодаря программирующим свойствам элементов) коммутируется лабильными физико-химическими силами, связями и взаимодействиями между боковыми R-группами элементов (аминокислот) в составе её трёхмерной структуры. Поэтому природа взаимодействий боковых атомных групп, определяющих конформационные особенности и внутреннюю динамику белковой макромолекулы, имеет химическую основу и носит информационный характер. Общая структура свернутого белка исключительно компактна. Например, полностью вытянутая цепь панкреатического трипсинового ингибитора (58 остатков) имеет длину 21.1 нм, а максимальный габаритный размер свернутого белка равен около 2.9 нм. Карбоксипептидаза, состоящая из 307 аминокислотных остатков, в вытянутой форме имеет длину 111.4 нм, а в свернутой - 5.0 нм. По плотности упаковки белки очень близки кристаллам малых органических молекул (70-78 %) , связанных между собой дисперсионными, лондоновскими силами. Из-за высокой плотности упаковки белки отличаются слабой сжимаемостью. Так их коэффициент сжимаемости меньше, чем у масла, и практически совпадает с коэффициентами сжимаемости олова и каменной соли. Плотность белка не одинакова во всех частях глобулы. Плотность центральной части ниже кажущейся плотности белковой молекулы в растворе. Низкая плотность и даже "пустоты", т.е. области, не заполненные атомами белка, встречаются в различных частях глобулы. Как правило, в них находятся единичные молекулы воды, связанные с аминокислотными остатками водородными связями. Молекулы воды обнаруживаются рентгеноструктурным анализом и составляют с белком как бы единое целое.