Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Нейронные сети и большие данные.docx
Скачиваний:
48
Добавлен:
04.03.2022
Размер:
1.09 Mб
Скачать

Метаобучение (learning-to-learn)

Это подраздел машинного обучения, в котором применяется автоматическое обучение: алгоритмы машинного обучения располагаются по этапам, и в каждом следующем этапе используются результаты обучения, полученные на предыдущем. На текущий момент времени термин «метаобучение» не получил общепринятого определения, однако основная цель состоит в том, чтобы использовать информацию об обучении для понимания того, как улучшить качество существующих алгоритмов обучения или изменить сами используемые алгоритмы обучения.

Каждый алгоритм машинного обучения основан на наборе предположений о данных, его индуктивном смещении. Это означает, что алгоритм будет хорошо учиться, только если его индуктивное смещение соответствует решаемой задаче (теме обучения). Из-за этого алгоритм машинного обучения может очень хорошо работать в какой-то одной области, но не в другой, что накладывает серьезные ограничения на использование метаобучения, поскольку взаимосвязь между индуктивным смещением и эффективностью различных алгоритмов машинного обучения пока недостаточно глубоко исследована.

Общее описание: примерами для обучения являются решенные ранее задачи обучения, требуется определить, какие из используемых в них эвристик работают более эффективно. Конечная цель – обеспечить постоянное автоматическое совершенствование алгоритма обучения с течением времени.

Глубокое обучение (deep learning)

Глубокое обучение является частью более широкого семейства методов машинного обучения, основанных на искусственных нейронных сетях с обучением признакам (также может быть с учителем, без учителя или частичное). Алгоритмы глубокого обучения, такие как глубокие нейронные сети, сети глубокого убеждения, рекуррентные нейронные сети и сверточные нейронные сети, применяются в таких областях, как машинное зрение, распознавание речи, обработка естественного языка, распознавание звука, фильтрация контента социальных сетей, машинный перевод, биоинформатика, дизайн лекарств, анализ медицинских изображений, проверка качества сырья, компьютерные игры, где они показывают результаты, сопоставимые с результатами работы экспертов-людей.

Общее описание: глубокое обучение – совокупность методов машинного обучения, основанных на обучении представлениям, а не специализированным алгоритмам под конкретные задачи. Глубокое обучение, как правило, основано на глубоких нейронных сетях. При обучении ГНС находит корректный метод математических преобразований самостоятельно, чтобы превратить подаваемый на вход пример в ответ, независимо от линейной или нелинейной корреляции. Каждое математическое преобразование считается слоем, а сложные ГНС имеют много слоев, отсюда и название «глубокие» сети.

ИИ-системы

ИИ-системы – сложные программные системы, имеющие ярко выраженную архитектуру, четко ориентированную на область решаемых задач, строятся на основе алгоритмов машинного обучения. В зависимости от требований к масштабу и быстродействию, такие системы разбивают на модули или подсистемы, организуя обмен результатами вычислений через общую память или шину данных. ИИ-система может представлять собой распределенную по сети программную платформу, требования к высокой степени согласованности управления предполагают, что такие платформы должны быть вычислительными кластерами, которые требуют в качестве вычислителя массивно-параллельной или гиперконвергентной инфраструктуры. При увеличении сложности алгоритмов растет точность (accuracy) решений (прогнозов), но снижается объяснимость решений, т.е. алгоритм в который раз превращается в «черный ящик», который выдает годный результат, но при этом никак не прослеживается, каким образом получен этот результат, что на него повлияло, какая последовательность условий во входных параметрах, данных привела к его получению. Этот недостаток привел к появлению нормативной базы по необходимости наличия у современных критичных приложений объяснимых решений, принятых алгоритмами.