Частичное обучение (semi-supervised learning)

Способ машинного обучения, при котором используется обучение с учителем на небольшом количестве размеченных данных и большое количество неразмеченных данных. Этот способ занимает промежуточную позицию между обучением без учителя и обучением с учителем. Затраты на разметку данных для обучения с учителем могут сделать процесс обучения с использованием только размеченных данных слишком дорогим или даже невыполнимым, в то время как процесс задания неразмеченных данных не является очень затратным.

Общее описание: каждый пример представляет собой пару «объект, ответ», но ответы известны только на части примеров. Прикладная задача – автоматическая рубрикация большого количества текстов при условии, что некоторые из них уже отнесены к каким-то рубрикам.

Обучение с подкреплением (reinforcement learning)

Это напоминает реальное обучение людей – через испытания и систему «кнут-пряник». Одна из самых захватывающих частей обучения с подкреплением заключается в том, что оно позволяет вам отказаться от обучения на статических наборах данных. Вместо них можно обучать в динамичной шумной среде, такой как игровые или реальные миры.

Общее описание: роль примеров играют пары «ситуация – принятое решение», ответами являются значения функционала качества, характеризующего правильность принятых решений (реакцию среды). Как и в задачах прогнозирования, существенную роль здесь играет фактор времени.

Примеры прикладных задач: формирование инвестиционных стратегий, автоматическое управление технологическими процессами, самообучение роботов и т.д.

Непрерывное обучение (online machine learning, continuous machine learning)

Способ машинного обучения, при котором данные становятся доступными в порядке получения и используются для обновления наилучшего предиктора для будущих данных на каждом шаге, в отличие пакетного обучения, которое генерирует наилучший предиктор путем обучения на всем наборе обучающих данных сразу. Непрерывное обучение – распространенный метод, используемый там, где вычислительные мощности не позволяют обучаться по всему набору данных. Он также используется в ситуациях, когда алгоритму необходимо динамически адаптироваться к новым паттернам в данных, или, когда сами данные генерируются как функция времени, например, прогнозирование цен на акции. Алгоритмы непрерывного обучения подвержены «катастрофическому забыванию» при выучивании новых признаков из непрерывно поступающих данных, эту проблему можно решить с помощью инкрементных подходов к обучению.

Инкрементное обучение – это метод машинного обучения, при котором входные данные непрерывно используются для расширения знаний существующей модели (для дальнейшего обучения модели). Метод представляет собой динамическую технику, при которой используется обучение с учителем и без учителя, которая может быть применена, когда обучающие данные становятся доступными постепенно, с течением времени, или размер данных выходит за пределы системной памяти. Применяемые алгоритмы известны как алгоритмы инкрементного машинного обучения.

Общее описание: непрерывное обучение может быть обучением с учителем и без учителя. Специфика в том, что примеры поступают потоком. Требуется немедленно принимать решения по каждому примеру и одновременно доучивать модель с учетом новых примеров. Как и в задачах прогнозирования, существенную роль здесь играет фактор времени. Способ используется в случаях, когда данные выходят за размеры памяти системы, либо необходимо быстро реагировать на изменяющиеся условия путем дообучения модели.

<<< < Предыдущая 1 2 3 45 / 85 6 7 8 > Следующая >>>

Соседние файлы в предмете Большие данные

#
04.03.20221.22 Mб44Лаб 1 БСТ1904 Пантелеева.docx
#
04.03.20221.1 Mб90Лаб 2 БСТ1904 Пантелеева.docx
#
04.03.2022210.78 Кб103Лаб 3 БСТ1904 Пантелеева.docx
#
04.03.2022824.71 Кб69Лаб 4 БСТ1904 Пантелеева.docx
#
04.03.2022311.17 Кб75Лаб 5 БСТ1904 Пантелеева.docx
#
04.03.20221.09 Mб48Нейронные сети и большие данные.docx