Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
ШПОРКИ.docx
Скачиваний:
0
Добавлен:
01.03.2025
Размер:
321.65 Кб
Скачать

21(1). Кодирование категориальных данных.

Категориальные данные - данные, качественно характеризующие исследуемый процесс или объект, не имеющие количественного выражения. Обычно представляют собой строковые значения из ограниченного набора категорий (например, названия городов, наименования товаров, ФИО сотрудников и клиентов и т.д.). При обработке таких данных применяются только операции сравнения: «равно» и «не равно», производится их упорядочивание, например, по алфавиту. Применение арифметических операций некорректно, даже если они представлены числами.

Кодирование категориальных переменных

Оптимальное кодирование не должно искажать структуры соотношений между классами. Если классы не упорядочены, такова же должна быть и схема кодирования.  Наиболее естественной выглядит и чаще всего используется на практике двоичное кодирование типа n->n, когда имена n категорий кодируются значениями n бинарных нейронов, причем первая категория кодируется как (1,0,0,...,0), вторая, соответственно -  (0,1,2,..,0) и т.д. вплоть до n -ной: (1,0,0,....,0). (Можно использовать биполярную кодировку, в которой нули заменяются на (-1). Легко убедиться, что в такой симметричной кодировке расстояния между всеми векторами-категориями равны. 

22(2). Преобразование даты и времени, группировка и разгруппировка данных.

1.(2)Генетический алгоритм. Назначение. Плюсы и минусы

Генетический алгоритм - это эвристический алгоритм поиска, используемый для решения задач оптимизации и моделирования путём случайного подбора, комбинирования и вариации искомых параметров с использованием механизмов, напоминающих биологическую эволюцию. Является разновидностью эволюционных вычислений, с помощью которых решаются оптимизационные задачи с использованием методов естественной эволюции, таких как наследование, мутации, отбор и кроссинговер. Отличительной особенностью генетического алгоритма является акцент на использование оператора «скрещивания», который производит операцию рекомбинации решений-кандидатов, роль которой аналогична роли скрещивания в живой природе.

Назначение: Генетические алгоритмы служат, главным образом, для поиска решений в многомерных пространствах поиска. Генетические алгоритмы применяются при разработке программного обеспечения, в системах искусственного интеллекта, оптимизации, искусственных нейронных сетях и в других отраслях знаний.

Плюсы:

  • этот метод очень гибок, и, бу­дучи построенным в предположении, что об окружающей среде нам извес­тен лишь минимум информации, алгоритм успешно справляется с широким кругом проблем, особенно в тех задачах, где не существует общеизвестных алгоритмов реше­ния или высока степень априорной неопределенности.

  • когда способ для точного решения существует, но он очень сложен в реализации, требует больших затрат времени и денег.

Минусы:

  • генетические алгоритмы не находят оптимального решения очень трудных задач;

  • Решение является более пригодным лишь по сравнению с другими решениями. В результате условие остановки алгоритма неясно для каждой проблемы.

Эволюционные вычисления: генетические алгоритмы и эволюционные программы.

Алгоритм генетического алгоритма:

  1. Отбор

  2. Скрещивание

  3. Мутация

  4. Редукция (необязательный)

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]