3.4 Экспериментальные данные.

Позиции для обучающей выборки брались из партий двух сильных эвристических алгоритмов. Это позволяет получить репрезентативную выборку, в отличие от метода случайной генерации позиций.

В качестве входов нейронной сети использовались количество фишек на каждом поле (28 параметров) или параметры эвристической оценочной функции (8-10 параметров). Из общих тенденций следует отметить, что время обучения сети с более формализованными параметрами меньше, а качество игры выше, что достигается предварительным просчетом параметров. Подход, использующий параметры эвристической оценочной функции, позволяет достичь лучших результатов, но требует больших вычислительных ресурсов, что не всегда оправданно, особенно для портативных устройств.

Было опробовано несколько методик обучения нейронных сетей (например, уже настроенная эвристическая функция для прямой оценки позиций в выборке) и несколько топологий (число нейронов в каждом слое, наличие нейронных смещений).

Наилучшие же результаты показал метод формирования обучающей выборки, основанный на вычислении оценки по числу выигранных партий одним из игроков. Так, для получения обучающей выборки генерируется некоторое число позиций (в работе использовались выборки размером не более 10 тыс. позиций, для работы с большими выборками инструменту nntool не хватает оперативной памяти). Для оценки каждой из этих позиций проводится турнир из N партий между двумя равными игроками, причем текущая позиция берется начальной для каждой партии. Причем, под числом побед белых над черными можно понимать оценку данной позиции. Число N в работе бралось не больше 10 тыс. партий (из-за большой вычислительной сложности задачи). В качестве игроков следует брать наиболее сильные эвристические функции, для получения правдоподобных оценок вероятности победы из данной партии. Далее на полученной выборке обучается трехслойная нейронная сеть и используется в программе в качестве оценочной функции.

В качестве сети использовалась трехслойная нейронная сеть с 28 нейронами во входном слое. В скрытом слое использовалось различное число нейронов (1, 2, 5, 10, 20), но наилучший результат дала сеть с двумя нейронами, что объясняется недостаточным объемом выборки и недостаточной точностью оценок. Построенная нейронная сеть выигрывает около 55% партий у наилучшей эвристической оценочной функции.

Для дальнейшего увеличения качества игры с применением нейронных сетей, планируется увеличить объем обучающей выборки и точность оценок, играя больше партий и используя более сложные ОФ. Увеличение выборок повлечет за собой отказ от инструмента nntool и написание собственной функции обучения сети, менее универсальной и менее требовательной к ресурсам. Также предполагается построить несколько сетей, отвечающие за разные стадии игры (отсутствие контакта фишек, вывод с доски). Также предполагается построение итеративного процесса, в котором обученная сеть используется для формирования следующей выборки, что должно позволить повысить качество игры.т брать наиболее сильные эвристические функции, для получения правдоподобных оценок вероятности победы иозиций, для работы с большими нт и генерируется некоторое число позиций (в работе использовались выборки размером 10 тыс. ител

<<< < Предыдущая 1 2 3 4 5 6 7 8 9 10 11 1213 / 1713 14 15 16 17 > Следующая >>>

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]

#
01.05.202549.64 Кб1Понятие о протеине.docx
#
11.02.2015368.64 Кб53породы1.doc
#
01.07.2025392.16 Кб0Пособие по БФ (1).docx
#
25.03.20161.52 Mб123Потороко И.Ю. Товароведение и экспертиза рыбы и рыботоваров, 2003.doc
#
01.07.2025438.27 Кб0Пояснительная записка к плану.doc
#
01.03.2025838.66 Кб1Пояснительная записка на диплом (от Коробкова).doc
#
23.09.2019440.32 Кб16ПРАВИЛА ВЕТЕРИНАРНОГО ОСМОТРА УБОЙНЫХ ЖИВОТНЫХ...doc
#
11.02.2015122.43 Кб94Правила ВСЭ 1983 г.docx
#
01.07.2025253.95 Кб0ПРАВИЛА НАПИСАНИЯ САМОСТОЯТЕЛЬНОЙ РАБОТЫ.doc
#
11.02.201553.76 Кб29ПРАВИЛА ОФОРМЛЕНИЯ РЕФЕРАТА.doc
#
01.07.2025105.67 Кб0Правила по конной стрельбе из лука 1.docx