Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Все шпоры.doc
Скачиваний:
57
Добавлен:
22.09.2019
Размер:
3.24 Mб
Скачать

71. Вероятностное динамическое программирование. Оптимальная последовательность действий в задаче азартная игра.

Одна из разновидностей игры в русскую рулетку состоит во вращении колеса, на котором по его периметру нанесены последовательных чисел от 1 до . Вероятность того, что колесо в результате одного вращения остановится на цифре , равна . Игрок платит долларов за возможность осуществить вращений колеса. Сам же игрок получает сумму, равную удвоенному числу, которое выпало при последнем вращении колеса. Поскольку игра повторяется достаточно много раз (каждая до вращений колеса), требуется разработать оптимальную стратегию для игрока.

Сформулируем задачу в виде модели ДП, используя следующие определения:

Этап соответствует -му вращению колеса, ;

Альтернативы на каждом этапе состоят в следующем – либо покрутить колесо еще раз, либо прекратить игру;

Состояние системы на каждом этапе представляется одним из чисел от 1 до , которое выпало в результате последнего вращения колеса.

Пусть - максимум ожидаемой прибыли при условии, что игра находится на этапе (вращении) и исходом последнего вращения есть число . Имеем следующее:

Рекуррентное уравнение для можно записать следующим образом:

Обоснование рекуррентного уравнения сводится к следующему. При первом вращении колеса ( ) состоянием системы является , ибо игра только началась. Следовательно, . После выполнения последнего вращения колеса имеется лишь один выбор – закончить игру независимо от исхода -го вращения. Следовательно, .

Рекуррентные вычисления начинаются с , заканчиваются при и сводятся, таким образом, к вычислительному этапу. Так как представляет собой ожидаемую прибыль от всех вращений колеса, а игра обходится игроку в долларов, имеем следующее:

72. Методы прогнозирования. Прогнозирование с использованием скользящего среднего. Основные понятия.

При использовании этой методики основное предположение состоит в том, что временной ряд является устойчивым в том смысле, что его члены есть реализациями следующего случайного процесса:

где - неизвестный постоянный параметр, который оценивается на основе представленной информации. Предполагается, что случайная ошибка имеет нулевое математическое ожидание и постоянную дисперсию. Кроме того, предполагается, что данные для различных периодов времени не коррелированны.

Метод с использованием скользящего среднего предполагает, что последние наблюдений являются равнозначно важными для оценки параметра . Другими словами, если в текущий момент времени последними наблюдениями есть , тогда оцениваемое значение для момента вычисляется по формуле:

73. Методы прогнозирования. Выбор количества элементов массива для расчета в методе скользящего среднего.

Не существует четкого правила для выбора числа - базы метода, использующего скользящее среднее. Если есть весомые основания полагать, что наблюдения в течение достаточно длительного времени удовлетворяют модели , то рекомендуется выбирать большие значения . Если же наблюдаемые значения удовлетворяют приведенной модели в течение коротких периодов времени, может быть приемлемым и малое значе­ние . На практике величина обычно принимается в пределах от 2 до 10.

74. Методы прогнозирования. Понятие экспоненциального сглаживания.

Прогнозирование путем экспоненциального сглаживания (метод экспоненциального сглаживания) предполагает, что вероятностный процесс определяется моделью , это предположение использовалось и при рассмотрении метода скользящего среднего. Метод экспоненциального сглаживания разработан для того, чтобы устра­нить недостаток метода скользящего среднего, который состоит в том, что все данные, используемые при вычислении среднего, имеют одинаковый вес. В частности, метод экспоненциального сглаживания приписывает больший весовой коэффициент самому последнему наблюдению.

Определим величину как константу сглаживания, и пусть известны значения временного ряда для прошедших моментов времени . Тогда оценка для момента времени вычисляется по формуле:

Коэффициенты при постепенно уменьшаются, тем самым эта процедура приписывает больший вес последним (по времени) данным.

Формулу для вычисления , можно привести к следующему (более простому) виду: