Добавил:

Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.

Вуз:

Национальный технический университет Украины «Киевский политехнический институт»

Предмет:

[НЕСОРТИРОВАННОЕ]

Файл:

Lektsii_KOS / Тема 8. Лекция.docx

Скачиваний:

Добавлен:

12.05.2015

Размер:

1.85 Mб

Скачать

☆

<<< < Предыдущая 1 2 3 4 5 67 / 107 8 9 10 > Следующая >>>

Сходимость алгоритма обучения

Процесс обучения заканчивается при

Qn<δ, (3.25)

где δ>0 — достаточно малая величина. Для того чтобы выполнялось данное неравенство при любом δ>0, необходимо найти условия, при которых . Введем вероятностное пространство

Ω, каждый элемент котрого ωΩ определяет конкретную реализацию процесса обучения. Величины αⁿ,tⁿиQ_n зависят от этой конкретной реализации ω∈Ω. Однако в дальнейшем (там, где это не будет вызывать неясности) вместо α_iⁿ(ω), tⁿ(ω) и Q_n(ω), как и ранее, будем писать αⁿ,tⁿиQ_n

Без существенного ограничения общности можно считать, что промежуток времени между сеансами обученияΔt_n постоянен. При таком предположении имеет место следующая

Теорема. Пусть Δt_n=c, 0<с<∞, n=0, 1,... Тогда для всех ω∈Ω

limQ_n(ω)=0. (3.26)

Это и является утверждением, что описанный процесс обучения сходится.

Поскольку то достаточно доказать, что для

всех ωΩ имеет место выражение

(3.27)

Введем множество M(ω) (ωΩ) тех элементов ОИ, которые бесконечное число раз выдаются для заучивания с ростом n (n — число сеансов обучения), и докажем следующие леммы.

Лемма 1. ПустьΔt_n=c, 0<с<∞, n=0, 1,... Тогда для всех ωєΩ и любого ε>0 существует число К такое, что для всех n≥К и любого iM(ε)

(3.28)

т. е. скорость забывания становится сколь угодно малой.

Доказательство. Предположим противное: существуют Ω, ε>0 и iM(ω’)такие, что для любого K>0 существует такое , что

(3.29)

Поскольку iM(ω) и согласно алгоритму изменения скоростей забывания (2.3)монотонно убывает, то существует n_i(ω) такое, что для всех. В качестве К выберемK=n₁(ω^/): K=n₁(ω). Тогда для всех , что противоречит неравенству (3.29). Полученное противоречие доказывает лемму.

Лемма 2. Пусть выполнены условия леммы 1. Тогда для любого ω∈Ω и любого i∈M(ε)

(3.30)

т. е. любой элемент ОИ заучивается сколь угодно хорошо.

Доказательство. Предположим противное, т. е. существуют ω∈Ω, ε>0 и номер i∈M(ε), такие, что для любого К существует такой номер ,что

или

(3.31)

Поскольку убывает с ростом п. то условие (3.31) будет справедливо, если время , когда i-й элемент ОИ не выдается для заучивания, стремится к бесконечности с ростом п. Для определенности пусть

(3.32)

Согласно лемме 1 для любых

существует номер сеанса по такой, что для всех

. (3.33)

В сделанном предположении будем считать К=п₀+Т. Поэтому для

(3.34)

Определим номер сеанса , начиная с которого Представимв видеи определимl — число сеансов обучения от последнего момента заучивания i-ro элемента до момента .Для этого из соотношения

(3.35)

найдем времянезаучиванияi-го элемента ОИ до момента(3.36)

Lp=a+mp, 0≤р≤1. (1.6) 11

Где 25

(3.51) 31

(3.52) 31

(3.41)

Так как согласно лемме для

nj) справедливо неравенство

(3.41^’)

то

. (3.42)

Поэтому из соотношения

(3.43)

находимво, удовлетворяющее второму условию:

(3.44)

Итак,

. (3.46)

Однако для тех элементов ОИ, которые выдавались для заучивания в моменты k, принадлежащие интервалу времени,

. (3.47)

Таким образом, согласно правилу (2.8) выбора элементов из ОИ элемент с номеромj≠i в интервале времени не может быть выдан для заучивания более одного раза, так как иначе вместо

j-го элемента следует выдать элемент с номером i Тогда для данного элемента ОИ выполняется неравенство (3.47), а это противоречит условию (3.46). Следовательно, в интервале временибудет выдано для заучивания по крайней мере 2N элементов, а элементов ОИ всего N. Полученное противоречие доказывает лемму.

Лемма 3. Пусть ,... Тогда для всех, где М — множество номеров всех элементов ОИ, т. е. все элементы ОИ бесконечное число раз выдаются для заучивания с ростом п.

Доказательство. Предположим противное, т. е. существует ω∈Ω такое, что М(ш)ФМ. Из леммы 2 следует, что существует такой номер K(ω), что для всех

(3.48)

С другой стороны, для j элементов ОИ, принадлежащих множеству M\M(ω) элементов ОИ, которые выдаются для заучивания только конечное число раз, найдется такой номерK₁(ω), после которого эти элементы не будут выдаваться для заучивания. Поэтому согласно алгоритму (3.3) изменения p_j

(3.49)

Следовательно, существует номер /Сг(<о) >/Ci (<о) такой, что для всех /г^/С₂(со)

Pj(tjⁿM)qj> (1-е) minq_u (3.50)

/eAf \ М(ш)

т. е. начиная с nj-й элемент не выдается для заучивания. Значит, существует номер К* (ω) =max {K(ω), K₂(ω)} такой, что для всех

(3.51)

(3.52)

Следовательно, согласно правилу (2.8)jU_nПриходим к противоречию, так какj, Лемма доказана.

Из лемм 2 и 3 непосредственно следует справедливость условия (3.27). Теорема доказана.

Сходимость рассмотренного случайного процесса означает, что порождающий его алгоритм обучения обеспечивает достижение любого уровня обученности б, определяемого в соответствии с целью обучения.

<<< < Предыдущая 1 2 3 4 5 67 / 107 8 9 10 > Следующая >>>

Соседние файлы в папке Lektsii_KOS

#
12.05.2015186.36 Кб75Тема 3. Лекция.docx
#
12.05.2015246.65 Кб66Тема 4. Лекция.docx
#
12.05.2015100.79 Кб87Тема 5. Лекция.docx
#
12.05.201560.74 Кб71Тема 6. Лекция.docx
#
12.05.201568.5 Кб80Тема 7. Лекция.docx
#
12.05.20151.85 Mб97Тема 8. Лекция.docx
#
12.05.2015106.11 Кб65Тема 9. Лекция.docx