Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Lektsii_KOS / Тема 8. Лекция.docx
Скачиваний:
95
Добавлен:
12.05.2015
Размер:
1.85 Mб
Скачать

Сходимость алгоритма обучения

Процесс обучения заканчивается при

Qn<δ, (3.25)

где δ>0 — достаточно малая величина. Для того чтобы выпол­нялось данное неравенство при любом δ>0, необходимо найти условия, при которых . Введем вероятностное пространство

Ω, каждый элемент котрого ωΩ определяет конкретную реали­зацию процесса обучения. Величины αn,tnиQn зависят от этой конкретной реализации ω∈Ω. Однако в дальнейшем (там, где это не будет вызывать неясности) вместо αin(ω), tn(ω) и Qn(ω), как и ранее, будем писать αn,tnиQn

Без существенного ограничения общности можно считать, что промежуток времени между сеансами обученияΔtn постоянен. При таком предположении имеет место следующая

Теорема. Пусть Δtn=c, 0<с<∞, n=0, 1,... Тогда для всех ω∈Ω

limQn(ω)=0. (3.26)

Это и является утверждением, что описанный процесс обучения сходится.

Поскольку то достаточно доказать, что для

всех ωΩ имеет место выражение

(3.27)

Введем множество M(ω) (ωΩ) тех элементов ОИ, которые бесконечное число раз выдаются для заучивания с ростом n (n — число сеансов обучения), и докажем следующие леммы.

Лемма 1. ПустьΔtn=c, 0<с<∞, n=0, 1,... Тогда для всех ωєΩ и любого ε>0 существует число К такое, что для всех n≥К и любого iM(ε)

(3.28)

т. е. скорость забывания становится сколь угодно малой.

Доказательство. Предположим противное: существуют Ω, ε>0 и iM(ω’)такие, что для любого K>0 существует такое , что

(3.29)

Поскольку iM(ω) и согласно алгоритму изменения скоростей забывания (2.3)монотонно убывает, то существует ni(ω) такое, что для всех. В качестве К выберемK=n1/): K=n1(ω). Тогда для всех , что противо­речит неравенству (3.29). Полученное противоречие доказывает лемму.

Лемма 2. Пусть выполнены условия леммы 1. Тогда для лю­бого ω∈Ω и любого i∈M(ε)

(3.30)

т. е. любой элемент ОИ заучивается сколь угодно хорошо.

Доказательство. Предположим противное, т. е. существуют ω∈Ω, ε>0 и номер i∈M(ε), такие, что для любого К существует такой номер ,что

или

(3.31)

Поскольку убывает с ростом п. то условие (3.31) будет справедливо, если время , когда i-й элемент ОИ не выдается для заучивания, стремится к бесконечности с ростом п. Для опре­деленности пусть

(3.32)

Согласно лемме 1 для любых

существует номер сеанса по такой, что для всех

. (3.33)

В сделанном предположении будем считать К=п0+Т. Поэтому для

(3.34)

Определим номер сеанса , начиная с которого Представимв видеи определимl — число сеансов обучения от последнего момента заучивания i-ro элемента до момента .Для этого из соотношения

(3.35)

найдем времянезаучиванияi-го элемента ОИ до момента(3.36)

Lp=a+mp, 0≤р≤1. (1.6) 11

Где 25

(3.51) 31

(3.52) 31

(3.41)

Так как согласно лемме для

nj) справедливо неравенство

(3.41)

то

. (3.42)

Поэтому из соотношения

(3.43)

находимво, удовлетворяющее второму условию:

(3.44)

Итак,

. (3.46)

Однако для тех элементов ОИ, которые выдавались для заучива­ния в моменты k, принадлежащие интервалу времени,

. (3.47)

Таким образом, согласно правилу (2.8) выбора элементов из ОИ элемент с номеромji в интервале времени не может быть выдан для заучивания более одного раза, так как иначе вместо

j-го элемента следует выдать элемент с номером i Тогда для данного элемента ОИ выполняется неравенство (3.47), а это противоречит условию (3.46). Следовательно, в интервале вре­менибудет выдано для заучивания по крайней мере 2N элементов, а элементов ОИ всего N. Полученное противоречие до­казывает лемму.

Лемма 3. Пусть ,... Тогда для всех, где М — множество номеров всех элементов ОИ, т. е. все элементы ОИ бесконечное число раз выдаются для за­учивания с ростом п.

Доказательство. Предположим противное, т. е. существует ω∈Ω такое, что М(ш)ФМ. Из леммы 2 следует, что существует такой номер K(ω), что для всех

(3.48)

С другой стороны, для j элементов ОИ, принадлежащих множе­ству M\M(ω) элементов ОИ, которые выдаются для заучивания только конечное число раз, найдется такой номерK1(ω), после которого эти элементы не будут выдаваться для заучивания. Поэ­тому согласно алгоритму (3.3) изменения pj

(3.49)

Следовательно, существует номер /Сг(<о) >/Ci (<о) такой, что для всех /г^/С2(со)

Pj(tjnM)qj> (1-е) minqu (3.50)

/eAf \ М(ш)

т. е. начиная с nj-й элемент не выдается для заучивания. Значит, существует номер К* (ω) =max {K(ω), K2(ω)} такой, что для всех

(3.51)

(3.52)

Следовательно, согласно правилу (2.8)jUnПриходим к про­тиворечию, так какj, Лемма доказана.

Из лемм 2 и 3 непосредственно следует справедливость усло­вия (3.27). Теорема доказана.

Сходимость рассмотренного случайного процесса означает, что порождающий его алгоритм обучения обеспечивает достижение любого уровня обученности б, определяемого в соответствии с целью обучения.

Соседние файлы в папке Lektsii_KOS