- •2 Нейрон желiлерi
- •2.1 Нейрон және оның үлгiсi
- •2.1.1 Құрылымы және жеке нейронның жұмыс жасауы
- •2.2.2 Персептрон
- •2.1 Мысал үшін үйрету тізбегі
- •2.1.3 Адалайн моделі
- •2.1.4 Шығысында сигмоидасы бар нейрон моделі
- •2.1.5 Хебба нейронының моделі
- •2.2 Бір бағытты көп қабатты желіліер
- •2.2.1 Желіліер құрылымы және қызметі
- •Xor есебі үшін үйрету тізбегі
- •2.2.2 Қатенің кері таралу алгоритмі
- •2.2.3 Кезеңге қатысты қатенің кері таралуының алгоритмі
- •2.2.4 Айнымалы бірігуі алгоритмі
- •2.2.5 Левенберг-Марквардт алгоритмі
- •2.2.6. Аз квадраттардың рекурентті әдісі
- •2.2.7 Желі сәулетін таңдау
- •2.3 Рекурентті желі
- •2.3.1 Хопфилд желісі
- •2.3.2 Хемминг желісі
- •2.4 Басқару жүйесіндегі нейро-тақ желілер
- •2.4.1 Гибридті интеллектуалды жүйелер
- •2.4.2 Нейро тақ желілер
2.2.2 Персептрон
Персептронның құрылымы 2.3-суретте көрсетілген.
Персептронның жұмыс жасауы өрнекпен сипаттауға болады
.
. (2.3 )
(2.3
) формуласы
кезінде (2.1
) теңдеуіне апарады. f
функциясы дискреттi сатылы бола алады
- (қабылдаушы мән яғни - 1 немесе 1) екi
полярлық немесе (қабылдаушы мән 0 немесе
1) бiр полюсты. Екi полярлық форманы алу
.
.
(2.4 )
2.3-сурет. Персептронның құрылымы
Персептрон белсенді функциясына сәйкес тек қана екi әр түрлi шығыс шамасын қабылдай алады, сондықтан ол х ~ [х1 ..., хn]T түрiндегi оның кiрісіне берiлетiн сигналдар жіктеле алады. Мысалы, бiр кірісті персептрон тани алады, кiретiн сигнал оң немесе терiс болып табылады. Персептронның екi кiруі болған жағдайда екi жартылай жазықтыққа бөледi. Мұндай декомпозиция түзу сызықпен беріледі
.
.
(2.5 )
(2.5 ) теңдеуін мына түрде жазып алуға болады
(2.6
)
Персептрон кiрулерi n болса, кiретiн векторларының бiр қалыпты кеңiстiгiн х екi жарты кеңiстiкке n бөледi. Бұл екi жарты кеңiстiк бір бірінен гипержазықтықпен ажыратылады, шешушi (decision boundary) шекара теңдеумен анықталады
(2.7 )
2.4-суретте п = 2 шешушi шекара көрсетілген. T әрқашан w = [w1, w2]T салмақтарына перпендикуляр. Персептрондарды оқытуға болады. Үйренулер тәсілінде персептронның салмақтары құбылады. Персептронның үйрену әдiсі мұғалiммен үйрену немесе қадағалаумен үйрену деп аталады. Мұғалiмнiң рөлi x(t)=[x0(f), x1(t), ..., хп(t)]T, t = 1, 2, ..., сигналдарын персептронға беру, d(t), t = 1,2, …, үлгі сигнал деп аталады.
2.4-сурет. n=2 үшін нәтижелік шекара
Мұндай үлгі сигналдарының шамасына сәйкес мәндерiнің жиынтығы үйретушi бағдарлама тiзбегі деп аталады. Қаралатын топтар әдiстердiң қолдануында нейронның жүрiстi сигналының кiріс мәндердiң енгiзуiнен кейiн шығысын есептеуге болады. Салмақ осыдан кейiн үлгі сигналы және персептронның шығу белгiсiнiң аралығындағы қателiк минимал болатындай етiп құбылады. Мұғалiмнiң өзi үлгі мәндерiнің үйрену терминiн ұғындырады. Желiлердiң үйренуiнiң алгоритмдерінің мұғалiмсiз түрі бар болады. Персептронның үйрену алгоритмі осы кездегi келесi қадамдардан тұрады:
1. Персептронның бастапқы салмақтарына кездейсоқ мәндерді беру.
2. Нейрон кiрісіне х = x(t)= [x0(t), x1(t), ..., xn(t)]T, t = 1,2,… үйретушi бағдарлама векторы беріледі.
3. (2.3 ) формуласы бойынша персептронның шығыс мәнiн есептеу.
4. Шығыс у(t) мәнiн d=d(x(t)) үлгі мәнiмен салыстыру.
5. Салмақты төмендегiше түрлендiру:
а) егер y(x(t)) ≠ d(x(t), онда wi(t +1) = wi(t)+d(x(t)) xi (t);
б) егер y(x(t)) = d(x(t)), онда wi(t +1) = wi (t).
6. 2 қадамға өту.
Алгоритмды орындау үйретушi бағдарлама тiзбектiң құрамына кiретiн барлық кiрiс векторларының шығысындағы қателiк төмендегенге дейін жүзеге асады. Персептронның үйрену блок-сызбасы 2.5-суретте көрсетілген. Бұл сызбаның бiр iшкi циклының орындауы үйретушi бағдарлама тiзбегін құратын дәуiрге сәйкес келедi. Сыртқы циклдың орындауы бiр үйретушi бағдарлама тiзбегiнің бiрнеше рет қолдану мүмкiндiгін қамтиды.
Персептронның үйрену алгоритмін андайтынын дәлелдеймiз. Персептронның сәйкестік туралы теорема төмендегiше құрастырады:
Егер w*=[w1*,...,wn*]T болса, х=[x1,..., хп]T векторын жіктесе, у=d(x) көрсетсе, онда үйретушi бағдарлама алгоритмінің итерацияларының санында салмақтарының кез келген бастапқы мән векторларында табады.
Персептрон тек қана осы жағдайда үйретуге болғандығынан, үйретушi бағдарлама iрiктеу сызықты бөлгiш сыныптарды ұсынатынын болжаймыз. Персептронның белсенді функциясы «sgn» ие болғандықтан, w* вектор ұзындығы || w*|| = 1. Сондықтан 2.6-суретте болғандай етiп түрлендiруге жеткiлiктi, α бұрышы 0 тең болады. Бұдан cos (α) = 1. |w* ° х| > 0 және w* шамалары х кез келген мәнінде |w*° х| > δ және δ > 0 болады. Скалярлық көбейтудiң анықтауларнан шығады
.
(2.8)
2.5-сурет. Персептронды үйрету алгоритмінің блок сұлбасы
(2.9)
болғандықтан
(2.10)
Персептронды үйрету алгоритміне сәйкес х кіріс векторы үшін салмағы w'=w+Δw теңдеуіне сәйкес, мұнда
2.6-сурет. n=2 үшін персептронды үйрету алгоритмінің көрсетілуі
Δw = d(х) х.Оның шығысында қате пайда болады. Бұдан
w'°w* = w ° w* +d(x)w*° х, (2.11)
сондықтан
w' ° w* = w ° w* + sgn(w*° x)w*° x.
Келесі шарттар ақиқат:
а) егер *° х < 0, онда sgn(w*° x) = -l, сондықтан sgn(w*° x) w*°х= -l(w*° x) >0;
б) егер * ° х > 0,oнда sgn(w* ° x) = 1, сондықтан sgn(w* ° х) w*°х = l(w* ° х) > 0.
Бұдан
sgn(w* ° х) w* ° х = |w*° х|. (2.13)
(2.12) және (2.13) теңдеулерге сәйкес:
w' ° w* = w ° w* + |w*° х|. (2.14)
|w*° х| > δ болғандықтан
w' ° w* > w ° w* + δ. (2.15)
Кіріске х векторын бергенде желі шығысында пайда болады, осылай ||w'||2 шамасын бағалайық
d(x)=-sgn(w° x). (2.16)
яғни,
||w'||2 =||w + d(x)x||2 ||w|| + 2d(x) w° x +||x||2 . (2.17)
(2.16) и (2.17) тәуелділіктерін пайдалана отырып, кіріс сигналының шектеулілігін аламыз
||w'||2 < ||w||2 + ||x||2 = ||w||2 + C. (2.18)
T модификация қадамынан кейін (2.15) және (2.18) тәуелділігіне сәйкес желі салмағы
w(t) ° w* > w° w* + tδ; (2.19)
||w(t)||2 < ||w||2 + tC. (2.20)
(2.10), (2.19) және (2.20) формулаларын пайдалана отырып
(2.21)
Сондықтан t = tmax үшін cos(α) = 1. Демек, бастапқы салмақтар векторынан кейiн у = d(x) орындайтын салмақтардың түрлендiруiнiң қадамдарының түпкi саны бар болады. Егер бастапқы салмақтар мәні 0 тең болса, онда
tmax =С/δ2. (2.22)
2.1-мысал
Персептронның үйренуiн қарап шығамыз. Оның функциясын талқылау арқылы бiз нейронның екi кiрiстi үлгiсi жазықтықты екi жартылай жазықтыққа бөлетінін анықтадық. Сәйкесiнше персептронның сызықты болуын табуы керек. Бiздiң сынау үшiн L 2.7-суретте көрсетілгендей үлгілі сызығын аламыз. Сызық үстінде жатқан барлық нүктелер 1класқа, ал астында жатқандары 2сыныпқа жатады. Персептрон шығысында сигнал 1 түзу керек. Үйрету тізбегі 2.1-кестеде көрсетілген.
Персептронның салмағының бастапқы шамасы келесідей: w1 = 2, w2 = 2, θ = -4.Осы параметрлерге негізделе отырып, К түзуін сызамыз. Үйрету алгоритмінің 10 тапсырмасын орындағаннан кейін персептрон сигналдарды жіктей бастады. М түзуі L түзуімен сәйкес келмейді.
2.7-сурет. 2.1 мысалы үшін шешуші шекара
2.1-кесте
