Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
MapReduce базаны пайдалана отырып, RDFS OWL п...docx
Скачиваний:
0
Добавлен:
01.07.2025
Размер:
218.31 Кб
Скачать

13 Біз, өйткені тіпті біз жабу есептеу тіркелген нүктеге жетті

кейбір жағыдайлар алуға болады, сол кез келген жаңа туынды әкелуі емес. Жағдайда

біз одан әрі осы өңдеуге болады, толық RDFS ұзарту есептеу керек

соңғы 3 ережелер, соңғы мәлімдеме алу және біз тривиальным ережелерді қолданады

Біздің талқылау басында алынып тасталды. Бұл соңғы бөлігі оңай болуы мүмкін

жүзеге асырылып, сондықтан біз оны талқылау қоспаймыз.

тек ілмектер ережелер өздері арасындағы болып табылады. Мысалы, егер

біз шығаруға мүмкін емес, әзірге біз қайталана оны қолдану қажет, 11-ереже қолдану керек

нәрсе енді. Тек оған кейін біз safetly біздің процесін жалғастыру мүмкін. Ана Жерде

рекурсивті емес, тек 4 ережесі (ереже, 2, 3, 8, 12 және 13) болып табылады. Бұл ішкі ілмектер

қайталау саны кіріс деректерді байланысты проблемалық болып табылады және

біз қажетті ең аз жұмыс орындарын санын азайту үшін келеді. Біз осы шешу

жадында кейбір схема үштіктің тиеу арқылы мәселе.

Жадында схемасы үштіктің жүктеу 5.3.2

Біз схемасы үштіктің саны әлдеқайда төмен екенін пайдалануға

деректер үштіктің және барлық біз бар үлкен Ішкі жиында арасындағы ма қосылады деп

данасы үштіктің және схема үштіктің құрамында әлдеқайда аз бірі. Үшін

Біздің ережелері біз схема үштіктің төрт жиындарын қажет. бірінші, бұл бірі болып табылады

қасиеттерін доменді анықтайды. Бұл Ішкі жиын екінші ереже 2. пайдаланылады

қасиеттерін ауқымын анықтайды Ішкі жиын. Бұл ереже 3. пайдаланылады

Үшінші subproperty қатысы айқындайды бірі болып табылады және ол ережелер 5 қажет

7. төртінші және соңғы ережелер қолданылатын сыныбында қарым-қатынастар жиынтығы болып табылады

9 және 11.

Осы төрт деректер шағын болғандықтан, біз оның орнына олардың жадында сақтауға және аласыз

матч бар болса, біз тексеру бұрын біз жасадық бір жұмысты пайдалана отырып, қосылу істеу

енгізу арасындағы жадында сақталады үштіктің бар утраивается. Мысалы

біз 9-ереже қолданғыңыз келсе, біз бағалаймыз барлық үштіктің жадында ұстап

егер түрі B, біз тексеру: а RDF түрінде әрбір үштік үшін сыныпқа қарым-қатынастар және

қатарынан үш рет нысан біз жадында ұстап үштіктің бір немесе бірнеше сәйкес келеді. Ол болса,

содан кейін біз жаңа мәлімдеме шығарып істемейді.

Біз жақсы түсіндіруге қысқаша мысал есеп. Енгізу жиынтығын қарастырайық

үштік:

a1 RDF: түрі.

Page 41

5.3. ЕКІНШІ ЖҮЗЕГЕ АСЫРУ

41

b1 RDF: түрі B.

A rdfs: subclassof B.

B rdfs: subclassof C.

C rdfs: subclassof D.

түйіндері бар жад хэш кестедегі «сыныбында» үштіктің жүктеу

мәні ретінде кілт және объектісі ретінде үштіктің пәні. Мысалы бұл қорытындысы

хэш картасы жазбаларын қамтитын болады:

кілт

құн

A

B

B

C

C

D

Түрлендіргіш енгізу Үш RDF алған кезде: түрі, ол тексереді

негізгі хэш кестеде Triple-ның объектісі тең болады. Бұл жағдайда

құрушының табысқа және құрушының Бұл мән А. байланысты мәні мүкіндіктер

B болып табылады және құрушының жаңа Үш RDF шығарады: түрі B.

жадында схемасы үштіктің ұстап артықшылығы біз емес, яғни

бір уақыт жұмысқа іске қосу үшін қажет. Біздің алдыңғы тұрғыда біз қажет

Біз тұрақты нүктесін жеткенше қайта-қайта бір жұмысты іске қосу үшін. Біз болсақ

рекурсивный матчтарының бар болса, біз тексеруге болады жадында схемасы үштік

жолы. Біз 9-ереже қабылдауға Мысалы, егер шығу ережесін қолдану арқылы өндірілген

одан әрі бұл жаңа туынды әкелуі мүмкін тексеру үшін кіріс ретінде пайдаланылуы мүмкін

жадында схемасымен. Осылайша, біз тағы бір қайта іске қажеті жоқ

жұмыс.

Бұл соңғы қарастырғаннан кейін, біз сондай-ақ, ішкі ілмектер және біздің ережесін жою

soning процесі тапсырмаларының сызықтық тізбегі болып табылады.

Бұл іске асыру The картасы кезеңінде жүргізіледі қосылады. редукторлары

біз жазу аулақ, сондықтан жай ғана енгізу қарсы алынған үштіктің с згілеу

шығу бірдей үштік астам бір рет басыңыз. сегіз ережелер (ереже 8 емес,

екі Hadoop тапсырмаларында жүзеге асырылуда осы нұсқасын) қарады. бірінші жұмыс

екі транзитивность ережелерін орындайды. Екінші барлық басқа ережелер қолданылады. Жылы

Келесі екі бөлімшелерден біз толығырақ осы екі жұмыс орындарын сипаттайды.

Бірінші тапсырманы 5.3.3 - транзитивность ережелерін қолдануға

Біріншіден, біз осы Ереженің транзитивность мүлкін пайдалануға ережелерін 5 және 11 қолдануы

сыныбында және subproperty қарым-қатынастар әр subproperty айқын қабылдау және

сыныбында мәлімдеме. алгоритм алгоритм хабарлайды 5.

енгізу үш схемасына сәйкес келетін құрушының тексереді. Жағдайда

ол жай ғана реттелуіне негізгі ретінде орнату, үш алынған жаңа шығарады, жасайды және

мәні ретінде шынайы орнату. Ол сондай-ақ тек бір айырмашылық бар, үш кірісті шығарады

ол жалған ретінде мәні қояды.

редукторы код өте қарапайым болып табылады. Ол кіріс үштіктің болып тексереді

алынған немесе жоқ. Бұл жинақтарын құндылықтар Итерация деп жасайды. Бар болса

жалған орнатылған мән, ол үш есе кіріс осы екенін білдіреді. Бұл жағдайда

Page 42

42 42

MAPREDUCE функциялары ретінде 5-тарау RDFS Пайдасына

Алгоритм 5 RDFS reasoner: екінші нұсқасы бірінші тапсырма

Картада (басты, мәні):

// Кілт: маңызды емес

// Мәні: үштік

мәні болса. предикатты = rdfs: subClassOf, содан кейін

нысандар = сыныбында схемасы. рекурсивті алу (мәні. қарсылық)

нысандар объект үшін

шығыс (Triple (мән ескере отырып, rdfs. subClassOf, нысан), шын)

мәні болса. предикатты = rdfs: subPropertyOf, содан кейін

супер нысандар = subprop схемасы. рекурсивті алу (мәні. қарсылық)

(супер объектілерін объектінің) үшін

шығыс (Triple (мән ескере отырып, rdfs. subPropertyOf, нысан), шын)

шығару (құны, жалған)

(кілтін итератора мәндерін) азайту:

құндылықтар құны бойынша

Егер жоқ болса, содан кейін жоғары бағалаймыз

шығу

шығару (нөл, негізгі)

Triple шығарылады емес. Әйтпесе, ол тек бір рет шығарылады. редукторы

біз тек бірегей үштіктің шығарып сендіреді.

5.3.4 Екінші тапсырма

Екінші тапсырма қалған ережелерін жүзеге асырады. Hadoop жылы арнайы бар

біз тізбегі кейбір картография пайдалану ChainMapper деп аталатын түрлендіргіш кейін бір

басқа. алдыңғы түрлендіргіш шығу келесілердің енгізу болып,

және, осылайша, соңғы құрушының азайту деректерді шығарады дейін.

Біз 3 түрлі картография анықтайды. бірінші құралдар Ол жүктер 7. билік

еске қосалқы меншік үштіктің және ол предикат тексереді

Кіріс үштіктің схемасында қамтылған. Бұл ереже бірінші орындалады

тізбек. Бұл түрлендіргіш шығару ережелерін кодтайтын екінші түрлендіргіш барады

2 және ол екі түрлі деректер құрылымдардың схемасы алаңдаушылық утраивается жүктер 3.

домен мен қасиеттерін диапазоны. Бұл екі ережелер топтастырылады

Бір түрлендіргіш, олар бір басқа тәуелсіз болып табылады, сондықтан олар, өйткені

бір мезгілде қолданылуы мүмкін. Ескерілетін таңдау бірінші орынға қойып, бұл

Бұл соңғы бір кездейсоқ, бірақ байланысты емес бұрын ережені 7 жүзеге асырады түрлендіргіш

7 ережеге шығу Осылайша ережелер 2 және 3. пайдаланылуы мүмкін, бұл факт

7 ережеге шығу біз кез келген жіберіп алмаңыз қамтамасыз ету, екінші түрлендіргіш тексеріледі

Жаңа туынды.

Page 43

5.4. Үшінші және соңғы ЖҮЗЕГЕ АСЫРУ

43

соңғы құрушының ережелер 9, 11, 12 және 13-орындалуын қамтиды.

Ережелер 9 және 11-пайдалану, өйткені бұл төрт ережелер барлығы бір түрлендіргіш бойынша топтастырылады

Сонымен жад деректер құрылымы ережелері 12 және 13 жай утраивает қажет, ал

кез енгізу болып табылады немесе тек алдыңғы ережелер шығарылады. алгоритм болып табылады

Алгоритм хабарлады 6.

Кіріс үштік белгілі шарттарға сай болса, карта құрушының бірінші тексереді және

бұл кезде жад деректермен матч бар болса, ол рекурсивті тексереді

құрылымы. үштік өндірілген, содан кейін с зуге болады редукторлар жіберіледі

телнұсқаларын жүзеге.

Бұл іске асыру кіріс деректер сыналған, бірақ негізгі болды

Картада кезінде телнұсқаларын санын мүдделі мәселе

фаза. Тест бірінде телнұсқаларын саны оған дейін сонша өсті

Біздің Hadoop кластер ұсынатын барлық кеңістік тұтынылған. себебі тұр

біз олар екеуі де бірдей әкелуі мүмкін, тіпті егер үштік арқылы үштік өңдеуге фактісі

туынды. Мысал келтірейік. Осы 6 үштік бар:

а RDF: түрі C

а RDF: түрі D

C rdfs: сыныбында E

D rdfs: сыныбында E

E rdfs: сыныбында F

F rdfs: сыныбында G

картография жадында соңғы 4 үштіктің жүктейді. Кезде түрлендіргіш

алдымен алған кезде, бұл E, F түрі екенін G. шығаруға болады үш есе алады

Екінші, бұл сондай-ақ, сол 4 үштіктің алуға болады үш есе. Ұзақ тізбектері бар болса,

сыныбында қайталамауы үштіктің жарылыс болады утраивается, және, бірақ барлық

кейінірек дұрыс редукторлар бойынша сүзуге болады, оның ішінде олар жергілікті бірінші болуы тиіс

сақталады және кейінірек редукторлар жіберілді.

үшінші және соңғы іске асыру осы соңғы проблемасы және ұсынады

қарағанда әлдеқайда көп орындаушылық алгоритм болып табылатын шықты шешім

әлі күнге дейін ұсынылған.

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]