Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
MapReduce базаны пайдалана отырып, RDFS OWL п...docx
Скачиваний:
1
Добавлен:
01.07.2025
Размер:
218.31 Кб
Скачать

1.2 Parallel and distributed reasoning 1.2 параллель және таратылған пайымдау

Today just thinking of storing all the web information on one machine is pure Бір ғана машинада барлық веб ақпаратты сақтау ойлап Бүгін таза

science fiction. ғылыми фантастика. The resources of one machine are way too small to handle even бір машинада ресурстары тіпті өңдеуге жол тым аз

a small fraction of the information in the web. веб ақпарат кішкене бөлігі. Semantic Web is probably in the Семантикалық Web, бәлкім, болып табылады

same situation than the former web at its beginning. оның басында бұрынғы веб қарағанда бірдей жағдай. It is necessary to move Оны жылжыту қажет

from a single environment perspective to a distributed setting in order to exploit пайдалануға мақсатында бөлінген параметрге бір қоршаған ортаны тұрғысынан

the Semantic Web on a global scale. Жаһандық ауқымдағы семантикалық Web.

With a distributed system we overcome the limitation of physical hardware Бөлінген жүйесінің көмегімен біз физикалық аппараттық шектеу еңсере

constraints, but other problems are introduced making this problem not trivial шектеулер, бірақ басқа да мәселелер осы проблема, болмашы нәрсе емес қабылдау енгізіледі

to solve. шешу үшін. In general we are able to exploit the advantages of a distributed system Жалпы, біз бөлінген жүйесінің артықшылықтарын пайдалануға мүмкіндік бар

only if we can partition the input so that the single nodes can work without бір түйіндер жоқ жұмыс істей алады, сондықтан біз кірісті бөлу мүмкін болса ғана

communicating to each others. Әр басқаларға қарым-қатынас. If there is a strong correlation between the data Деректер арасындағы күшті байланыс бар болса,

we cannot split the input and the nodes cannot operate independently. біз кірісін бөлу мүмкін емес және түйіндер дербес жұмыс істей алады. The The

Page 7 Page 7

1.2. 1.2. PARALLEL AND DISTRIBUTED REASONING Параллель және бөлінген Пайдасына

7 7

communication between the nodes generates overhead with the consequence of түйіндерінің арасындағы байланыс салдарынан бірге үстеме жасайды

worsening the performances. қойылымдар нашарлауы.

Unfortunately the data in Semantic Web is strongly correlated and the rea- Өкінішке орай, семантикалық Web деректер қатты коррелированных және ережесін отыр

soning process worsens it because the derived information connects the data алынған ақпарат деректерді қосатын, өйткені soning процесі оны нашарлатады

even more than before. одан да бұрынғыға қарағанда. This consideration does not play in favor of a dis- Бұл жайт дисплейде пайдасына ойнауға емес,

tributed system but we still aim to find way to partition efficiently the data so доғарады жүйе, бірақ біз әлі де тиімді деректерді бөлуге жол таппақ

that we can exploit the advantage of parallelism. біз параллелизм артықшылығы пайдалануға болады деп.

Another problem that arise if we use a distributed system is load balancing. Біз бөлінген жүйесін пайдалансаңыз пайда Тағы бір мәселе жүктеуді теңдестіру болып табылады.

We must take care that the workload is equally distributed between the nodes, Біз жұмыс жүктемесі бірдей түйіндер арасында бөлінеді, бұл қамқорлық керек,

otherwise some of them will work much more than the others and we will miss әйтпесе, олардың кейбіреулері басқаларға қарағанда әлдеқайда көп жұмыс істейтін болады, ал біз сағынамын

all the advantages in having a parallelization of the computation. есептеу тармақталу бар барлық артықшылықтары.

The MapReduce programming model [4] i s described in detail in section 2.6. MapReduce бағдарламалау үлгісі [4] Мен оған бөлімінде 2.6 егжей-тегжейлі сипатталған.

Here we will simply sketch it as a programming model where the computation is Мұнда біз жай ғана есептеу болып табылады бағдарламалау үлгісі ретінде очеркінде болады

defined in jobs and every job consists in two phases: map and reduce. тапсырмаларында анықталады және әрбір тапсырма екі кезеңнен тұрады: картаға және азайту. Map is a Картасы болып табылады

function that creates some partitions over the input data. Кіріс деректер астам кейбір бөлімдер жасайды функциясы. Reduce is a function Кішірейту функциясы болып табылады

that processes each of these partitions one by one. Осы бөлімдер әр бір өңдейді.

The methodology of first partitioning and then further process the partitions бірінші бөлу әдістемесі, содан кейін одан әрі өңдеуге бөлімдер

provides an high level of parallelism. параллелизм жоғары деңгейін қамтамасыз етеді. The main advantage of using a MapReduce бір MapReduce пайдалану негізгі артықшылығы

framework is that we can concentrate on the logic of the program (design the негіздемелік біз бағдарламаның логика зейін алады (жобалау

map and reduce functions) without worrying so much about the execution and картаға мен функцияларын азайту) орындалуы туралы сонша ойланбастан және

everything that concerns technical details. техникалық мәліметтерін қатысты барлық.

Encoding reasoning as a MapReduce job means solving two problems. Бір MapReduce тапсырма ретінде пайымдау кодтау екі проблемаларды шешу білдіреді. The The

first problem consists in how to partition the data in order to reason over it and Бірінші мәселе оған астам себеппен үшін деректерді бөлуге қалай тұрады және

this is not trivial because of the high correlation. Бұл, өйткені жоғары корреляция тривиальна емес. The second problem consists Екінші проблема тұрады

in how to process the partitions and eventually infer new triples. бөлімдер өңдеуге және ақыр соңында жаңа үштік қорытынды қалай.

The first problem is solved by writing an appropriate map algorithm. Бірінші мәселе тиісті картасы алгоритм жазу арқылы шешіледі. Anal- Anal-

ogously the second problem implies writing a proper reduce algorithm. ogously Екінші проблема тиісті азайту алгоритмі жазбаша білдіреді. After we Біз кейін

have defined them, the framework will execute the job in a pseudo-transparent оларды анықтадық, база псевдо-мөлдір жұмысқа орындайды

way with an high degree of parallelization. тармақталу жоғары дәрежесімен тәсілі.

Page 8 Page 8

8 8

CHAPTER 1. INTRODUCTION ТАРАУ 1. КІРІСПЕ

Page 9 Page 9

Chapter 2 2-тарау

Background Фон

In this chapter we will describe the technologies that are used in this work Бұл тарауда біз осы жұмысқа пайдаланылатын технологияларды сипаттаңыз

with the purpose of providing a basic and common background to ease the жеңілдету үшін негізгі және жалпы фон қамтамасыз ету мақсатында

understanding of the rest of the document. Құжаттың қалған түсіну.

Basically the problem we deal with consists in processing some data in input Негізінен, біз ісі проблема енгізу кейбір деректерді өңдеу тұрады

deriving some new information out of it. одан кейбір жаңа ақпарат алу. We call this process “reasoning” over Біз астам «ойланудың» осы процесті қоңырау

the data. деректер. The data in input can be encoded either in RDF or OWL and the енгізу деректер RDF немесе OWL және кез кодталған болады

reasoning depends on which language the data is encoded in. пайымдау деректер кодталған қай тіліне байланысты болады.

In section 2. 1 we outline more formally what the term reasoning means for us Бөлімінде 2. 1, біз мерзімді пайымдау біз үшін нені білдіреді формальды астам атағалы

giving an overview of the types of reasoning that is possible to do. жасауға болады пайымдау түрлерін шолуын береді. In section 2.2, Бөлімінде 2.2

we provide a basic description of the Semantic Web illustrating the Semantic біз семантикалық суреттейді семантикалық Web негізгі сипаттамасы қамтамасыз

Web stack and the XML language. Веб-стек және XML тілі. Section 2. 3 co ntains a brief description of 2-бөлім. 3 тең қысқаша сипаттамасы ntains

RDF/RFDS while section 2 .5 d oes the same for the OWL language. RDF / RFDS 2-бөлім, ал .5 D OWL тіл үшін бірдей OES. In section Бөлімінде

2.6 we describe the MapReduce programming model with a simple example. 2.6 біз қарапайым мысал MapReduce бағдарламалау үлгісін сипаттайды. At Жанында

last, in sectio n 2. 7 we report a brief description of the Hadoop framework that is соңғы, sectio жылы 2 N. 7 біз болып Hadoop аясында қысқаша сипаттамасы есеп

the framework used for the implementation and the evaluation of our approach. негіздемелік жүзеге асыру және біздің көзқарас бағалау үшін пайдаланылады.

2.1 Reasoning 2.1 пікір алысу

Reasoning can be roughly defined as a process from which we derive new in- Ойлау шамамен біз жаңа шығаруға болатын процесс ретінде анықталуы мүмкін нұсқауларын

formation using an already existing set of data. деректер қазірдің өзінде бұрыннан бар жиынын пайдаланғанда қалыптастыру. In general reasoning can be Жалпы пайымдау болуы мүмкін

divided in either deductive or inductive reasoning. дедуктивті немесе индуктивті немесе пайымдау бөлінеді.

In this thesis we will discuss only of deductive reasoning. Диссертациялық біз тек дедуктивті пайымдау талқылайды. In deductive rea- Дедуктивті ережесін жылы

soning if certain premises are true then also a certain conclusion must be true белгілі бір үй-жайлар, сондай-ақ, сосын белгілі бір қорытынды шынайы болса, soning шынайы болуы тиіс

[12 ]. [12 ]. Let's make a simple example, using a RDF construct. Солармен RDF конструкцияны пайдалана отырып, қарапайым мысал көтеремін.

Suppose we have two triples: Біз екі үштіктің бар делік:

Alice isa Student . Алиса ISA студенті.

Student subclassof Person . Студенттік subclassof тұлға.

An example of deductive reasoning could be: if someone is a something (first Дедуктивті пайымдау үлгісі болуы мүмкін: біреу бір нәрсе болса, (бірінші

premise) and this something is a subclass of something else (second premise) алғышарты) және осы нәрсе тағы бір нәрсе (екінші алғышарты) тармағы болып табылады

9 9

Page 10 Page 10

10 10

CHAPTER 2. BACKGROUND 2-тарау АНЫҚТАМА

then someone is a something else. содан кейін біреу бір нәрсе болып табылады.

Following this deductive process we are able to derive the new information Біз жаңа ақпаратты шығаруға қабілетті осы дедуктивті процесінің қорытындысы

Alice isa Person . Алиса ISA тұлға.

We can represent the reasoning through rules. Біз ережелер арқылы пайымдау білдіретін болады. A rule is made by a set of Ереже жиынтығымен арқылы жүзеге асырылады

premises and one or more conclusions. үй-жайлар мен бір немесе бірнеше қорытынды. An example of rule is Әдетте мысал болып табылады

if егер

A type B Түрі B

and B subclassof C және В subclassof C

then A type C содан кейін А түрі C

In the example above, the deductive process that derived that Alice is a Жоғарыда келтірілген мысалда, дедуктивті процесс Алиса екенін алынған, бұл

Person can be condensed in this last rule. Тұлға осы соңғы ереже қоюландырылған болады. In general whenever we find some Жалпы, біз кейбір таба кез келген

information that matches the rule's premises we can derive the information ереже үй-жайларды сәйкес келетін ақпарат біз ақпаратты алуға болады

contained in the conclusion. қорытындыда қамтылған.

Reasoning is also divided in two other categories, backward and forward Сондай-ақ, ойлау артқа және алға, екі басқа санаттарға бөлінеді

reasoning, depending on which starting point we take as input. біз кіріс ретінде қабылдайды бастап, онда нүкте байланысты пайымдау. If we take the Біз алса

existing information as starting point and we want to derive all the possible нүктесі сияқты ақпаратты қолданыстағы және біз барлық ықтимал алу үшін келеді

statements then we are doing forward reasoning. есептілігі, содан кейін біз алға пайымдау жасайды. In the example above we Біз жоғарыда мысалда

applied forward reasoning because we started from two existing triples and we біз екі қолданыстағы үштіктің және біз басталды, өйткені пайымдау алға қолданбалы

checked if the premises were true so that we could derive the new information. біз жаңа ақпаратты шығаруға алатындай үй-жайлар шын болса, тексерді.

Backward reasoning works as follows. Төмендегідей Кері пайымдау жұмыс істейді. We pick one conclusion (like Alice isa Біз Элис ХАС ұқсас (бір қорытынды алып

Person) and see if the premises for this conclusion hold. Тұлға) және осы үй-жайлар жасасу, ұстап тұрыңыз, егер қараңыз. This process is done Бұл процесс орындалады

recursively till we “walk back” to the input data. рекурсивті біз кіріс деректер «кері жүру» дейін. If the input data confirms the Кіріс деректер растайды, онда

premises then we can successfully assert that the information is true. үй-жайлар, содан кейін біз табысты ақпарат шынайы екенін айтуға болады.

There are advantages and disadvantages in choosing either forward or back- Артықшылықтары мен кемшіліктері алға немесе көшірмес немесе таңдау бар

ward reasoning. Ward пайымдау. The first is normally used when we need to materialize every біз әрбір материалдандырылған қажет болған кезде бірінші әдетте пайдаланылады

statement out of an existing input. Бар енгізу жүзеге мәлімдеме. The second is mainly used for queries or Екінші с раулар негізінен қолданылатын немесе

verify if some conclusions are correct. Кейбір қорытындылар дұрыс болса растаңыз.

In this thesis when we talk about reasoning we mean forward deductive Біз дәлелдер туралы әңгіме болғанда осы диссертация біз дедуктивті алға білдіреді

reasoning encoded as a set of rules. ережелер жиынтығы ретінде кодталған пайымдау. We can see the reasoner implemented in Біз reasoner жүзеге асырылуда көре аласыз

this thesis as a program that applies a set of rules continuously to a set of data деректер жиынына үздіксіз ережелер жиынтығы қолданылады бағдарлама ретінде осы тезис

till nothing else can be derived anymore. ештеңе дейін енді алуға болады.

We distinguish two different reasoners, one that exploits the constructs of Біз екі түрлі reasoners, конструкцияларда пайдаланады бірін ажырата

RDF Schema and one that works with the data in OWL format. RDF схемасы және үкінің форматында деректермен жұмыс істейді бірі. The first is бірінші

referred as RDFS reasoner while the second as OWL reasoner. OWL reasoner ретінде, ал екінші RDFS reasoner деп аталатын. The first reasoner бірінші reasoner

is simpler than the second in terms of complexity. күрделілігі бойынша екінші қарағанда қарапайым болып табылады.

2.2 Semantic Web and XML 2.2 Семантикалық Веб және XML

Semantic Web is a set of tools and languages that are composed in the so called Семантикалық Web деп аталатын қаласында тұрады құралдар мен тілдер жиынтығы болып табылады

Semantic Web stack [2 8]. This stack is reported in Figure 2.1. Семантикалық веб стек [2 8]. Бұл стек суретте 2.1 хабарлады.

As we can see from the figure the Semantic Web uses XML as a standard Біз суретте көруге болады семантикалық Web стандарт ретінде XML пайдаланады

language [5 ]. тіл [5 ]. What HTML is for the web XML is for the Semantic Web. Веб XML үшін қандай HTML болып табылады семантикалық Web арналған. Prac- Далану

tically all the information in Semantic Web is encoded in XML. tically семантикалық Web барлық ақпарат XML кодталады. The choice of таңдау

using XML to represent the information is due to two reasons: ақпаратты ұсыну үшін XML пайдаланып, екі себептермен түсіндіріледі:

Page 11 Page 11

2.2. 2.2. SEMANTIC WEB AND XML Семантикалық желісі мен XML

11 11

Figure 2.1: The semantic web stack Сурет: 2.1 семантикалық веб стек

• with XML we can encode a wide range of data and this is a necessary • XML біз деректердің кең спектрін кодтауға болады және бұл қажет

condition since in the Semantic Web data can be of any possible form; Семантикалық Web деректер бері жағдайы кез-келген ықтимал нысанда болуы мүмкін;

• XML is already widely used. • XML қазірдің өзінде кеңінен қолданылады. There are already many parsers and writers Көптеген парсерін мен жазушылар қазірдің өзінде бар

that make the transmission of the information possible between different бұл әр түрлі арасындағы ықтимал ақпаратты беруді жасау

systems. жүйелер.

We report below a small fragment of a possible XML document: Біз мүмкін XML құжаттың шағын фрагменті төменде есеп:

<order> <Бұйрық>

<productId>p1</productId> <ProductId> p1 </ productId>

<amount>12</amount> <Сомасы> 12 </ сома>

<company>X</company> <Компания туралы> X </ Компания туралы>

</order> </ Тапсырыс>

Using XML we are able to structure the information in a tree using some XML пайдалану біз кейбір пайдаланып, ағаштан ақпаратты құруға қабілетті болып табылады

specific tags. нақты тегтері. In this example we can impose for example that an order (defined Бұл мысалда біз бұйрық (анықталған, бұл, мысалы, қоя алады

with the tag <order>) must contain a product and an amount and not viceversa. тег <бұйрық>) бар өнім мен сомасын емес, керісінше болуы тиіс.

The structure can be defined either with the DTD (Document Type Definition) құрылымы, не DTD (Document Type Definition) бар анықталуы мүмкін

or with the W3C XML Schema. немесе W3C XML схемасымен.

XML does not provide a semantics for the tag nesting [22 ]. XML ұя тег үшін семантикасын қамтамасыз етпейді [22 ]. For example Мысалы

in the reported example the meaning between <order> and <company> is хабарлады мысалда <мақсатында> және <компания> арасындағы мағынасы

ambiguous. мағыналы. The information contained in that small fragment could be intended бұл шағын фрагменті қамтылған ақпарат арналады мүмкін

as: сондай-ақ:

The company X made an order of 12 units of product p1. Компания X өнім Р1 12 бірлікке тәртібін құрады.

or немесе

Page 12 Page 12

12 12

CHAPTER 2. BACKGROUND 2-тарау АНЫҚТАМА

The order should be requested to company X and it consists of 12 Тапсырыс компания X талап болуы тиіс және ол 12 тұрады

units of product p1. Өнім Р1 бірлік.

The comprehension of the document is left to the context where it is used. құжаттың түсіну, ол пайдаланылады контекст қалды.

The different parties who exchange XML data must beforehand agree on the XML деректер алмасу түрлі партиялар алдын ала келісу бойынша қажет

semantics of the data they exchange [ 5] . Олар [алмасу деректер семантикасы 5] . This operation can be easily done if Бұл операция оңай жасалуы мүмкін, егер

there are two (or a small number) of fixed parties but on the web where there онда тіркелген партиялардың екі (немесе аз саны) болып табылады, бірақ веб онда

are many actors this operation becomes difficult. көптеген актерлер осы операция қиын болып табылады.

2.3 RDF 2.3 RDF

RDF consists in a data model released by W3C on 1999 RDF 1999 W3C тарапынан шығарылған деректер моделін тұрады

1 1

. . With RDF the RDF сады бірге

information is encoded in statements, where each statement consists in a triple ақпарат әрбір мәлімдеме үш тұрады есебінде кодталған

of the form object attribute value [ 15] . нысаны объектінің [төлсипат мәні 15] .

Every triple can be seen as a small sentence composed by a subject, a pred- Әрбір үш есе субъект тұратын шағын сөйлем бір pred- ретінде көруге болады

icate and an object. icate және нысан. An example of statement can be the triple “Alice eats Есепте мысал Triple «Алиса сіңірінен болуы мүмкін

apple” where Alice is the subject, eats is the predicate and apple is the object. Алиса мәні болып алма «, предикат және алма нысан болып табылады жейді.

The same triple can also be seen in terms of the relation object-attribute-value. Сонымен үштік, сондай-ақ қатынасы объектілі-атрибуты құн тұрғысынан көруге болады.

In RDF the elements that compose a triple are called resources [15 ]. RDF жылы үш құрайды элементтері ресурстар деп аталады [15 ]. Re- Осын-

sources can be either URIs, literal or blank nodes. көздері, не URIs, мағынадағы немесе бос түйіндері болуы мүмкін. In a typical Semantic Web Типтік семантикалық Веб

setting Alice could be the URIs that point to the home page of that person. Алиса орнату осы адамның басты бетке нұсқайтын URIs болуы мүмкін. The The

choice of using URIs as standard identifiers instead of simple text is due mainly орнына қарапайым мәтін стандартты идентификаторларын ретінде URI идентификаторларын пайдалану таңдау негізінен болып табылады

because the URI nomenclature is standard in the traditional web and because an URI номенклатурасы дәстүрлі веб және себебі стандарт болып табылады, өйткені

URI is supposed to be unique over the web and therefore ideal to identify unique URI веб-ден астам бірегей және бірегей анықтау сондықтан мінсіз болуы тиіс

entities. заңды тұлғалар. In XML and RDF URIs are often reported in the abbreviated form XML және RDF URIs жиі қысқартылған түрінде баяндалды

namespace:fragment. Есім кеңістігі: фрагменті. For example the URI http://www.w3.org/1999/02/22-rdf- Мысалы, URI http://www.w3.org/1999/02/22-rdf-

syntax-ns#type is often abbreviated in rdf:type. түрі: синтаксис-НС # түрі жиі RDF қысқартылған отыр.

An RDF statement can be serialized in different formats. An RDF мәлімдеме түрлі форматтарда сериалдарға болады. The most com- Ең ком-

mon formats are RDF/XML Дс форматтары RDF / XML болып табылады

2 2

, N3 , N3

3 3

, N-triples , N-үштік

4 4

and Turtle және Turtle

5 5

. . The first is an XML алдымен XML болып табылады

format. пішім. In this way RDF inherits all the advantages about the syntax interop- Осылайша RDF синтаксисі туралы барлық артықшылықтарын иеленеді interop-

erability of XML. XML мен байланысу. However RDF is independent by XML and can be represented Алайда RDF XML тәуелсіз болып табылады және ұсынылуы мүмкін

in other formats that share nothing with XML (like N3 or N-Triples) [22 ]. (N3 немесе N-үштік сияқты) XML ештеңе ортақ басқа да форматтарда [22 ]. Below Төменде

we report a small example of the same RDF information encoded in different Біз әр түрлі кодталған бірдей RDF ақпарат шағын мысал есеп

formats. форматтары.

RDF/XML: RDF / XML:

<rdf:Description rdf:about="http://www.student.vu.nl/jui200"> <RDF: Сипаттама RDF: шамамен = «http://www.student.vu.nl/jui200»>

<hasName>Jacopo Urbani</hasName> <HasName> Якопо URBANI </ hasName>

</rdf:Description> </ RDF: Сипаттама>

1 1

http://www.w3.org/TR/PR-rdf-syntax/ http://www.w3.org/TR/PR-rdf-syntax/

2 2

http://www.w3.org/TR/rdf-syntax-grammar/ http://www.w3.org/TR/rdf-syntax-grammar/

3 3

http://www.w3.org/DesignIssues/Notation3 http://www.w3.org/DesignIssues/Notation3

4 4

http://www.w3.org/TR/rdf- testcases/#ntriples http://www.w3.org/TR/rdf- testcases / # ntriples

5 5

http://www.w3.org/TeamSubmission/turtle/ http://www.w3.org/TeamSubmission/turtle/

Page 13 Page 13

2.4. 2.4. RDF SCHEMA RDF SCHEMA

13 13

N-Triples: N-бөлмелі:

<http://www.student.vu.nl/jui200> <Http://www.student.vu.nl/jui200>

<hasName> <HasName>

"Jacopo Urbani" . «Якопо URBANI».

An RDF document is made by a set of statements. An RDF құжат есептілік жиынтығы арқылы жүзеге асырылады. Using RDF Schema RDF схемасын пайдалану

we are able to define a vocabulary over the data model providing a form of біз нысанын қамтамасыз деректер үлгісіне астам сөздік қорын анықтау мүмкіндігі бар

semantics that is accessible at a machine level. машина деңгейде қол жетімді семантикасы.

2.4 RDF Schema 2.4 RDF схемасы

As we have seen before, RDF is a standard language that allows us to encode the Біз бұрын көргеніміздей, RDF бізге кодтау мүмкіндік беретін стандартты тілі болып табылады

information using statements made of triples. үштіктің жасалған мәлімдеме арқылы ақпарат. The RDF Schema (abbreviated RDF схемасы (қысқартылған

RDFS) is an extension of RDF that allows the users to define the vocabulary RDFS) пайдаланушылар лексикасын анықтауға мүмкіндік береді RDF жалғасы болып табылады

used in RDF documents [ 2 ]. RDF құжаттар [пайдаланылатын 2 ]. Through RDF Schema we are able to define some RDF схемасының арқылы біз кейбір анықтау мүмкіндігі бар

special relations between the resources which have a unique meaning. бірегей мағынасы бар ресурстар арасындағы ерекше қарым-қатынас. One Бір

example is “rdfs:subClassOf”. мысал: «subClassOf rdfs» болып табылады. To explain better let's take the two statements Жақсы түсіндіру екі есептілік алайық

Person rdfs:subClassOf LivingCreature . Тұлға rdfs: subClassOf LivingCreature.

Alice rdf:type Person. Алиса RDF: түрі тұлға.

The first statement uses a special RDFS predicate which has the unique бірінші мәлімдеме бірегей бар арнайы RDFS предикат пайдаланады

meaning “being a subclass of”. «тармағы болып табылатын» дегенді білдіреді. Since the meaning is unique the machines are Мағынасы бірегей болғандықтан машиналар

able to manipulate the information according to a certain logic. белгілі бір қисынға сәйкес ақпаратты басқару үшін қабілетті. In our case Біздің жағдайда

we design an algorithm that, according to certain rules, is able to infer new біз белгілі бір ережелерге сәйкес, жаңа қорытынды қабілетті, алгоритм жобалау

information. ақпарат.

The meaning is not context dependent. мағынасы контекст тәуелді емес. If the RDFS statements (for ex- RDFS есептілігі (ру үшін болса,

ample that ones that define subclasses) are exchanged between two different ішкі сыныптарды анықтау бауырластар) екі түрлі алмасатын деп мол

applications they will still keep their meaning because “is subclass of” is a re- бір қайта болып табылады «сыныбында» болғандықтан, қосымшалар, олар әлі де өз мағынасын сақтап қалады

lation that is domain independent. домен тәуелсіз халық. This feature is a step towards the semantic Бұл функция семантикалық қадам

interoperability aimed by the Semantic Web [ 22] . Семантикалық Web арқылы бағытталған өзара әрекеттесу [ 22] .

2.4.1 RDFS reasoning 2.4.1 RDFS пайымдау

In the example reported right above we can derive that Alice is a living creature Оң Жоғарыда хабарлады мысалда біз Алиса тірі жаратылыс деп алуға болады

using the relation “subClassOf”. байланыс пайдалана отырып, «subClassOf». This means we can exploit some of the RDFS Бұл біз RDFS кейбір пайдалануға болады дегенді білдіреді

constructs to derive new information. жаңа ақпаратты алу үшін растырады.

Recalling what said in section 2.1 , for us doing some reasoning means con- Бөлімінде айтқан сөздерін еске сала отырып , 2.1 АҚШ-тың кейбір пайымдау істеу үшін, мердігер білдіреді

tinuously apply some rules on the input data. үздіксіз кіру мәліметтері бойынша, кейбір ережелерді қолданады. In case the input is encoded Жағдайда кіріс кодталған

using the RDFS constructs there are 14 different rules we can use to infer new RDFS пайдаланып біз жаңа қорытынды үшін пайдалануға болады 14 түрлі ережелер бар құрылысын

information [ 8] . ақпарат [ 8] . The rules are available on the web Ереже веб қол жетімді

6 6

but since during this thesis бірақ, өйткені бұл диссертация барысында

we will often refer to them we report them also in table 2.1. Біз көбіне кестеде сондай-ақ, оларды есеп оларға қараңыз 2.1.

6 6

http://www.w3.org/TR/rdf-mt/#RDFSRules http://www.w3.org/TR/rdf-mt/#RDFSRules

Page 14 Page 14

14 14

CHAPTER 2. BACKGROUND 2-тарау АНЫҚТАМА

Number If... Егер саны ...

then... содан кейін ...

1 1

spo (where o is a literal) SPO (O мағынада болып табылады)

: n rdf:type rdfs:Literal : N RDF: түрі rdfs: әріптік

2 2

s rdfs:domain x с rdfs: домен х

u rdf:type x U RDF: түрі X

usy usy

3 3

p rdfds:range o P rdfds: диапазоны O

v rdf:type o V RDF: түрі O

spv SPV

4a 4a

spo SPO

s rdf:type rdfs:Resource с RDF: түрі rdfs: Ресурс

4b 4b

spo SPO

o rdf:type rdfs:Resource O RDF: түрі rdfs: Ресурс

5 5

p rdfs:subPropertyOf p1 P rdfs: subPropertyOf p1

p rdfs:subPropertyOf p2 P rdfs: subPropertyOf P2

p1 rdfs:subPropertyOf p2 p1 rdfs: subPropertyOf P2

6 6

p rdf:type rdf:Property P RDF: түрі RDF: Жылжымайтын мүлік

p rdfs:subPropertyOf p P rdfs: subPropertyOf P

7 7

spo SPO

s p1 o с p1 O

p rdfs:subPropertyOf p1 P rdfs: subPropertyOf p1

8 8

s rdf:type rdfs:subClassOf с RDF: түрі rdfs: subClassOf

s rdfs:subClassOf rdfs:Resource с rdfs: subClassOf rdfs: Ресурс

9 9

c rdfs:subClassOf c1 C rdfs: subClassOf C1

v rdf:type c1 V RDF: түрі C1

v rdf:type c V RDF: түрі C

10 10

u rdf:type rdfs:Class U RDF: түрі rdfs: Class

u rdfs:subClassOf u U rdfs: subClassOf U

11 11

c rdfs:subClassOf c1 C rdfs: subClassOf C1

c rdfs:subClassof c2 C rdfs: subClassof c2

c1 rdfs:subClassOf c2 С1 rdfs: subClassOf c2

12 12

s rdf:type rdfs:ContainerMembershipProperty s rdfs:subPropertyOf rdfs:member с RDF: түрі rdfs: ContainerMembershipProperty с rdfs: subPropertyOf rdfs: мүшесі

13 13

s rdf:type rdfs:Datatype с RDF: түрі rdfs: дерек түрлерінің

s rdfs:subClassOf rdfs:Literal с rdfs: subClassOf rdfs: әріптік

Table 2.1: RDFS reasoning rules 2.1-кесте: RDFS пайымдаулар ережелері

Page 15 Page 15

2.5. 2.5. OWL OWL

15 15

During the implementation a particular attention was put in every single Жүзеге асыру барысында белгілі бір назар әрбір отырғызды

rule, trying to optimize the execution of the ruleset in order to speedup the жеделдету мақсатында Ruleset орындалуын оңтайландыру үшін тырысып ереже,

computation. есептеу.

2.5 OWL 2.5 OWL

With RDF Schema it is possible to define only relations between the hierarchy RDF схемасымен ол иерархиясының арасындағы қарым-қатынастарды тек анықтауға болады

of the classes and property, or define the domain and range of these properties. сыныптар мен мүлікті, немесе осы қасиеттерін доменін және ауқымын анықтайды.

The scientific community needed a language that could be used for more complex ғылыми қоғамдастықтың неғұрлым кешені үшін пайдаланылуы мүмкін тілін қажет

ontologies and therefore they started to work on a richer language that would сондықтан онтология және олар осы еді бай тілінде жұмыс істей бастады

be later released as the OWL language [ 22] . кейінірек OWL тілі ретінде [босаған 22] .

The language OWL was standardized by W3C on 2001 тіл OWL 2001 W3C стандартталған болды

7 7

. . OWL is a merge OWL біріктіру болып табылады

of two not-standardized languages DAML [1 0] and OIL [6]. Екі стандартталған емес тілдер DAML [1 0] және мұнай [6]. OWL falls into the OWL түсіп

category of ontology languages. онтология тілдерді санаты. These are languages that we can use to formally Бұл біз формальды үшін пайдалана аласыз тілдері

express a particular domain. Белгілі бір домен білдіреміз.

OWL is built upon RDF and therefore the two languages share the same OWL RDF бойынша салынған, сондықтан екі тілдері бірдей ортақ

syntax. Синтаксис. An OWL document can be seen as a RDF document with some specific Үкі құжат кейбір нақты бар RDF құжаты ретінде көруге болады

OWL constructs. OWL конструкциялары. However, a complete compatibility between OWL and RDF Алайда OWL мен RDF арасындағы толық үйлесімділік

brings some problems concerning the reasoning and this is due to the high пайымдау қатысты кейбір мәселелерді әкеледі және осы жоғары түсіндіріледі

express ability of the RDF primitives. RDF примитивов қабілетін білдіреміз.

To fix this the standardization group derived three different versions of OWL Бұл түзету үшін стандарттау топ үкінің үш түрлі нұсқаларын алынған

that enclose each others. әрбір өзгелерді қоса. These versions are called OWL Full, OWL DL, OWL Бұл нұсқалар OWL толық, үкі DL, үкі деп аталады

Lite [ 22] . Lite [ 22] .

OWL Full corresponds to the full specification of the OWL language. OWL Толық OWL тілінің толық спецификациясы сәйкес келеді. In Жылы

OWL Full there is a complete compatibility with RDF but this comes at the OWL Толық RDF толық үйлесімділік бар, бірақ бұл ретте келеді

price of computational intractably. Есептеу intractably бағасы. Said in simpler words it is impossible to Қарапайым сөздерінде ол мүмкін емес

write a complete and efficient reasoner for OWL Full because this problem is Бұл проблема болып табылады, өйткені OWL толық толық және тиімді reasoner жазу

simply undecidable and therefore not implementable by a computer algorithm. жай разрешима, сондықтан компьютер алгоритмі орындау емес.

To solve this problem of intractability two smaller subsets of OWL Full were Неурегулированность осы мәселені шешу үшін OWL толық екі кіші жиындар болды

standardized for which it is possible to implement an efficient form of reasoning стандартталған ол пікірлерден тиімді формасын іске асыру мүмкіндігі бар, ол үшін

[27 ]. [27 ]. These two languages are OWL DL and OWL Lite. Бұл екі тілдерді OWL DL және үкінің Lite болып табылады.

OWL DL and OWL Lite are less expressible than OWL Full and not com- OWL DL және үкінің Lite OWL толық кем білдіруге болып табылады және іс жүзінде жоқ

pletely compatible with RDF. RDF бірге толық үйлесімді. However, the big advantage of these smaller lan- Бірақ осы аз тілдерде, үлкен артықшылығы

guages is that they permit a feasible reasoning. жазылған, олар мүмкін пайымдау рұқсат болып табылады. The three languages are one үш тілде бірі болып табылады

subset of the other. басқа жиын.

The main difference between OWL and RDF/RDFS stands on the much OWL және RDF / RDFS арасындағы негізгі айырмашылық көп тұр

higher expressiveness that we can reach with OWL [ 22 ]. біз OWL [бірге жетуі мүмкін, бұл жоғары айқындығымен 22 ]. Two consequences of Екі салдары

having an higher expressiveness are that the reasoning is much more sophisti- Егер жоғары мәнерлі бар ой жүгірту әлдеқайда күрделі екенін бар

cated but also much more difficult to implement in an efficient way. ілетін, сондай-ақ әлдеқайда қиын тиімді жолмен жүзеге асыру.

2.5.1 OWL reasoning 2.5.1 OWL пайымдау

Most of the OWL data present in the web is OWL Full. Веб OWL деректер қазіргі Ең OWL толы. Even the most common Тіпті ең көп таралған

ontologies violate some of the assumptions made in OWL DL [11 ]. онтология OWL DL жасалған болжамдарды кейбір бұзатын [11 ]. However Дегенмен

7 7

http://www.w3.org/TR/owl-features/ http://www.w3.org/TR/owl-features/

Page 16 Page 16

16 16

CHAPTER 2. BACKGROUND 2-тарау АНЫҚТАМА

reasoning over OWL Full is an undecidable problem and rule-based semantics OWL толық астам пайымдау бар разрешима проблема және ереже негізіндегі семантикасы

for OWL Full are (yet) not known [ 27] . OWL толық (әлі) белгілі емес [табылады 27] .

Herman J. ter Horst considered a small fragment of OWL and proposed in Герман J. су Хорст үкінің шағын фрагменті болып саналады және ұсынылған

[27 ] a non-standard semantics called the pD∗ semantics. [27 ] стандартты емес семантикасы PD * семантикасын шақырды. The fragment pD∗ has PD фрагменті * бар

a semantics that is weaker than the standard OWL Full semantics but in pD∗ стандартты OWL толық семантикасын қарағанда, бірақ PD әлсіз болып семантикасы *

the computation of the closure has a low complexity (NP or P in a special case) жабу есептеу төмен күрделілігі (арнайы жағдайда НП немесе P) бар

and can be expressed with a set of rules like RDFS. және RDFS сияқты ережелер жиынтығымен білдірді болады.

These rules are more complex than RDFS because they require multiple Олар бірнеше талап, өйткені Бұл ережелер RDFS аса күрделі болып табылады

joins over the data, or joins between two instance data. деректерді қосылады, немесе екі данасы деректер арасындағы қосылады. Since we will mention Біз атап бері

the OWL rules many times during this paper, we will report them in table 2.2. OWL осы қағаз кезінде талай рет ережелер, біз кестенің оларды есеп береді 2.2.

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]