
|
|
|
|
Wydział* |
Zarządzania i Administracji |
Katedra* |
Katedra Informatyka |
|
|
Rok akademicki |
2014/2015 |
Semestr* |
zimowy (I) |
|
|
Student |
Vasylyna Deshchakivska |
Nr albumu |
17837 |
Grupa** |
3 ITD GPrl01 |
|
|
Przedmiot** |
Sztuczna inteligencja |
Prowadzący** |
dr inż. Andrzej Burda |
|
|
Temat |
Yeast Data Set |
Spis treści
Cel projektu………………………………………………………………………………..3
Opis bazy informacyjnej…………………………………………………………………..3-4
Opis użytej metody/algorytmu…………………………………………………………….4-5
Wyniki eksperymentu …………………………………………………………………….5-9
Omówienie uzyskanych wyników…………………………………………………….......10
Wnioski……………………………………………………………………………………10-11
Cel projektu:
Celem naszego projektu jest tworzenie reguł wnioskowania przy pomocy sieci przekonań Bayesowskie , formalnie taka sieć jest modelowana za pomocą skierowanego grafu acyklicznego, w którym wierzchołki reprezentują zdarzenia, a łuki związki przyczynowe pomiędzy tymi zdarzeniami, celem projektu jest : analiz algorytmu, przedstawienie problemu decyzyjnego przygotowania zbiorów: uczącego i testowego. Wygenerowanie reguł i ich ocen.
Opis bazy informacyjnej:
Baza informacyjna składa się z zbioru który zawiera w sobie 148 przypadków. Bazę informacyjną podziel na 2 podzbiory: uczący i testujący. Zadanie wykonane było w Excelu: losowo uporządkowane dane, następnie początkowy przypadki wykorzystano było do utworzenia podzbioru uczącego (92) , a pozostałe (55) do testującego. Plik był zapisany w przyjętym rozszerzeniu *tab. Plik ujmujący dane o badanych obiektach reprezentuje domyślną tablicę decyzji. Ciało pliku rozpoczyna linia sterująca, , deklarująca liczbę, typ oraz rodzaj atrybutów. W naszym przypadku wszystkie atrybuty opisujące (zmienne niezależne, tutaj 8) są numeryczne, (n), zaś zmienna zależna (atrybut decyzyjny, tylko 1 ), (d), jest umieszczony w skrajnej, prawej kolumnie tablicy. Kolejnym elementem struktury pliku z danymi jest lista nazw atrybutów, ujęta w nawiasach kwadratowych, ([…]).
Ocenianie podzbioru uczącego:
Opis użytej metody/algorytmu:
Sieci bayesowskie to jedna z metod reprezentowania i odkrywania wiedzy oparta na rachunku prawdopodobieństwa. Prawdopodobieństwo bezwarunkowe (a priorii)określa liczbowo szansę wystąpienia jakiegoś zjawiska, gdy nie są znane żadne okoliczności związane z tym zjawiskiem. Prawdopodobieństwo warunkowe (a posteriori) P(A│B) jest to prawdopodobieństwo zdarzenia A obliczane tylko w sytuacjach, w których zaszło zdarzenie B. Prawdopodobieństwo wyraża się wzorem:
Prawdopodobieństwo warunkowym musimy posługiwać się, kiedy
chcemy wyliczyć prawdopodobieństwo jakiegoś zdania i posiadamy
wiedzą o innych zdaniach zależnych. P(A) jest poprawnym
prawdopodobieństwem zdarzenia A o ile nie posiadamy żadnej wiedzy.
Jeżeli wiemy że zachodzi jeszcze B, to poprawnym
prawdopodobieństwem zdarzenia A jest
,
jeżeli wiemy że zachodzi jeszcze C to poprawnym
prawdopodobieństwem jest:
Sieć
Bayesowska służy do przedstawiania zależności pomiędzy
zdarzeniami bazując na rachunku
prawdopodobieństwa. Klasycznym przykładem
jest reprezentowanie zależności pomiędzy symptomami a
chorobą.
Sieć Bayesowska to acykliczny (nie zawierający cykli) graf skierowany, w którym znajduje się:
• węzły reprezentują zmienne losowe (np. temperaturę jakiegoś źródła, cechę obiektu itp.)
• łuki (skierowane) reprezentują zależność typu „ zmienna X ma bezpośredni wpływ na zmienna Y”,
• każdy węzeł X ma stowarzyszona z nim tablice prawdopodobieństw warunkowych określających wpływ wywierany na X przez jego poprzedników (rodziców) w grafie,
• Zmienne reprezentowane przez węzły przyjmują wartości dyskretne (np.: TAK, NIE).