| 
	|
  | 
	|
Wydział*  | 
		Zarządzania i Administracji  | 
	
Katedra*  | 
		Katedra Informatyka  | 
	
  | 
	|
Rok akademicki  | 
		2014/2015  | 
	
Semestr*  | 
		zimowy (I)  | 
	
  | 
	|
Student  | 
		Vasylyna Deshchakivska  | 
	
Nr albumu  | 
		17837  | 
	
Grupa**  | 
		3 ITD GPrl01  | 
	
  | 
	|
Przedmiot**  | 
		Sztuczna inteligencja  | 
	
Prowadzący**  | 
		dr inż. Andrzej Burda  | 
	
  | 
	|
Temat  | 
		Yeast Data Set  | 
	
Spis treści
Cel projektu………………………………………………………………………………..3
Opis bazy informacyjnej…………………………………………………………………..3-4
Opis użytej metody/algorytmu…………………………………………………………….4-5
Wyniki eksperymentu …………………………………………………………………….5-9
Omówienie uzyskanych wyników…………………………………………………….......10
Wnioski……………………………………………………………………………………10-11
Cel projektu:
Celem naszego projektu jest tworzenie reguł wnioskowania przy pomocy sieci przekonań Bayesowskie , formalnie taka sieć jest modelowana za pomocą skierowanego grafu acyklicznego, w którym wierzchołki reprezentują zdarzenia, a łuki związki przyczynowe pomiędzy tymi zdarzeniami, celem projektu jest : analiz algorytmu, przedstawienie problemu decyzyjnego przygotowania zbiorów: uczącego i testowego. Wygenerowanie reguł i ich ocen.
Opis bazy informacyjnej:
Baza informacyjna składa się z zbioru który zawiera w sobie 148 przypadków. Bazę informacyjną podziel na 2 podzbiory: uczący i testujący. Zadanie wykonane było w Excelu: losowo uporządkowane dane, następnie początkowy przypadki wykorzystano było do utworzenia podzbioru uczącego (92) , a pozostałe (55) do testującego. Plik był zapisany w przyjętym rozszerzeniu *tab. Plik ujmujący dane o badanych obiektach reprezentuje domyślną tablicę decyzji. Ciało pliku rozpoczyna linia sterująca, , deklarująca liczbę, typ oraz rodzaj atrybutów. W naszym przypadku wszystkie atrybuty opisujące (zmienne niezależne, tutaj 8) są numeryczne, (n), zaś zmienna zależna (atrybut decyzyjny, tylko 1 ), (d), jest umieszczony w skrajnej, prawej kolumnie tablicy. Kolejnym elementem struktury pliku z danymi jest lista nazw atrybutów, ujęta w nawiasach kwadratowych, ([…]).
Ocenianie podzbioru uczącego:
	  
	
Opis użytej metody/algorytmu:
Sieci bayesowskie to jedna z metod reprezentowania i odkrywania wiedzy oparta na rachunku prawdopodobieństwa. Prawdopodobieństwo bezwarunkowe (a priorii)określa liczbowo szansę wystąpienia jakiegoś zjawiska, gdy nie są znane żadne okoliczności związane z tym zjawiskiem. Prawdopodobieństwo warunkowe (a posteriori) P(A│B) jest to prawdopodobieństwo zdarzenia A obliczane tylko w sytuacjach, w których zaszło zdarzenie B. Prawdopodobieństwo wyraża się wzorem:
	
	Prawdopodobieństwo warunkowym musimy posługiwać się, kiedy
	chcemy wyliczyć prawdopodobieństwo jakiegoś zdania i posiadamy
	wiedzą o innych zdaniach zależnych. P(A) jest poprawnym 
	prawdopodobieństwem zdarzenia A o ile nie posiadamy żadnej wiedzy.
	Jeżeli wiemy  że zachodzi jeszcze B, to poprawnym
	prawdopodobieństwem zdarzenia A jest 
,
	 jeżeli wiemy że zachodzi jeszcze C to poprawnym
	prawdopodobieństwem jest:
Sieć
	Bayesowska służy do przedstawiania zależności pomiędzy
	zdarzeniami bazując na rachunku
	prawdopodobieństwa. Klasycznym przykładem
	jest reprezentowanie zależności pomiędzy symptomami a
	chorobą.
Sieć Bayesowska to acykliczny (nie zawierający cykli) graf skierowany, w którym znajduje się:
• węzły reprezentują zmienne losowe (np. temperaturę jakiegoś źródła, cechę obiektu itp.)
• łuki (skierowane) reprezentują zależność typu „ zmienna X ma bezpośredni wpływ na zmienna Y”,
• każdy węzeł X ma stowarzyszona z nim tablice prawdopodobieństw warunkowych określających wpływ wywierany na X przez jego poprzedników (rodziców) w grafie,
• Zmienne reprezentowane przez węzły przyjmują wartości dyskretne (np.: TAK, NIE).
