APLIKACE UMĚLÉ INTELIGENCE APLIKACE UMĚLÉ INTELIGENCE Ing. Petr Hájek, Ph.D.
Podpora přednášky kurzu Aplikace umělé inteligence
Aplikace umělé inteligence - seminář ING. PETR HÁJEK, PH.D. ÚSTAV SYSTÉMOVÉHO INŽENÝRSTVÍ A INFORMATIKY FAKULTA EKONOMICKO-SPRÁVNÍ UNIVERZITA PARDUBICE
[email protected]
Objevování j znalostí a strojové j učení I y Objevování znalostí (Knowledge Discovery) je možné
definovat jako proces netriviálního dolování implicitních, dosud neznámých a potenciálně užitečných informací z dat. dat y Příkladem znalosti je následující vzorek: IF věk < 25 AND kurs_výchovy_řidičů kurs výchovy řidičů = Ne THEN nehoda = Ano s_pravděpodobností = 0.2. y Tato znalost je ihned srozumitelná a použitelná. Zároveň ji lze l vložit l žit d do ji jiného éh programu ((např. ř expertního t íh systému). y Málokdy platí objevená znalost pro všechna data. Proto je používána míra určitosti C, která určuje míru důvěry, kterou má mít systém nebo uživatel v objevenou znalost. Bez dostatečné míry určitosti jsou vzorky neopodstatněné a nemohou proto být znalostmi.
Objevování j znalostí a strojové j učení II y Cílem Cíl strojového t j éh učení č í je j vypočítat čít t takovou t k funkci f k i ff,
pomocí které bude možné správně klasifikovat jak data použitá pro její výpočet (tzv. (tzv trénovací data), data) tak i další data mimo množinu trénovacích dat (tzv. testovací data). y Metody objevování znalostí mají za úkol jednak identifikovat zajímavé vzorky v datech a jednak je výstižně ý a smysluplně y p p popsat. p Proces identifikace spočívá p ve shlukování záznamů do tříd, které reprezentují vzorky v původních datech. Proces popisu shrnuje důležité vlastnosti identifikovaných tříd. Ve strojovém učení se tyto procesy nazývají učení bez učitele (identifikace) a učení s učitelem (popis). (popis)
Systém y na objevování j znalostí v databázích
Úkolyy I Načtěte data German credit do programového prostředí Weka. Weka http://www.uloz.to/9320007/credit-g-cesky-arff Znázorněte histogramy všech atributů. Z á Znázorněte ět závislosti á i l ti mezii vybranými b ý i atributy t ib t ((použijte žijt zvětšení ětš í grafu a symbolů). y Proveďte selekci atributů (pomocí filtrů – např. založenou na korelacích Chí-kvadrát korelacích, Chí k adrát test testu, atd atd. a wrapperů rapperů – pomocí zvoleného oleného klasifikátoru) a extrakci nových atributů pomocí metody hlavních komponent. y Odstraňte z původní množiny atributů ty, ty které se ukázaly jako statisticky nevýznamné (např. na základě selekce založené na korelacích s vyhledáváním pomocí genetických algoritmů). y Proveďte shlukování vzorků (znázorněte také směrodatné odchylky a porovnejte výsledek se skutečnou klasifikací). y y y y
Úkolyy II y Nastavte N t t matici ti i nákladů ákl dů pro kl klasifikaci. ifik i y Nechte na výstupu zobrazit také predikované hodnoty. y Vyzkoušejte k š j rozdělení děl í na trénovací é í a testovacíí d data v %
poměru a 10-násobnou křížovou validaci. y Použijte P žij rozhodovací h d í strom SimpleCart, Si l C jaké j ké budou b d výsledky při prořezávání stromu a bez něj? Co když použijete jen trénovací data? y Jaké informace dává predikce jednotlivých vzorků? y Použijte P žijt les l náhodných áh d ý h rozhodovacích h d í h stromů. t ů J Jaký ký počet stromů je pro daný problém optimální?
Úkolyy III y Pro dopřednou neuronovou síť typu Perceptron použijte y y y y
grafické uživatelské prostředí. Vyzkoušejte experimenty pro různé počty neuronů ve skryté k é vrstvěě a různé ů é rychlosti hl i učení. č í U RBF neuronové sítě měňte počet neuronů ve skryté vrstvě. vrstvě U SVM měňte parametr komplexnosti, popř. typ jádrové funkce (polynomická, RBF). Odstraňte z množiny atributů kvantitativní atributy a vyzkoušejte si tvorbu asociačních pravidel pomocí apriori algoritmu. Jaké budou výsledky, když se změní parametr podpory a parametr určitosti. Jaký počet pravidel je potřeba nastavit?
Načtení dat
Četnosti atributů
Vizualizace závislostí
Datovýý slovník
Struktura datového souboru
Identifikace tříd
Klasifikační strom
Výsledek ý klasifikace
Objevování Obje o á znalostí a ost po pomocí oc asoc asociačních ač c p pravidel a de
Neuronové sítě
Dopředná p neuronová síť
RBF neuronová eu o o á ssíťť a Support Suppo t Vector ecto Machines ac es
Děkuji za pozornost