slajdy do wykładu VII - Filip Graliński / UAM
Transkrypt
slajdy do wykładu VII - Filip Graliński / UAM
Filip Graliński Inteligentne systemy informacyjne Klasyfikacja Wyszukiwanie Odkrywanie wzorców Inteligentne systemy informacyjne Predykcja Eksploracja Opis Wyszukiwanie Odkrywanie wzorców Inteligentne systemy informacyjne Analiza skupień Predykcja Opis Klasyfikacja Regresja Eksploracja Wyszukiwanie Odkrywanie wzorców Inteligentne systemy informacyjne Analiza skupień Predykcja Opis bez nadzoru Klasyfikacja z nadzorem Regresja Eksploracja Wyszukiwanie Odkrywanie wzorców Inteligentne systemy informacyjne Eksploracja Predykcja Opis Klasyfikacja ręczna statystyczna regułowa „Spam” Spam Oszustwo nigeryjskie „Spam” Phishing Łańcuszki Reklamy Odkrywanie wzorców Inteligentne systemy informacyjne Eksploracja Predykcja Opis Klasyfikacja k najbliższych sąsiadów ręczna statystyczna regułowa ważone kNN score(c, d) = X ~ d~0 ) Ic (d 0 ) cos(d, d 0 ∈Sk (d) ( 0 Ic (d ) = 1, jeśli d 0 należy do c 0, w przeciwnym razie Odkrywanie wzorców Inteligentne systemy informacyjne Eksploracja Predykcja Opis Klasyfikacja metoda Rocchio ręczna k najbliższych sąsiadów statystyczna regułowa Odkrywanie wzorców Inteligentne systemy informacyjne Eksploracja Predykcja Opis Klasyfikacja metoda Rocchio ręczna k najbliższych sąsiadów naiwny klasyfikator bayesowski statystyczna regułowa Odkrywanie wzorców Inteligentne systemy informacyjne Eksploracja Predykcja Opis Klasyfikacja metoda Rocchio ręczna k najbliższych sąsiadów wielomianowy naiwny klasyfikator bayesowski statystyczna regułowa P(c|d) ∝ P(c) Y 1¬k¬nd P(tk |c) arg max P̂(c|d) = arg max P̂(c) c∈C c∈C Y 1¬k¬nd P̂(tk |c) arg max P̂(c|d) = arg max P̂(c) c∈C c∈C P̂(c) = Y 1¬k¬nd Nc N P̂(tk |c) arg max P̂(c|d) = arg max P̂(c) c∈C c∈C P̂(c) = Y 1¬k¬nd Nc N Tctk + 1 t 0 ∈V (Tct 0 + 1) P̂(tk |c) = P P̂(tk |c) Odkrywanie wzorców Inteligentne systemy informacyjne Eksploracja Predykcja Opis Klasyfikacja ręczna statystyczna Bernoulliego wielomianowy naiwny klasyfikator bayesowski regułowa model Bernoulliego arg max P̂(c|d) = arg max P̂(c) c∈C c∈C Y ti ∈V P̂(Ui = ei |c) model Bernoulliego arg max P̂(c|d) = arg max P̂(c) c∈C c∈C P̂(Ui = ei |c) ti ∈V P̂(Ui = 1|c) = P̂(Ui = 0|c) = Y Nti + 1 N +2 N − Nti + 1 N +2 preview similar clients completely safer unsafe virus Outlook MimeOLE HELO’d skills FREEMAIL FROM Greetings drug Huge LOTS OF MONEY 505 505 377 359 357 357 358 104 87 85 75 74 52 51 49 49 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0,999983 0,999983 0,999977 0,999976 0,999976 0,999976 0,999976 0,999918 0,999902 0,999900 0,999886 0,999885 0,999836 0,999833 0,999826 0,999826 Wybór cech I według frekwencji I oczekiwana wspólna informacja (MI) I test χ2 I test Fishera Metoda G. Robinsona P =1− s Y n (1 − pi ) i∈1,...,n Q =1− s Y n i∈1,...,n S= P −Q P +Q pi Szanowni Państwo, Szanując Państwa prywatność i zarazem przestrzegając obowiązujących przepisów (Ustawa z dnia 18 lipca 2002 roku o świadczeniu usług drogą elektroniczną - Dz. U Nr 144, poz.1204) zwracamy się z prośbą o wyrażenie zgody na przysłanie Państwu naszej oferty dotyczącej przyczłapów do bulgulatorów. Wspomnę jedynie, iż jako nowy producent przyczłapów do bulgulatorów oferujemy atrakcyjne ceny. Jeżeli jesteście Państwo zainteresowani , bardzo proszę odpowiedzieć na tę wiadomość, prześlemy wtedy dokładne informacje dotyczące ww. produktów. Z poważaniem więcej niż słowa – CRM114 Tryb Markovian: Szanując Szanując Państwa Szanując [...] prywatność Szanując Państwa prywatność Szanując [...] [...] i Szanując Państwa [...] i Szanując [...] prywatność i Szanując Państwa prywatność i Szanując [...] [...] [...] zarazem Szanując [...] [...] i zarazem Szanując [...] prywatność [...] zarazem Szanując [...] prywatność i zarazem Szanując Państwa [...] [...] zarazem Szanując Państwa [...] i zarazem Szanując Państwa prywatność [...] zarazem Szanując Państwa prywatność i zarazem więcej niż słowa – CRM114 (cd.) Tryb Markovian: Szanując Państwa Szanując [...] prywatność Szanując [...] [...] i Szanując [...] [...] [...] zarazem CRM114 – tryby trenowania I TET (train everything ) I TOE (train on errors) I SSTTT (single sided thick threshold training )