slajdy do wykładu VII - Filip Graliński / UAM

Transkrypt

slajdy do wykładu VII - Filip Graliński / UAM
Filip
Graliński
Inteligentne systemy
informacyjne
Klasyfikacja
Wyszukiwanie
Odkrywanie
wzorców
Inteligentne
systemy
informacyjne
Predykcja
Eksploracja
Opis
Wyszukiwanie
Odkrywanie
wzorców
Inteligentne
systemy
informacyjne
Analiza
skupień
Predykcja
Opis
Klasyfikacja
Regresja
Eksploracja
Wyszukiwanie
Odkrywanie
wzorców
Inteligentne
systemy
informacyjne
Analiza
skupień
Predykcja
Opis
bez nadzoru
Klasyfikacja
z nadzorem
Regresja
Eksploracja
Wyszukiwanie
Odkrywanie
wzorców
Inteligentne
systemy
informacyjne
Eksploracja
Predykcja
Opis
Klasyfikacja
ręczna
statystyczna
regułowa
„Spam”
Spam
Oszustwo
nigeryjskie
„Spam”
Phishing
Łańcuszki
Reklamy
Odkrywanie
wzorców
Inteligentne
systemy
informacyjne
Eksploracja
Predykcja
Opis
Klasyfikacja
k najbliższych
sąsiadów
ręczna
statystyczna
regułowa
ważone kNN
score(c, d) =
X
~ d~0 )
Ic (d 0 ) cos(d,
d 0 ∈Sk (d)
(
0
Ic (d ) =
1, jeśli d 0 należy do c
0, w przeciwnym razie
Odkrywanie
wzorców
Inteligentne
systemy
informacyjne
Eksploracja
Predykcja
Opis
Klasyfikacja
metoda
Rocchio
ręczna
k najbliższych
sąsiadów
statystyczna
regułowa
Odkrywanie
wzorców
Inteligentne
systemy
informacyjne
Eksploracja
Predykcja
Opis
Klasyfikacja
metoda
Rocchio
ręczna
k najbliższych
sąsiadów
naiwny
klasyfikator
bayesowski
statystyczna
regułowa
Odkrywanie
wzorców
Inteligentne
systemy
informacyjne
Eksploracja
Predykcja
Opis
Klasyfikacja
metoda
Rocchio
ręczna
k najbliższych
sąsiadów
wielomianowy
naiwny
klasyfikator
bayesowski
statystyczna
regułowa
P(c|d) ∝ P(c)
Y
1¬k¬nd
P(tk |c)
arg max P̂(c|d) = arg max P̂(c)
c∈C
c∈C
Y
1¬k¬nd
P̂(tk |c)
arg max P̂(c|d) = arg max P̂(c)
c∈C
c∈C
P̂(c) =
Y
1¬k¬nd
Nc
N
P̂(tk |c)
arg max P̂(c|d) = arg max P̂(c)
c∈C
c∈C
P̂(c) =
Y
1¬k¬nd
Nc
N
Tctk + 1
t 0 ∈V (Tct 0 + 1)
P̂(tk |c) = P
P̂(tk |c)
Odkrywanie
wzorców
Inteligentne
systemy
informacyjne
Eksploracja
Predykcja
Opis
Klasyfikacja
ręczna
statystyczna
Bernoulliego
wielomianowy
naiwny
klasyfikator
bayesowski
regułowa
model Bernoulliego
arg max P̂(c|d) = arg max P̂(c)
c∈C
c∈C
Y
ti ∈V
P̂(Ui = ei |c)
model Bernoulliego
arg max P̂(c|d) = arg max P̂(c)
c∈C
c∈C
P̂(Ui = ei |c)
ti ∈V
P̂(Ui = 1|c) =
P̂(Ui = 0|c) =
Y
Nti + 1
N +2
N − Nti + 1
N +2
preview
similar
clients
completely
safer
unsafe
virus
Outlook
MimeOLE
HELO’d
skills
FREEMAIL FROM
Greetings
drug
Huge
LOTS OF MONEY
505
505
377
359
357
357
358
104
87
85
75
74
52
51
49
49
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0,999983
0,999983
0,999977
0,999976
0,999976
0,999976
0,999976
0,999918
0,999902
0,999900
0,999886
0,999885
0,999836
0,999833
0,999826
0,999826
Wybór cech
I
według frekwencji
I
oczekiwana wspólna informacja (MI)
I
test χ2
I
test Fishera
Metoda G. Robinsona
P =1−
s Y
n
(1 − pi )
i∈1,...,n
Q =1−
s Y
n
i∈1,...,n
S=
P −Q
P +Q
pi
Szanowni Państwo,
Szanując Państwa prywatność i zarazem przestrzegając
obowiązujących przepisów (Ustawa z dnia 18 lipca 2002
roku o świadczeniu usług drogą elektroniczną - Dz. U Nr
144, poz.1204) zwracamy się z prośbą o wyrażenie zgody
na przysłanie Państwu naszej oferty dotyczącej
przyczłapów do bulgulatorów.
Wspomnę jedynie, iż jako nowy producent przyczłapów
do bulgulatorów oferujemy atrakcyjne ceny.
Jeżeli jesteście Państwo zainteresowani , bardzo proszę
odpowiedzieć na tę wiadomość, prześlemy wtedy
dokładne informacje dotyczące ww. produktów.
Z poważaniem
więcej niż słowa – CRM114
Tryb Markovian:
Szanując
Szanując Państwa
Szanując [...] prywatność
Szanując Państwa prywatność
Szanując [...] [...] i
Szanując Państwa [...] i
Szanując [...] prywatność i
Szanując Państwa prywatność i
Szanując [...] [...] [...] zarazem
Szanując [...] [...] i zarazem
Szanując [...] prywatność [...] zarazem
Szanując [...] prywatność i zarazem
Szanując Państwa [...] [...] zarazem
Szanując Państwa [...] i zarazem
Szanując Państwa prywatność [...] zarazem
Szanując Państwa prywatność i zarazem
więcej niż słowa – CRM114 (cd.)
Tryb Markovian:
Szanując Państwa
Szanując [...] prywatność
Szanując [...] [...] i
Szanując [...] [...] [...] zarazem
CRM114 – tryby trenowania
I
TET (train everything )
I
TOE (train on errors)
I
SSTTT (single sided thick threshold training )

Podobne dokumenty