Pobierz

Transkrypt

Pobierz
• Uwaga
– normalizacja wektorów wykorzystuje odchylenie standardowe,
które w ogólności moŜe być:
• odchyleniem standardowym populacji: σ = ((1/N)∑i=1..N(xi – µ)2)1/2
– gdzie
» N jest licznością populacji
» µ jest średnią populacji
• odchyleniem standardowym z próby: s = ((1/(n–1))∑i=1..n(xi – m)2)1/2
– gdzie
» n jest licznością próby
» m jest średnią z próby (m = (1/n)∑i=1..nxi)
– dla licznych danych µ ≈ m i σ ≈ s, więc rozróŜnienie to nie
jest istotne; poniŜsze zadania zakładają jednak wykorzystanie
odchylenia standardowego z próby
1
Zadanie 1
• Dokonać normalizacji kolumn macierzy
1
3
1
2
2
2
3
1
3
1
2
3
– Jaką zaleŜność moŜna zaobserwować?
2
Zadanie 2
• Dokonać normalizacji kolumn macierzy
1
2
4
11
2
3
5
12
3
4
6
13
– Jaką zaleŜność moŜna zaobserwować?
3
Zadanie 3
• Dokonać normalizacji kolumn macierzy
1
2
4
10
2
4
8
20
3
6
12
30
– Jaką zaleŜność moŜna zaobserwować?
4
Zadanie 4
• Jaki jest rezultat normalizacji wektora, który był juŜ
normalizowany?
• Czy istnieją wektory, kórych nie moŜna poddawać
normalizacji?
5
Zadanie 5
• Obliczyć normy (dwuwymiarowych) wektorów
–
–
–
–
–
–
[0 0]T
[0 1]T
[1 1]T
[0 2]T
[3 0]T
[3 4]T
6
Zadanie 6
• Obliczyć normy (wielowymiarowych) wektorów
–
–
–
–
–
–
[0 0 0 0]T
[1 1 1 1]T
[0 0 0 1]T
[0 0 0 2]T
[1 2 3 4]T
[4 3 2 1]T
7
Zadanie 7
• Obliczyć odległości pomiędzy (dwuwymiarowymi)
wektorami a i b
–
–
–
–
–
–
a = [0 0]T, b = [0 0]T
a = [1 1]T, b = [1 1]T
a = [0 0]T, b = [0 1]T
a = [0 0]T, b = [1 1]T
a = [1 1]T, b = [2 2]T
a = [1 0]T, b = [1 9]T
8
Zadanie 8
• Obliczyć odległości pomiędzy (wielowymiarowymi)
wektorami a i b
–
–
–
–
–
–
–
a = [0 0 0 0]T, b = [0 0 0 0]T
a = [1 1 1 1]T, b = [1 1 1 1]T
a = [0 0 0 0]T, b = [0 0 0 1]T
a = [0 0 0 0]T, b = [1 1 1 1]T
a = [0 1 2 3]T, b = [1 2 3 4]T
a = [1 2 3 4]T, b = [4 3 2 1]T
a = [0 1 2 3]T, b = [4 3 2 1]T
9
Zadanie 9
• Dana jest macierz 4x3:
10
4
0
20
3
1
30
1
2
40
0
3
• Obliczyć macierz odległości pomiędzy obiektami
reprezentowanymi przez dane zawarte w tej macierzy
– uwaga: poszczególne obiekty są reprezentowane
przez wiersze /wektory wierszowe/ tej macierzy)
• Jaki będzie rozmiar wynikowej macierzy odległości?
10
Zadanie 10
• Dana jest macierz odległości. Jakimi właściwościami tej
macierzy przejawia się fakt, Ŝe odległość δ(a,b) spełnia
warunek
– ∀a,b: δ(a,b) ≥ 0
– ∀a,b: a = b ⇒ δ(a,b) = 0
– ∀a,b: δ(a,b) = 0 ⇒ a = b
– ∀a,b: δ(a,b) = δ(b,a)
– ∀a,b,c: δ(a,c) ≥ δ(a,b) + δ(b,c)
Uwaga:
• drugi i trzeci z powyŜszych warunków „składają” się na aksjomat
∀a,b: (a = b ⇔ δ(a,b) = 0)
• Kiedy wiadomo, Ŝe macierz nie jest macierzą odległości?
11
Zadanie 11
• ZałóŜmy, Ŝe w macierzy z zadania 9 pierwsza kolumna
reprezentowała pewną szerokość obiektu w milimetrach.
PoniŜsza macierz reprezentuje tę szerokość wyraŜoną
w centymetrach.
1
4
0
2
3
1
3
1
2
4
0
3
• Czy ta zmiana jednostki w opisie danych wpłynie
na wartości macierzy odległości?
– a jeŜeli tak, to na które?
12
Zadanie 12
• ZałóŜmy, Ŝe w macierzy z zadania 9 pierwsza kolumna
reprezentowała pewną temperaturę obiektu w stopniach
Celsjusza. PoniŜsza macierz reprezentuje tę
temperaturę wyraŜoną w stopniach Fahrenheita.
50
4
0
68
3
1
86
1
2
104
0
3
• Czy ta zmiana jednostki w opisie danych wpłynie
na wartości macierzy odległości?
– a jeŜeli tak, to na które?
13
Zadanie 13
• Jaka operacja na macierzy danych pozwala na
uniezaleŜnienie wartości powstającej macierzy
odległości od jednostek uŜytych w opisie danych?
– jak przedstawia się macierz odległości obliczona po wykonaniu
tej operacji?
14
Zadanie 14
• Dana jest macierz 4x3:
10
4
0
20
3
1
30
1
2
40
0
3
• Obliczyć macierz kowariancji pomiędzy zmiennymi
reprezentowanymi przez dane zawarte w tej macierzy
– uwaga: poszczególne zmienne są reprezentowane
przez kolumny /wektory kolumnowe/ tej macierzy)
• Jaki będzie rozmiar wynikowej macierzy kowariancji?
15
Zadanie 15
• Dana jest macierz kowariancji. Jakimi właściwościami
tej macierzy przejawia się fakt, Ŝe kowariancja cov(a,b)
spełnia warunek
–
–
–
–
∀a,b: a = b ⇒ cov(a,b) = var(a) = var(b) ≥ 0
∀a,b: a = 0 ⇒ cov(a,b) = cov(b,a) = 0
∀a: cov(a,a) = var(a) = 0 ⇒ a = 0
∀a,b: cov(a,b) = cov(b,a)
• Kiedy wiadomo, Ŝe macierz nie jest macierzą korelacji?
16
Zadanie 16
• ZałóŜmy, Ŝe w macierzy z zadania 14 pierwsza kolumna
reprezentowała pewną szerokość obiektu w milimetrach.
PoniŜsza macierz reprezentuje tę szerokość wyraŜoną
w centymetrach.
1
4
0
2
3
1
3
1
2
4
0
3
• Czy ta zmiana jednostki w opisie danych wpłynie
na wartości macierzy kowariancji?
– a jeŜeli tak, to na które?
17
Zadanie 17
• ZałóŜmy, Ŝe w macierzy z zadania 14 pierwsza kolumna
reprezentowała pewną temperaturę obiektu w stopniach
Celsjusza. PoniŜsza macierz reprezentuje tę
temperaturę wyraŜoną w stopniach Fahrenheita.
50
4
0
68
3
1
86
1
2
104
0
3
• Czy ta zmiana jednostki w opisie danych wpłynie
na wartości macierzy kowariancji?
– a jeŜeli tak, to na które?
18
Zadanie 18
• Jaka operacja na macierzy danych pozwala na
uniezaleŜnienie wartości powstającej macierzy
kowariancji od jednostek uŜytych w opisie danych?
– jak przedstawia się macierz kowariancji obliczona po wykonaniu
tej operacji?
19