Pobierz
Transkrypt
Pobierz
• Uwaga – normalizacja wektorów wykorzystuje odchylenie standardowe, które w ogólności moŜe być: • odchyleniem standardowym populacji: σ = ((1/N)∑i=1..N(xi – µ)2)1/2 – gdzie » N jest licznością populacji » µ jest średnią populacji • odchyleniem standardowym z próby: s = ((1/(n–1))∑i=1..n(xi – m)2)1/2 – gdzie » n jest licznością próby » m jest średnią z próby (m = (1/n)∑i=1..nxi) – dla licznych danych µ ≈ m i σ ≈ s, więc rozróŜnienie to nie jest istotne; poniŜsze zadania zakładają jednak wykorzystanie odchylenia standardowego z próby 1 Zadanie 1 • Dokonać normalizacji kolumn macierzy 1 3 1 2 2 2 3 1 3 1 2 3 – Jaką zaleŜność moŜna zaobserwować? 2 Zadanie 2 • Dokonać normalizacji kolumn macierzy 1 2 4 11 2 3 5 12 3 4 6 13 – Jaką zaleŜność moŜna zaobserwować? 3 Zadanie 3 • Dokonać normalizacji kolumn macierzy 1 2 4 10 2 4 8 20 3 6 12 30 – Jaką zaleŜność moŜna zaobserwować? 4 Zadanie 4 • Jaki jest rezultat normalizacji wektora, który był juŜ normalizowany? • Czy istnieją wektory, kórych nie moŜna poddawać normalizacji? 5 Zadanie 5 • Obliczyć normy (dwuwymiarowych) wektorów – – – – – – [0 0]T [0 1]T [1 1]T [0 2]T [3 0]T [3 4]T 6 Zadanie 6 • Obliczyć normy (wielowymiarowych) wektorów – – – – – – [0 0 0 0]T [1 1 1 1]T [0 0 0 1]T [0 0 0 2]T [1 2 3 4]T [4 3 2 1]T 7 Zadanie 7 • Obliczyć odległości pomiędzy (dwuwymiarowymi) wektorami a i b – – – – – – a = [0 0]T, b = [0 0]T a = [1 1]T, b = [1 1]T a = [0 0]T, b = [0 1]T a = [0 0]T, b = [1 1]T a = [1 1]T, b = [2 2]T a = [1 0]T, b = [1 9]T 8 Zadanie 8 • Obliczyć odległości pomiędzy (wielowymiarowymi) wektorami a i b – – – – – – – a = [0 0 0 0]T, b = [0 0 0 0]T a = [1 1 1 1]T, b = [1 1 1 1]T a = [0 0 0 0]T, b = [0 0 0 1]T a = [0 0 0 0]T, b = [1 1 1 1]T a = [0 1 2 3]T, b = [1 2 3 4]T a = [1 2 3 4]T, b = [4 3 2 1]T a = [0 1 2 3]T, b = [4 3 2 1]T 9 Zadanie 9 • Dana jest macierz 4x3: 10 4 0 20 3 1 30 1 2 40 0 3 • Obliczyć macierz odległości pomiędzy obiektami reprezentowanymi przez dane zawarte w tej macierzy – uwaga: poszczególne obiekty są reprezentowane przez wiersze /wektory wierszowe/ tej macierzy) • Jaki będzie rozmiar wynikowej macierzy odległości? 10 Zadanie 10 • Dana jest macierz odległości. Jakimi właściwościami tej macierzy przejawia się fakt, Ŝe odległość δ(a,b) spełnia warunek – ∀a,b: δ(a,b) ≥ 0 – ∀a,b: a = b ⇒ δ(a,b) = 0 – ∀a,b: δ(a,b) = 0 ⇒ a = b – ∀a,b: δ(a,b) = δ(b,a) – ∀a,b,c: δ(a,c) ≥ δ(a,b) + δ(b,c) Uwaga: • drugi i trzeci z powyŜszych warunków „składają” się na aksjomat ∀a,b: (a = b ⇔ δ(a,b) = 0) • Kiedy wiadomo, Ŝe macierz nie jest macierzą odległości? 11 Zadanie 11 • ZałóŜmy, Ŝe w macierzy z zadania 9 pierwsza kolumna reprezentowała pewną szerokość obiektu w milimetrach. PoniŜsza macierz reprezentuje tę szerokość wyraŜoną w centymetrach. 1 4 0 2 3 1 3 1 2 4 0 3 • Czy ta zmiana jednostki w opisie danych wpłynie na wartości macierzy odległości? – a jeŜeli tak, to na które? 12 Zadanie 12 • ZałóŜmy, Ŝe w macierzy z zadania 9 pierwsza kolumna reprezentowała pewną temperaturę obiektu w stopniach Celsjusza. PoniŜsza macierz reprezentuje tę temperaturę wyraŜoną w stopniach Fahrenheita. 50 4 0 68 3 1 86 1 2 104 0 3 • Czy ta zmiana jednostki w opisie danych wpłynie na wartości macierzy odległości? – a jeŜeli tak, to na które? 13 Zadanie 13 • Jaka operacja na macierzy danych pozwala na uniezaleŜnienie wartości powstającej macierzy odległości od jednostek uŜytych w opisie danych? – jak przedstawia się macierz odległości obliczona po wykonaniu tej operacji? 14 Zadanie 14 • Dana jest macierz 4x3: 10 4 0 20 3 1 30 1 2 40 0 3 • Obliczyć macierz kowariancji pomiędzy zmiennymi reprezentowanymi przez dane zawarte w tej macierzy – uwaga: poszczególne zmienne są reprezentowane przez kolumny /wektory kolumnowe/ tej macierzy) • Jaki będzie rozmiar wynikowej macierzy kowariancji? 15 Zadanie 15 • Dana jest macierz kowariancji. Jakimi właściwościami tej macierzy przejawia się fakt, Ŝe kowariancja cov(a,b) spełnia warunek – – – – ∀a,b: a = b ⇒ cov(a,b) = var(a) = var(b) ≥ 0 ∀a,b: a = 0 ⇒ cov(a,b) = cov(b,a) = 0 ∀a: cov(a,a) = var(a) = 0 ⇒ a = 0 ∀a,b: cov(a,b) = cov(b,a) • Kiedy wiadomo, Ŝe macierz nie jest macierzą korelacji? 16 Zadanie 16 • ZałóŜmy, Ŝe w macierzy z zadania 14 pierwsza kolumna reprezentowała pewną szerokość obiektu w milimetrach. PoniŜsza macierz reprezentuje tę szerokość wyraŜoną w centymetrach. 1 4 0 2 3 1 3 1 2 4 0 3 • Czy ta zmiana jednostki w opisie danych wpłynie na wartości macierzy kowariancji? – a jeŜeli tak, to na które? 17 Zadanie 17 • ZałóŜmy, Ŝe w macierzy z zadania 14 pierwsza kolumna reprezentowała pewną temperaturę obiektu w stopniach Celsjusza. PoniŜsza macierz reprezentuje tę temperaturę wyraŜoną w stopniach Fahrenheita. 50 4 0 68 3 1 86 1 2 104 0 3 • Czy ta zmiana jednostki w opisie danych wpłynie na wartości macierzy kowariancji? – a jeŜeli tak, to na które? 18 Zadanie 18 • Jaka operacja na macierzy danych pozwala na uniezaleŜnienie wartości powstającej macierzy kowariancji od jednostek uŜytych w opisie danych? – jak przedstawia się macierz kowariancji obliczona po wykonaniu tej operacji? 19