Dodatek – Algorytm k-NN

Transkrypt

Dodatek – Algorytm k-NN
Agnieszka Nowak - Brzezińska
Algorytm k najbliższych sąsiadów (lub
algorytm k-nn z ang. k nearest neighbours)
– jeden z algorytmów regresji nieparametrycznej używanych w
statystyce do prognozowania wartości pewnej zmiennej losowej.
Może również byd używany do klasyfikacji.
-
Założenia
• Dany jest zbiór uczący zawierający obserwacje z których każda
ma przypisany wektor zmiennych objaśniających oraz wartośd
zmiennej objaśnianej Y.
• Dana jest obserwacja C z przypisanym wektorem zmiennych
objaśniających dla której chcemy prognozowad wartośd
zmiennej objaśnianej Y.
Przebieg algorytmu:
1. porównanie wartości zmiennych objaśniających dla obserwacji C z
wartościami tych zmiennych dla każdej obserwacji w zbiorze uczącym.
2. wybór k (ustalona z góry liczba) najbliższych do C obserwacji ze zbioru
uczącego.
3. Uśrednienie wartości zmiennej objaśnianej dla wybranych obserwacji,
w wyniku czego uzyskujemy prognozę.
Przez "najbliższą obserwację" mamy na myśli, taką obserwację, której odległośd do analizowanej przez
nas obserwacji jest możliwie najmniejsza.
Do której klasy przypisać nowy
obiekt ?
1-NN
Najbliższy dla naszego obiektu „buźka” jest obiekt
Więc przypiszemy nowemu obiektowi klasę:
5-NN
Mimo, że najbliższy dla naszego obiektu „buźka” jest obiekt
Metodą głosowania ustalimy, że skoro mamy wziąć pod uwagę 5 najbliższych
sąsiadów tego obiektu, a widać, że 1 z nich ma klasę:
Zaś 4 pozostałe klasę:
To przypiszemy nowemu obiektowi klasę:

Dodatek – Algorytm k-NN

Transkrypt

Podobne dokumenty

macierz symetryczna

Zadania - metoda Hellwiga, 2014

Zadanie 1. W pliku romanse.gdt znajdują się dane - E-SGH

Prognoza - zadania dodatkowe

Ekonometria, 21 listopada 2011 r. Modele ściśle nieliniowe - E-SGH

MIWS_Szacowanie parametrów strukturalnych modelu

Modele ograniczonej zmiennej zależnej Zmienną objaśnianą

MODELE OPISOWE A MODELE TRENDU –KONSTRUKCJA I

Pobierz

Pierwsze kroki w analizie danych

Ćwiczenia I - 26.09.2007 - E-SGH

STATYSTYKA OPISOWA LICZBOWE CHARAKTERYSTYKI(MIARY

Spis treści - Predictive Solutions

Laboratorium 1 - Analiza danych w R 1.1 Wczytaj zbiór danych

opis metody

Laboratorium 6 - Selekcja zmiennych, ogólna hipoteza liniowa 6.1

Ćwiczenia 3

10. Analiza post-optymalizacyjna. Zagadnienie dualizmu, tworzenie

Materiały pomocnicze

Jersey krów rasy

Politechnika Gdańska Wydział Elektrotechniki i Automatyki Katedra

Rozwiazanie_zad6a_ przedl_umowyT=200 - e