Lista zadań

Transkrypt

Lista zadań
Marcin Wilczewski, Zadania. Zaawansowane techniki platformy .NET
Uwagi ogólne do zadań 3-6
• Konieczne jest stworzenie bazy danych przeznaczonych do czytania przez aplikację.
• Wymiar danych nie jest ograniczony od góry.
Propozycje zadań do rozwiązania
1. (15) Aplikacja służąca do importu do bazy danych plików w formacie XLS/XLSX spełniających określone kryteria (format danych). Aplikacja powinna pozwalać na ładowanie
pliku określającego wzorzec — szablon dokumentu (szablonem mógłby być sam plik excelowy lub plik konfiguracyjny). Aplikacja powinna móc wskazywać konkretny plik zawierający dane przeznaczone do importu do bazy danych. Dodatkowym zadaniem aplikacji
jest weryfikacja zgodności konkretnego pliku (zawierającego dane) z wzorcem oraz import
danych do zadanej tabeli w przypadku zgodności.
Definicja wzorca może zawierać takie zmienne jak: liczba i nazwa kolumn, typy danych
dopuszczalne w poszczególnych kolumnach, zakres wartości w poszczególnych kolumnach,
liczbę dopuszczalnych rekordów, zależności pomiędzy wartościami w poszczególnych kolumnach. Zdefiniowanie reguł wzorca powinno pozwolić odrzucać pliki, które nie spełniają
reguł.
2. (10+) Aplikacja implementująca algorytmy wykrywania/detekcji ruchu na scenie. W tym
przypadku poza najprostszym algorytmem konieczny jest krótki przegląd literatury tematu i implementacja najciekawszych algorytmów.
3. (10) Aplikacja implementująca wybrane algorytmy konstrukcji drzew decyzyjnych dla
dowolnego zbioru danych (ID3, C.4.5, metody eksploracji danych).
4. (15) Wykorzystanie metod automatycznej klasyfikacji do rozpoznawania obrazów (CBIR).
W tym przypadku podstawową techniką jest naiwny klasyfikator Bayesa. Do rozwiązania
pozostaje problem ustalenia zbioru atrybutów jakimi należy opisać obraz cyfrowy, tak by
jakość klasyfikacji była jak najlepsza. Możliwy jest wybór innych metod klasyfikacji.
5. (20) Stworzenie aplikacji rozwiązującej problem podany poniżej:
(a) jest dana struktura bazodanowa — zestaw baz danych i tabel,
(b) aplikacja powinna pozwalać na eksport do pliku o określonym formacie (xls, csv, txt)
danych spełniających określone kryteria,
(c) kryteria wyboru danych nie są znane a priori,
(d) aplikacja powinna pozwalać na zarządzanie kryteriami (dodawanie, usuwanie, redefiniowanie),
(e) liczba kryteriów nie jest ograniczona od góry i jest ściśle związana ze strukturą bazodanową,
(f) aplikacja powinna pozwalać na dowolną strukturę kryteriów (dowolne zagnieżdżanie
kryteriów oraz dowolne operowanie spójnikami logicznymi),
(g) aplikacja powinna posiadać element tekstowy/graficzny w którym prezentowana byłaby
struktura aktualnie wybranych kryteriów,
6. (10+) Wykorzystanie metod analizy skupień (klasteryzacja danych) do eksploracji danych
dla dowolnych danych. Wykorzystanie metody K-means + co najmniej jeden dodatkowy
algorytm.
1
7. 10+ Budowa crawlera internetowego — aplikacji do indeksowania stron w internecie.
Aplikacja może być pierwszym etapem do budowy systemu wyszukiwania dokumentów
tekstowych (algorytmy wyszukiwania tekstu, text mining).
2

Podobne dokumenty