Lista zadań
Transkrypt
Lista zadań
Marcin Wilczewski, Zadania. Zaawansowane techniki platformy .NET Uwagi ogólne do zadań 3-6 • Konieczne jest stworzenie bazy danych przeznaczonych do czytania przez aplikację. • Wymiar danych nie jest ograniczony od góry. Propozycje zadań do rozwiązania 1. (15) Aplikacja służąca do importu do bazy danych plików w formacie XLS/XLSX spełniających określone kryteria (format danych). Aplikacja powinna pozwalać na ładowanie pliku określającego wzorzec — szablon dokumentu (szablonem mógłby być sam plik excelowy lub plik konfiguracyjny). Aplikacja powinna móc wskazywać konkretny plik zawierający dane przeznaczone do importu do bazy danych. Dodatkowym zadaniem aplikacji jest weryfikacja zgodności konkretnego pliku (zawierającego dane) z wzorcem oraz import danych do zadanej tabeli w przypadku zgodności. Definicja wzorca może zawierać takie zmienne jak: liczba i nazwa kolumn, typy danych dopuszczalne w poszczególnych kolumnach, zakres wartości w poszczególnych kolumnach, liczbę dopuszczalnych rekordów, zależności pomiędzy wartościami w poszczególnych kolumnach. Zdefiniowanie reguł wzorca powinno pozwolić odrzucać pliki, które nie spełniają reguł. 2. (10+) Aplikacja implementująca algorytmy wykrywania/detekcji ruchu na scenie. W tym przypadku poza najprostszym algorytmem konieczny jest krótki przegląd literatury tematu i implementacja najciekawszych algorytmów. 3. (10) Aplikacja implementująca wybrane algorytmy konstrukcji drzew decyzyjnych dla dowolnego zbioru danych (ID3, C.4.5, metody eksploracji danych). 4. (15) Wykorzystanie metod automatycznej klasyfikacji do rozpoznawania obrazów (CBIR). W tym przypadku podstawową techniką jest naiwny klasyfikator Bayesa. Do rozwiązania pozostaje problem ustalenia zbioru atrybutów jakimi należy opisać obraz cyfrowy, tak by jakość klasyfikacji była jak najlepsza. Możliwy jest wybór innych metod klasyfikacji. 5. (20) Stworzenie aplikacji rozwiązującej problem podany poniżej: (a) jest dana struktura bazodanowa — zestaw baz danych i tabel, (b) aplikacja powinna pozwalać na eksport do pliku o określonym formacie (xls, csv, txt) danych spełniających określone kryteria, (c) kryteria wyboru danych nie są znane a priori, (d) aplikacja powinna pozwalać na zarządzanie kryteriami (dodawanie, usuwanie, redefiniowanie), (e) liczba kryteriów nie jest ograniczona od góry i jest ściśle związana ze strukturą bazodanową, (f) aplikacja powinna pozwalać na dowolną strukturę kryteriów (dowolne zagnieżdżanie kryteriów oraz dowolne operowanie spójnikami logicznymi), (g) aplikacja powinna posiadać element tekstowy/graficzny w którym prezentowana byłaby struktura aktualnie wybranych kryteriów, 6. (10+) Wykorzystanie metod analizy skupień (klasteryzacja danych) do eksploracji danych dla dowolnych danych. Wykorzystanie metody K-means + co najmniej jeden dodatkowy algorytm. 1 7. 10+ Budowa crawlera internetowego — aplikacji do indeksowania stron w internecie. Aplikacja może być pierwszym etapem do budowy systemu wyszukiwania dokumentów tekstowych (algorytmy wyszukiwania tekstu, text mining). 2