PJN - dr inż. Krzysztof Rzecki
Transkrypt
PJN - dr inż. Krzysztof Rzecki
Politechnika Krakowska im. Tadeusza Kościuszki Karta przedmiotu obowiązuje w roku akademickim 2011/2012 Wydział Fizyki, Matematyki i Informatyki Kierunek studiów: Informatyka Profil: Ogólnoakademicki Forma studiów: Stacjonarne Kod kierunku: I Stopień studiów: I Specjalności: 1 Brak specjalności Przedmiot Nazwa przedmiotu Kod przedmiotu 2 Przetwarzanie języka naturalnego WFMII I o1S F1b 11/12 Kategoria przedmiotu Przedmioty wybieralne Liczba punktów ECTS 3 Semestry 7 Rodzaj zajęć, liczba godzin w planie studiów Semestr Wykład 7 30 Ćwiczenia Laboratorium Laboratorium Komputerowe 30 Seminarium Projekt Politechnika Krakowska im. Tadeusza Kościuszki 3 Cele przedmiotu Cel 1. Poznanie zagadnień związanych z przetwarzaniem dokumentów tekstowych. Cel 2. Nauka projektowania algorytmów przetwarzania dokumentów tekstowych. Cel 3. Praktyka implementacji programów do przetwarzania dokumentów tekstowych. 4 Wymaganie wstępne w zakresie wiedzy, umiejętności i innych kompetencji a. Algorytmy i struktury danych, projektowanie b. Podstawy programowania języków skryptowych (Perl) 5 Efekty kształcenia EK1. Kompetencje społeczne: Umiejętność pracy w grupie. EK2. Wiedza: Wiedza z zakresu algorytmów przetwarzania dokumentów tekstowych. EK3. Umiejętności: Umiejętność projektowania algorytmów i struktur danych do przetwarzania dokumentów tekstowych. EK4. Umiejętności: Umiejętność implementacji oprogramowania do przetwarzania dokumentów tekstowych. 6 Treści programowe Lp W1 W2 W3 W4 W5 W6 W7 W8 W9 W10 W11 W12 W13 W14 W15 Lp K1 K2 K3 K4 K5 Wykład Tematyka zajęć Opis szczegółowy bloków tematycznych Wprowadzenie do tematyki, podstawowe wiadomości wstępne Narzędzia i języki programowania w przetwarzaniu dokumentów Podstawy gramatyki języka polskiego, formalizacja języka Korpusy tekstowe, Web-crawling, ekstrakcja informacji z tekstu Analiza statystyczna tekstu w języku polskim, słowa stop i kluczowe Indeksowanie dokumentów tekstowych, wyszukiwarki internetowe Analiza leksykalna i algorytmy wyszukiwania wzorca Słowniki, automaty słownikowe, słowniki wielojęzyczne Bezkontekstowa analiza morfologiczna tekstu Kontekst tekstu, technika n-gramów Algorytmy badania podobieństwa dokumentów tekstowych Reprezentacja i przedstawianie wiedzy, generowanie tekstu Podstawy translacji maszynowej tekstu Systemy i aplikacje do przetwarzania języka naturalnego Projektowanie aplikacji do przetwarzania i zarządzania wiedzą Razem Laboratorium Komputerowe Tematyka zajęć Opis szczegółowy bloków tematycznych Wprowadzenie do języka Perl, wyrażenia regularne. Zaawansowane typy danych i ich persystencja. Parsowanie dokumentów tekstowych i analiza leksykalna. Algorytmy pozyskiwania tekstów i budowy korpusu tekstowego. Analiza statystyczna korpusu tekstowego. Strona 2/6 Liczba godzin 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 30 Liczba godzin 2 2 2 2 2 Politechnika Krakowska im. Tadeusza Kościuszki Lp K6 K7 K8 K9 K10 K11 K12 K13 K14 K15 7 Laboratorium Komputerowe Tematyka zajęć Opis szczegółowy bloków tematycznych Indekser dokumentów tekstowych, wyszukiwarka dokumentów. Automaty słownikowe. Własności stop-listy, algorytm budowy. Analiza morfologiczna tekstu, lematyzacja bezkontekstowa. Binaryzacja i wektoryzacja tekstu, wskaźniki dopasowania. Programowanie dynamiczne i wskaźniki podobieństwa. Badanie kontekstu informacji, konstrukcja n–gramów. Reprezentacja wiedzy, generowanie tekstu, odpowiedzi Projekt i implementacja systemu przetwarzania tekstu. Testowanie systemu przetwarzania tekstu. Razem Liczba godzin 2 2 2 2 2 2 2 2 2 2 30 Narzędzia dydaktyczne N1. Wykłady N2. Ćwiczenia laboratoryjne N3. Praca w grupach 8 Obciążenie pracą studenta Średnia liczba godzin na zrealizowanie aktywności Forma aktywności Godziny kontaktowe z nauczycielem akademickim, w tym: Godziny wynikające z planu studiów 60 Konsultacje przedmiotowe 0 Egzaminy i zaliczenia w sesji 0 Godziny bez udziału nauczyciela akademickiego wynikające z nakładu pracy studenta, w tym: Przygotowanie się do zajęć, w tym studiowanie zalecanej literatury 10 Opracowanie wyników 10 Przygotowanie raportu, projektu, prezentacji, dyskusji 10 Realizacja zadań programistycznych 10 Sumaryczna liczba godzin dla przedmiotu wynikająca z ca100 łego nakładu pracy studenta Sumaryczna liczba punktów ECTS dla przedmiotu 3 9 Sposoby oceny Ocena formująca F1 F2 F3 Ćwiczenie praktyczne Sprawozdanie z ćwiczenia laboratoryjnego Odpowiedź ustna Ocena podsumowująca P1 Średnia ważona ocen formujących Strona 3/6 Politechnika Krakowska im. Tadeusza Kościuszki Kryteria oceny Strona 4/6 Politechnika Krakowska im. Tadeusza Kościuszki Na Na Na Na Na Na ocenę ocenę ocenę ocenę ocenę ocenę 2 3 3.5 4 4.5 5 Na Na Na Na Na Na ocenę ocenę ocenę ocenę ocenę ocenę 2 3 3.5 4 4.5 5 Na Na Na Na Na Na ocenę ocenę ocenę ocenę ocenę ocenę 2 3 3.5 4 4.5 5 Na Na Na Na Na Na ocenę ocenę ocenę ocenę ocenę ocenę 2 3 3.5 4 4.5 5 10 Efekt kształcenia 1 Wymagana frekwencja nie mniejsza niż 50%. Umiejętność wyszukania i wskazania materiału. Organizacja pracy przez wydzielenie podzadań. Spójne projektowanie i implementacja. Czynne uczestnictwo w zajęciach. Aktywna realizacja ćwiczeń. Efekt kształcenia 2 Wiedza dotycząca zakresu przedmiotu. Wiedza dotycząca zagadnień przetwarzania tekstów. Wiedza dotycząca algorytmów przetwarzania tekstów. Wiedza dotycząca mechanizmów przetwarzania tekstów. Wiedza dotycząca budowy systemów przetwarzania tekstów. Wiedza dotycząca analizy systemów przetwarzania tekstów. Efekt kształcenia 3 Umiejętność przeanalizowania struktury dokumentu. Umiejętność zaprojektowania algorytmu parsującego. Umiejętność zaprojektowania struktury danych dla dokumentu. Umiejętność zaprojektowania podsystemu analizy statystycznej. Umiejętność zaprojektowania systemu pozyskiwania danych tekstowych. Umiejętność zaprojektowania systemu przetwarzania dokumentów. Efekt kształcenia 4 Umiejętność programowania w języku Perl. Umiejętność programowania w algorytmów parsujących. Umiejętność programowania struktur danych dla dokumentów. Umiejętność programowania, analizy i debugowania programów Perl. Umiejętność programowania systemu pozyskiwania danych tekstowych. Umiejętność programowania systemu przetwarzania dokumentów. Macierz realizacji przedmiotu Efekt kształcenia EK1 Odniesienie danego efektu do szczegółowych efektów zdefiniowanych dla programu T2A_K02, T2A_K03, T2A_K04, T2A_K05 Cele przedmiotu Cel3 EK2 T2A_W02, T2A_W07 Cel1 EK3 T2A_U08, T2A_U09, T2A_U10 Cel2 Treści programowe K1 K2 K3 K4 K5 K6 K7 K8 K9 K10 K11 K12 K13 K14 K15 W1 W2 W3 W4 W5 W6 W7 W8 W9 W10 W11 W12 W13 W14 W15 K1 K2 K3 K4 K5 K6 K7 K8 K9 K10 K11 K12 K13 K14 K15 Strona 5/6 Narzędzia dydaktyczne Sposoby oceny N2 N3 F1 F2 F3 N1 P1 N2 N3 F1 F2 F3 Politechnika Krakowska im. Tadeusza Kościuszki Efekt kształcenia Odniesienie danego efektu do szczegółowych efektów zdefiniowanych dla programu EK4 T2A_U17, T2A_U18, T2A_U19 11 Cele przedmiotu Treści programowe Narzędzia dydaktyczne Sposoby oceny Cel3 K1 K2 K3 K4 K5 K6 K7 K8 K9 K10 K11 K12 K13 K14 K15 N2 N3 F1 F2 F3 Wykaz literatury Literatura podstawowa: [1] Lubaszewski W. — Słowniki komputerowe I automatyczna ekstrakcja informacji z tekstu, Kraków, 2009, AGH [2] Kłopotek M.A. — Inteligentne wyszukiwarki internetowe, Warszawa, 2001, Akademicka Oficyna Wydawnicza Exit [3] Saloni Z., Świdziński M. — Składnia współczesnego języka polskiego, Warszawa, 2011, PWN [4] Daciuk J. — Informacje: http://www.eti.pg.gda.pl/jandac/, Internet, 2011, Politechnika Gdańska [5] Gusfield D. — Algorithms on Strings, Trees, and Sequences: Computer Science and Computational Biology, Cambridge, 1997, Cambridge University Press [6] Jurafsky D., Martin J.H. — Speech and language processing, An Introduction to Natural Language Processing, Computational Linguistics and Speech Recognition, New Jersey, 2000, Prentice-Hall 12 Informacje o nauczycielach akademickich Osoba odpowiedzialna za kartę Krzysztof Rzecki (kontakt: [email protected]) Osoby prowadzące przedmiot dr inż. Krzysztof Rzecki (kontakt: [email protected]) 13 Zatwierdzenie karty przedmiotu do realizacji (miejscowość, data) (odpowiedzialny za przedmiot) (dziekan) Przyjmuję do realizacji (data i podpisy osób prowadzących przedmiot) ................................................ Strona 6/6