PJN - dr inż. Krzysztof Rzecki

Transkrypt

PJN - dr inż. Krzysztof Rzecki
Politechnika Krakowska
im. Tadeusza Kościuszki
Karta przedmiotu
obowiązuje w roku akademickim 2011/2012
Wydział Fizyki, Matematyki i Informatyki
Kierunek studiów: Informatyka
Profil: Ogólnoakademicki
Forma studiów: Stacjonarne
Kod kierunku: I
Stopień studiów: I
Specjalności:
1
Brak specjalności
Przedmiot
Nazwa przedmiotu
Kod przedmiotu
2
Przetwarzanie języka naturalnego
WFMII I o1S F1b 11/12
Kategoria przedmiotu
Przedmioty wybieralne
Liczba punktów ECTS
3
Semestry
7
Rodzaj zajęć, liczba godzin w planie studiów
Semestr
Wykład
7
30
Ćwiczenia
Laboratorium
Laboratorium
Komputerowe
30
Seminarium
Projekt
Politechnika Krakowska im. Tadeusza Kościuszki
3
Cele przedmiotu
Cel 1. Poznanie zagadnień związanych z przetwarzaniem dokumentów tekstowych.
Cel 2. Nauka projektowania algorytmów przetwarzania dokumentów tekstowych.
Cel 3. Praktyka implementacji programów do przetwarzania dokumentów tekstowych.
4
Wymaganie wstępne w zakresie wiedzy, umiejętności i innych
kompetencji
a. Algorytmy i struktury danych, projektowanie
b. Podstawy programowania języków skryptowych (Perl)
5
Efekty kształcenia
EK1. Kompetencje społeczne: Umiejętność pracy w grupie.
EK2. Wiedza: Wiedza z zakresu algorytmów przetwarzania dokumentów tekstowych.
EK3. Umiejętności: Umiejętność projektowania algorytmów i struktur danych do przetwarzania dokumentów tekstowych.
EK4. Umiejętności: Umiejętność implementacji oprogramowania do przetwarzania dokumentów tekstowych.
6
Treści programowe
Lp
W1
W2
W3
W4
W5
W6
W7
W8
W9
W10
W11
W12
W13
W14
W15
Lp
K1
K2
K3
K4
K5
Wykład
Tematyka zajęć
Opis szczegółowy bloków tematycznych
Wprowadzenie do tematyki, podstawowe wiadomości wstępne
Narzędzia i języki programowania w przetwarzaniu dokumentów
Podstawy gramatyki języka polskiego, formalizacja języka
Korpusy tekstowe, Web-crawling, ekstrakcja informacji z tekstu
Analiza statystyczna tekstu w języku polskim, słowa stop i kluczowe
Indeksowanie dokumentów tekstowych, wyszukiwarki internetowe
Analiza leksykalna i algorytmy wyszukiwania wzorca
Słowniki, automaty słownikowe, słowniki wielojęzyczne
Bezkontekstowa analiza morfologiczna tekstu
Kontekst tekstu, technika n-gramów
Algorytmy badania podobieństwa dokumentów tekstowych
Reprezentacja i przedstawianie wiedzy, generowanie tekstu
Podstawy translacji maszynowej tekstu
Systemy i aplikacje do przetwarzania języka naturalnego
Projektowanie aplikacji do przetwarzania i zarządzania wiedzą
Razem
Laboratorium Komputerowe
Tematyka zajęć
Opis szczegółowy bloków tematycznych
Wprowadzenie do języka Perl, wyrażenia regularne.
Zaawansowane typy danych i ich persystencja.
Parsowanie dokumentów tekstowych i analiza leksykalna.
Algorytmy pozyskiwania tekstów i budowy korpusu tekstowego.
Analiza statystyczna korpusu tekstowego.
Strona 2/6
Liczba godzin
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
30
Liczba godzin
2
2
2
2
2
Politechnika Krakowska im. Tadeusza Kościuszki
Lp
K6
K7
K8
K9
K10
K11
K12
K13
K14
K15
7
Laboratorium Komputerowe
Tematyka zajęć
Opis szczegółowy bloków tematycznych
Indekser dokumentów tekstowych, wyszukiwarka dokumentów.
Automaty słownikowe.
Własności stop-listy, algorytm budowy.
Analiza morfologiczna tekstu, lematyzacja bezkontekstowa.
Binaryzacja i wektoryzacja tekstu, wskaźniki dopasowania.
Programowanie dynamiczne i wskaźniki podobieństwa.
Badanie kontekstu informacji, konstrukcja n–gramów.
Reprezentacja wiedzy, generowanie tekstu, odpowiedzi
Projekt i implementacja systemu przetwarzania tekstu.
Testowanie systemu przetwarzania tekstu.
Razem
Liczba godzin
2
2
2
2
2
2
2
2
2
2
30
Narzędzia dydaktyczne
N1. Wykłady
N2. Ćwiczenia laboratoryjne
N3. Praca w grupach
8
Obciążenie pracą studenta
Średnia liczba godzin
na zrealizowanie
aktywności
Forma aktywności
Godziny kontaktowe z nauczycielem akademickim, w tym:
Godziny wynikające z planu studiów
60
Konsultacje przedmiotowe
0
Egzaminy i zaliczenia w sesji
0
Godziny bez udziału nauczyciela akademickiego wynikające z nakładu pracy studenta, w tym:
Przygotowanie się do zajęć, w tym studiowanie zalecanej literatury
10
Opracowanie wyników
10
Przygotowanie raportu, projektu, prezentacji, dyskusji
10
Realizacja zadań programistycznych
10
Sumaryczna liczba godzin dla przedmiotu wynikająca z ca100
łego nakładu pracy studenta
Sumaryczna liczba punktów ECTS dla przedmiotu
3
9
Sposoby oceny
Ocena formująca
F1
F2
F3
Ćwiczenie praktyczne
Sprawozdanie z ćwiczenia laboratoryjnego
Odpowiedź ustna
Ocena podsumowująca
P1
Średnia ważona ocen formujących
Strona 3/6
Politechnika Krakowska im. Tadeusza Kościuszki
Kryteria oceny
Strona 4/6
Politechnika Krakowska im. Tadeusza Kościuszki
Na
Na
Na
Na
Na
Na
ocenę
ocenę
ocenę
ocenę
ocenę
ocenę
2
3
3.5
4
4.5
5
Na
Na
Na
Na
Na
Na
ocenę
ocenę
ocenę
ocenę
ocenę
ocenę
2
3
3.5
4
4.5
5
Na
Na
Na
Na
Na
Na
ocenę
ocenę
ocenę
ocenę
ocenę
ocenę
2
3
3.5
4
4.5
5
Na
Na
Na
Na
Na
Na
ocenę
ocenę
ocenę
ocenę
ocenę
ocenę
2
3
3.5
4
4.5
5
10
Efekt kształcenia 1
Wymagana frekwencja nie mniejsza niż 50%.
Umiejętność wyszukania i wskazania materiału.
Organizacja pracy przez wydzielenie podzadań.
Spójne projektowanie i implementacja.
Czynne uczestnictwo w zajęciach.
Aktywna realizacja ćwiczeń.
Efekt kształcenia 2
Wiedza dotycząca zakresu przedmiotu.
Wiedza dotycząca zagadnień przetwarzania tekstów.
Wiedza dotycząca algorytmów przetwarzania tekstów.
Wiedza dotycząca mechanizmów przetwarzania tekstów.
Wiedza dotycząca budowy systemów przetwarzania tekstów.
Wiedza dotycząca analizy systemów przetwarzania tekstów.
Efekt kształcenia 3
Umiejętność przeanalizowania struktury dokumentu.
Umiejętność zaprojektowania algorytmu parsującego.
Umiejętność zaprojektowania struktury danych dla dokumentu.
Umiejętność zaprojektowania podsystemu analizy statystycznej.
Umiejętność zaprojektowania systemu pozyskiwania danych tekstowych.
Umiejętność zaprojektowania systemu przetwarzania dokumentów.
Efekt kształcenia 4
Umiejętność programowania w języku Perl.
Umiejętność programowania w algorytmów parsujących.
Umiejętność programowania struktur danych dla dokumentów.
Umiejętność programowania, analizy i debugowania programów Perl.
Umiejętność programowania systemu pozyskiwania danych tekstowych.
Umiejętność programowania systemu przetwarzania dokumentów.
Macierz realizacji przedmiotu
Efekt
kształcenia
EK1
Odniesienie
danego efektu
do szczegółowych efektów
zdefiniowanych dla
programu
T2A_K02,
T2A_K03,
T2A_K04,
T2A_K05
Cele
przedmiotu
Cel3
EK2
T2A_W02,
T2A_W07
Cel1
EK3
T2A_U08,
T2A_U09,
T2A_U10
Cel2
Treści
programowe
K1 K2 K3 K4
K5 K6 K7 K8
K9 K10 K11 K12
K13 K14 K15
W1 W2 W3 W4
W5 W6 W7 W8
W9 W10 W11
W12 W13 W14
W15
K1 K2 K3 K4
K5 K6 K7 K8
K9 K10 K11 K12
K13 K14 K15
Strona 5/6
Narzędzia
dydaktyczne
Sposoby oceny
N2 N3
F1 F2 F3
N1
P1
N2 N3
F1 F2 F3
Politechnika Krakowska im. Tadeusza Kościuszki
Efekt
kształcenia
Odniesienie
danego efektu
do szczegółowych efektów
zdefiniowanych dla
programu
EK4
T2A_U17,
T2A_U18,
T2A_U19
11
Cele
przedmiotu
Treści
programowe
Narzędzia
dydaktyczne
Sposoby oceny
Cel3
K1 K2 K3 K4
K5 K6 K7 K8
K9 K10 K11 K12
K13 K14 K15
N2 N3
F1 F2 F3
Wykaz literatury
Literatura podstawowa:
[1] Lubaszewski W. — Słowniki komputerowe I automatyczna ekstrakcja informacji z tekstu, Kraków, 2009,
AGH
[2] Kłopotek M.A. — Inteligentne wyszukiwarki internetowe, Warszawa, 2001, Akademicka Oficyna Wydawnicza Exit
[3] Saloni Z., Świdziński M. — Składnia współczesnego języka polskiego, Warszawa, 2011, PWN
[4] Daciuk J. — Informacje: http://www.eti.pg.gda.pl/jandac/, Internet, 2011, Politechnika Gdańska
[5] Gusfield D. — Algorithms on Strings, Trees, and Sequences: Computer Science and Computational Biology,
Cambridge, 1997, Cambridge University Press
[6] Jurafsky D., Martin J.H. — Speech and language processing, An Introduction to Natural Language Processing, Computational Linguistics and Speech Recognition, New Jersey, 2000, Prentice-Hall
12
Informacje o nauczycielach akademickich
Osoba odpowiedzialna za kartę
Krzysztof Rzecki (kontakt: [email protected])
Osoby prowadzące przedmiot
dr inż. Krzysztof Rzecki (kontakt: [email protected])
13
Zatwierdzenie karty przedmiotu do realizacji
(miejscowość, data)
(odpowiedzialny za przedmiot)
(dziekan)
Przyjmuję do realizacji (data i podpisy osób prowadzących przedmiot)
................................................
Strona 6/6

Podobne dokumenty