Językoznawstwo korpusowe i komputerowe dr Piotr Pęzik

Transkrypt

Językoznawstwo korpusowe i komputerowe dr Piotr Pęzik
Językoznawstwo korpusowe i komputerowe
dr Piotr Pęzik
Umiejętności zdobyte na zajęciach
Przedmiot specjalizacyjny Językoznawstwo korpusowe i komputerowe daje możliwość
gruntownego poznania podstaw teoretycznych oraz zastosowań językoznawstwa
korpusowego w badaniach nad językiem, translatoryce, leksykografii oraz w nauczaniu
języków obcych. Poza podstawami teoretycznymi, zajęcia przygotowują do tworzenia,
anotowania i wykorzystywania korpusów językowych oraz narzędzi do ich przetwarzania.
Uczestnicy zajęć poznają lingwistyczne narzędzia komputerowe oraz podstawy ich
programowania, co z kolei umożliwia samodzielne prowadzenie badań z zakresu
językoznawstwa korpusowego i komputerowego.
Zakres tematyczny
Językoznawstwo korpusowe
a) Teoria i metodologia
o
o
o
o
o
o
o
o
o
o
Racjonalizm i empiryzm w metodologii językoznawczej
Definicje korpusu, rodzaje korpusów (referencyjne, narodowe,
diachroniczne, specjalistyczne, multimedialne, równoległe, porównywalne
i zadaniowe)
Leksykogramatyka, korpusologia sinclairowska
Anotacja lingwistyczna, semantyczna i bibliograficzna korpusów
Podstawy leksykografii ilościowej i statystyki dla korpusologów
(reprezentatywność, prawa Zipfa, Heapsa, analiza frekwencji a istotność
statystyczna na przykładach)
Korpusy narodowe i referencyjne (NKJP, BNC)
Korpusy języka mówionego (PELCRA Spoken)
Korpusy uczniowskie (PLEC)
Zasady użycia technik korpusowych
Frazeologia dystrybucyjna
b) Zastosowania korpusów (przekrojowo)
o
o
o
Korpusy w językoznawstwie:
 Język mówiony
 Semantyka
 Składnia
 Stylistyka
 Historia języka
 Socjolingwistyka i dialektologia
 Pragmatyka, korpusowa analiza dyskursu
Leksykografia i terminologie
Translatoryka, korpusy w warsztacie tłumaczeniowym
o Nauczanie języków
c) Narzędzia
o Narzędzia korpusowe (WordSmith, korpusy w sieci, np. NKJP i BNC)
o Narzędzia CAT (memoQ)
o Narzędzia statystyczne, środowiska informatyczne (Weka, R, podstawy
Apache Lucene)
d) Podstawy programowania
o Podstawy programowania dla językoznawców (Python, NLTK, elementy
języka Java, Groovy)
o Podstawy XML-a i TEI
o Relacyjne bazy danych dla leksykografów i korpusologów (MySQL)
Forma zaliczenia
Zaliczenie z konwersatoriów na podstawie pracy semestralnej z zakresu językoznawstwa
korpusowego oraz testu końcowego.
Forma zajęć
Konwersatoria oraz ćwiczenia w pracowni komputerowej
Wymagania
Wstęp do językoznawstwa
Ocena
2-5
Bibliografia
Biber D., Conrad S., Reppen R. (2008) Corpus Linguistics: Investigating Language Structure
and Use. Cambridge Approaches to Linguistics.
Bird S., Klein E., Loper E. 2009 Natural Language Processing with Python. O'Reilly Media,
Inc.
McEnery T., Wilson A., 1998, Corpus Linguistics. Edinburgh University Press.
Podstawy językoznawstwa korpusowego. 2005. Ed. by Barbara Lewandowska-Tomaszczyk.
Wydawnictwo Uniwersytetu Łódzkiego.
Adam Przepiórkowski, Mirosław Bańko, Rafał L. Górski i Barbara LewandowskaTomaszczyk (red.) Narodowy Korpus Języka Polskiego. Wydawnictwo Naukowe PWN,
Warszawa.