Językoznawstwo korpusowe i komputerowe dr Piotr Pęzik
Transkrypt
Językoznawstwo korpusowe i komputerowe dr Piotr Pęzik
Językoznawstwo korpusowe i komputerowe dr Piotr Pęzik Umiejętności zdobyte na zajęciach Przedmiot specjalizacyjny Językoznawstwo korpusowe i komputerowe daje możliwość gruntownego poznania podstaw teoretycznych oraz zastosowań językoznawstwa korpusowego w badaniach nad językiem, translatoryce, leksykografii oraz w nauczaniu języków obcych. Poza podstawami teoretycznymi, zajęcia przygotowują do tworzenia, anotowania i wykorzystywania korpusów językowych oraz narzędzi do ich przetwarzania. Uczestnicy zajęć poznają lingwistyczne narzędzia komputerowe oraz podstawy ich programowania, co z kolei umożliwia samodzielne prowadzenie badań z zakresu językoznawstwa korpusowego i komputerowego. Zakres tematyczny Językoznawstwo korpusowe a) Teoria i metodologia o o o o o o o o o o Racjonalizm i empiryzm w metodologii językoznawczej Definicje korpusu, rodzaje korpusów (referencyjne, narodowe, diachroniczne, specjalistyczne, multimedialne, równoległe, porównywalne i zadaniowe) Leksykogramatyka, korpusologia sinclairowska Anotacja lingwistyczna, semantyczna i bibliograficzna korpusów Podstawy leksykografii ilościowej i statystyki dla korpusologów (reprezentatywność, prawa Zipfa, Heapsa, analiza frekwencji a istotność statystyczna na przykładach) Korpusy narodowe i referencyjne (NKJP, BNC) Korpusy języka mówionego (PELCRA Spoken) Korpusy uczniowskie (PLEC) Zasady użycia technik korpusowych Frazeologia dystrybucyjna b) Zastosowania korpusów (przekrojowo) o o o Korpusy w językoznawstwie: Język mówiony Semantyka Składnia Stylistyka Historia języka Socjolingwistyka i dialektologia Pragmatyka, korpusowa analiza dyskursu Leksykografia i terminologie Translatoryka, korpusy w warsztacie tłumaczeniowym o Nauczanie języków c) Narzędzia o Narzędzia korpusowe (WordSmith, korpusy w sieci, np. NKJP i BNC) o Narzędzia CAT (memoQ) o Narzędzia statystyczne, środowiska informatyczne (Weka, R, podstawy Apache Lucene) d) Podstawy programowania o Podstawy programowania dla językoznawców (Python, NLTK, elementy języka Java, Groovy) o Podstawy XML-a i TEI o Relacyjne bazy danych dla leksykografów i korpusologów (MySQL) Forma zaliczenia Zaliczenie z konwersatoriów na podstawie pracy semestralnej z zakresu językoznawstwa korpusowego oraz testu końcowego. Forma zajęć Konwersatoria oraz ćwiczenia w pracowni komputerowej Wymagania Wstęp do językoznawstwa Ocena 2-5 Bibliografia Biber D., Conrad S., Reppen R. (2008) Corpus Linguistics: Investigating Language Structure and Use. Cambridge Approaches to Linguistics. Bird S., Klein E., Loper E. 2009 Natural Language Processing with Python. O'Reilly Media, Inc. McEnery T., Wilson A., 1998, Corpus Linguistics. Edinburgh University Press. Podstawy językoznawstwa korpusowego. 2005. Ed. by Barbara Lewandowska-Tomaszczyk. Wydawnictwo Uniwersytetu Łódzkiego. Adam Przepiórkowski, Mirosław Bańko, Rafał L. Górski i Barbara LewandowskaTomaszczyk (red.) Narodowy Korpus Języka Polskiego. Wydawnictwo Naukowe PWN, Warszawa.