Analiza danych tekstowych

Transkrypt

Analiza danych tekstowych
Kierunek studiów Informatyka
Studia II
Przedmiot:
Rok:
Semestr:
Forma studiów:
Rodzaj zajęć i liczba godzin w semestrze:
Analiza danych tekstowych
Wykład
Ćwiczenia
Laboratorium
Projekt
15
15
3
Liczba punktów ECTS:
I
II
Stacjonarne
Cele przedmiotu
C1
C2
C3
Zapoznanie ze sposobami reprezentacji atrybutów treści zawartych w tekstach
Zapoznanie z matematycznymi podstawami strukturyzacji, selekcji, identyfikacji treści, analizy opinii i emocji
zawartych w treści tekstów
Zapoznanie się z zastosowaniami analizy danych tekstowych i uzyskanie umiejętności posługiwania się narzędziami analizy
Wymagania wstępne w zakresie wiedzy, umiejętności i innych kompetencji
1
2
3
Statystyka
Uczenie maszynowe
Przetwarzanie w środowisku SAS
Efekty kształcenia
EK 1
EK 2
EK 3
EK 4
EK 5
EK 6
EK 7
W zakresie wiedzy:
Rozpoznaje zastosowania eksploracji i analizy danych tekstowych
Wyjaśnia modele, metody i algorytmy stosowane w analizie danych tekstowych
Rozpoznaje narzędzia do eksploracji i analizy danych tekstowych
W zakresie umiejętności:
Posługuje się wybranymi narzędziami do eksploracji i analizy danych tekstowych
Potrafi korzystać z dostępnych w internecie materiałów i pomocy dla użytkowników oprogramowania narzędziowego
W zakresie kompetencji społecznych
Potrafi współpracować z zespołem w czasie wykonywania zadań laboratoryjnych
Rozumie potrzebę uczenia się przez całe życie
Treści programowe przedmiotu
W1
W2
W3
W4
W5
W6
W7
W8
Forma zajęć – wykłady
Treści programowe
Zakresy zastosowań analizy danych tekstowych
Reprezentacje dokumentów tekstowych. Dekompozycja i automatyczne przetwarzanie danych tekstowych.
Identyfikacja słów kluczowych. Formy kanoniczne.
Wagi i funkcje ważące.
Podstawy metod porównywania cech tekstów
Metody strukturyzacji danych tekstowych
Reprezentacja wiedzy zawartej w tekstach za pomocą ontologii
Text Mining, metody identyfikacji tematu tekstu,
wyszukiwania wzorców i grupowania dokumentów
Metody i narzędzia analizy opinii i emocji zawartych
w tekstach
Suma godzin:
Liczba godzin
1
2
2
2
2
2
2
2
15
1
Forma zajęć – ćwiczenia
Treści programowe
ĆW1
L1
L2
L3
L4
L5
L6
L7
L8
P1
Liczba godzin
Suma godzin:
Forma zajęć – laboratoria
Treści programowe
Zastosowanie reguł do kategoryzacji dokumentów
Ekstrakcja treści dokumentów na podstawie reguł
Zespołowe konstruowanie taksonomii hierarchicznych
Organizowanie dokumentów w oparciu o opis semantyczny
Zastosowanie narzędzia analizy składniowej do wydobywania treści z dokumentów
Zastosowanie identyfikacji tematu dokumentu do
grupowania dokumentów
Prognozowanie na podstawie tekstu
Definiowanie reguł i wykonywanie analizy opinii i
emocji w tekście
Suma godzin:
Forma zajęć – projekt
Treści programowe
Suma godzin:
Liczba godzin
1
2
2
2
2
2
2
2
15
Liczba godzin
-
Metody/Narzędzia dydaktyczne
1
2
3
4
Wykład
Analiza przypadków
Praca w laboratorium z wykorzystaniem narzędzi analitycznych
Dyskusja
Sposoby oceny
F1
F2
Ocena formująca
Krótkie testy przed przystąpieniem do zajęć laboratoryjnych
Wypowiedzi w dyskusji wyników ćwiczeń
Ocena podsumowująca
P1
P2
P3
Egzamin pisemny w formie krótkich ustrukturyzowanych pytań – 60% końcowej oceny
Krótkie testy przeprowadzone w trakcie wykładów (min. 4 testy) – 10% końcowej oceny
Sprawozdania z wyników ćwiczeń – 30% końcowej oceny
Obciążenie pracą studenta
Forma aktywności
Godziny kontaktowe z wykładowcą, w tym:
udział w wykładach
udział w zajęciach laboratoryjnych
Praca własna studenta, w tym:
Samodzielna lektura
Przygotowanie do ćwiczeń w oparciu o literaturę przedmiotu
samodzielne przygotowanie do zaliczenia wykładu
Suma
Sumaryczna liczba punktów ECTS dla przedmiotu, w
tym:
Liczba punktów ECTS uzyskiwana podczas zajęć wymagających bezpośredniego udziału wykładowcy
Średnia liczba godzin na zrealizowanie aktywności
30
15
15
45
25
Liczba punktów ECTS w ramach zajęć o charakterze
praktycznym (ćwiczenia, laboratoria, projekty)
10
10
75
3
2
1
Literatura podstawowa i uzupełniająca
2
1
2
3
4
Berry M. W., Kogan J., Text Mining: Applications and Theory, Wiley 2010
Markov Z., Larose D. T., Eksploracja zasobów internetowych. Analiza struktury, zawartości i użytkowania
sieci WWW, PWN 2009
Dan Jurafsky, James H. Martin "Speech and Language Processing", Prentice-Hall, 2000
Mieczysław Kłopotek, "Inteligentne wyszukiwarki internetowe", Exit, 2001
Macierz efektów kształcenia
Efekt kształcenia
EK 1 Rozpoznaje
zastosowania eksploracji i analizy
danych tekstowych.
EK 2 Wyjaśnia modele, metody i algorytmy stosowane w
analizie danych tekstowych
EK 3 Rozpoznaje
narzędzia do eksploracji i analizy danych
tekstowych
EK 4 Posługuje się
wybranymi narzędziami do eksploracji
i analizy danych
tekstowych
EK 5 Potrafi korzystać z dostępnych w
internecie materiałów i pomocy dla
użytkowników oprogramowania narzędziowego
EK 6 Potrafi współpracować z zespołem w czasie wykonywania zadań laboratoryjnych
EK 7 Rozumie potrzebę uczenia się
przez całe życie
Odniesienie
danego efektu
kształcenia do
efektów zdefiniowanych dla
całego programu (PEK)
Cele przedmiotu
I2A_W03
C3
I2A_W01
C1, C2
I2A_W03
Treści programowe
W1, L1-L8
Metody/Narzędzia
dydaktyczne
Sposób oceny
1,2,3
P1, P3
W2, W3, W4,
W5, W6
1, 2
P1, P2
C1, C2
W5, W6, W7,
W8, L1-L8
1, 2, 3, 4
F1, F2, P1, P2,
P3
I2A_U018
C3
L1, L2, L3, L4,
L5, L6, L7, L8
3, 4
F1, F2, P3
I2A_U1
C3
L1, L2, L3, L4,
L5, L6, L7, L8
3,4
F1, F2, P3
I2A_K03
C3
L1, L2, L3, L4,
L5, L6, L7, L8
3,4
F1, F2, P3
I1A_K01
C1, C2
W1, W5, W6,
W7, W8
1,4
P1, P2
Formy oceny – szczegóły
Na ocenę 2 (ndst)
Na ocenę 3 (dst)
EK 1
Nie potrafi wymienić
zastosowań eksploracji i
analizy danych tekstowych
Potrafi wymienić zastosowania eksploracji i
analizy danych tekstowych
EK 2
Nie potrafi wymienić
modeli, metod i algorytmów stosowanych w
analizie danych tekstowych
Potrafi wymienić modele, metody i algorytmy
stosowane w analizie
danych tekstowych i
potrafi ogólnie scharakteryzować niektóre z
nich
Na ocenę 4 (db)
Potrafi wymienić zastosowania eksploracji
i analizy danych tekstowych i niektóre z
nich potrafi ogólnie
scharakteryzować
Potrafi wymienić modele, metody i algorytmy stosowane w
analizie danych tekstowych i potrafi
szczegółowo scharakteryzować niektóre z
Na ocenę 5 (bdb)
Potrafi wymienić i
szczegółowo scharakteryzować zastosowania
eksploracji i analizy
danych tekstowych
Potrafi wymienić i
szczegółowo wyjaśnić
modele, metody i algorytmy stosowane w
analizie danych tekstowych
3
EK 3
EK 4
EK 5
Nie potrafi wskazać narzędzi do eksploracji i
analizy danych tekstowych
Rozpoznaje narzędzia
do eksploracji i analizy
danych tekstowych i
ogólnie charakteryzuje
niektóre z nich
Nie umie korzystać z
przedstawionych na
zajęciach laboratoryjnych narzędzi do eksploracji i analizy danych
tekstowych
Posługuje się przedstawionymi na zajęciach laboratoryjnych
narzędziami do eksploracji i analizy danych
tekstowych i wykonuje
co najmniej 50% zadań
Przy posługiwaniu się
narzędziami analitycznym nie potrafi korzystać
z dostępnych w internecie materiałów i pomoce
dla użytkowników tego
oprogramowania
Przy posługiwaniu się
narzędziami analitycznym wykorzystuje dostępne w internecie
materiały i pomoce
Nie potrafi współpracować z zespołem w czasie wykonywania zadań
laboratoryjnych
EK 6
EK 6
Rozumie
potrzebę
uczenia
się
przez
całe
życie
Nie uczestniczy w wykładach i nie wykazuje
wiedzy pozyskanej w
drodze lektury
Autor programu:
Adres e-mail:
Jednostka organizacyjna:
W pracy nad zadaniami
wykazuje przynajmniej
50% cech spośród
niżej wymienionych:
pomaga i doradza kolegom w razie potrzeby, rozumie celu i korzyści wynikające ze
wspólnego realizowania zadań, współpracuje a nie rywalizuje z
pozostałymi członkami
zespołu, zgłasza konstruktywne wnioski
usprawniające prace
zespołu, słuchanie
innych
Wykazuje wiedzę pochodzącą z jednostronnego źródła
nich
Rozpoznaje narzędzia
do eksploracji i analizy
danych tekstowych i
wyczerpująco charakteryzuje niektóre z
nich
Posługuje się przedstawionymi na zajęciach laboratoryjnych
narzędziami do eksploracji i analizy danych tekstowych i
wykonuje co najmniej
75% zadań
Przy posługiwaniu się
narzędziami analitycznym wykorzystuje
dostępne w internecie
materiały i pomoce
oraz ogólnie uzasadnia ich wybór
W pracy nad zadaniami wykazuje przynajmniej 75% cech
spośród niżej wymienionych: pomaga i
doradza kolegom w
razie potrzeby, rozumie celu i korzyści
wynikające ze wspólnego realizowania
zadań, współpracuje a
nie rywalizuje z pozostałymi członkami
zespołu, zgłasza konstruktywne wnioski
usprawniające prace
zespołu, słuchanie
innych
Uczestniczy w wykładach, wykazuje wiedzę pozyskanej w
drodze samodzielnego
studiowania
Rozpoznaje narzędzia
do eksploracji i analizy
danych tekstowych i
wyczerpująco je charakteryzuje
Posługuje się przedstawionymi na zajęciach
laboratoryjnych narzędziami do eksploracji i
analizy danych tekstowych i wykonuje 100%
zadań
Przy posługiwaniu się
narzędziami analitycznym wykorzystuje dostępne w internecie
materiały i pomoce oraz
wyczerpująco uzasadnia ich wybór
W pracy nad zadaniami
wykazuje 100% cech
spośród niżej wymienionych: pomaga i doradza
kolegom w razie potrzeby, rozumie celu i korzyści wynikające ze
wspólnego realizowania
zadań, współpracuje a
nie rywalizuje z pozostałymi członkami zespołu,
zgłasza konstruktywne
wnioski usprawniające
prace zespołu, słuchanie innych
Uczestniczy w wykładach, wykazuje wiedzę
pozyskanej w drodze
samodzielnego studiowania i podejmuje dyskusję
Zbigniew Lach
[email protected]
Instytut Elektroniki i Technik Informacyjnych
4