Analiza danych tekstowych
Transkrypt
Analiza danych tekstowych
Kierunek studiów Informatyka Studia II Przedmiot: Rok: Semestr: Forma studiów: Rodzaj zajęć i liczba godzin w semestrze: Analiza danych tekstowych Wykład Ćwiczenia Laboratorium Projekt 15 15 3 Liczba punktów ECTS: I II Stacjonarne Cele przedmiotu C1 C2 C3 Zapoznanie ze sposobami reprezentacji atrybutów treści zawartych w tekstach Zapoznanie z matematycznymi podstawami strukturyzacji, selekcji, identyfikacji treści, analizy opinii i emocji zawartych w treści tekstów Zapoznanie się z zastosowaniami analizy danych tekstowych i uzyskanie umiejętności posługiwania się narzędziami analizy Wymagania wstępne w zakresie wiedzy, umiejętności i innych kompetencji 1 2 3 Statystyka Uczenie maszynowe Przetwarzanie w środowisku SAS Efekty kształcenia EK 1 EK 2 EK 3 EK 4 EK 5 EK 6 EK 7 W zakresie wiedzy: Rozpoznaje zastosowania eksploracji i analizy danych tekstowych Wyjaśnia modele, metody i algorytmy stosowane w analizie danych tekstowych Rozpoznaje narzędzia do eksploracji i analizy danych tekstowych W zakresie umiejętności: Posługuje się wybranymi narzędziami do eksploracji i analizy danych tekstowych Potrafi korzystać z dostępnych w internecie materiałów i pomocy dla użytkowników oprogramowania narzędziowego W zakresie kompetencji społecznych Potrafi współpracować z zespołem w czasie wykonywania zadań laboratoryjnych Rozumie potrzebę uczenia się przez całe życie Treści programowe przedmiotu W1 W2 W3 W4 W5 W6 W7 W8 Forma zajęć – wykłady Treści programowe Zakresy zastosowań analizy danych tekstowych Reprezentacje dokumentów tekstowych. Dekompozycja i automatyczne przetwarzanie danych tekstowych. Identyfikacja słów kluczowych. Formy kanoniczne. Wagi i funkcje ważące. Podstawy metod porównywania cech tekstów Metody strukturyzacji danych tekstowych Reprezentacja wiedzy zawartej w tekstach za pomocą ontologii Text Mining, metody identyfikacji tematu tekstu, wyszukiwania wzorców i grupowania dokumentów Metody i narzędzia analizy opinii i emocji zawartych w tekstach Suma godzin: Liczba godzin 1 2 2 2 2 2 2 2 15 1 Forma zajęć – ćwiczenia Treści programowe ĆW1 L1 L2 L3 L4 L5 L6 L7 L8 P1 Liczba godzin Suma godzin: Forma zajęć – laboratoria Treści programowe Zastosowanie reguł do kategoryzacji dokumentów Ekstrakcja treści dokumentów na podstawie reguł Zespołowe konstruowanie taksonomii hierarchicznych Organizowanie dokumentów w oparciu o opis semantyczny Zastosowanie narzędzia analizy składniowej do wydobywania treści z dokumentów Zastosowanie identyfikacji tematu dokumentu do grupowania dokumentów Prognozowanie na podstawie tekstu Definiowanie reguł i wykonywanie analizy opinii i emocji w tekście Suma godzin: Forma zajęć – projekt Treści programowe Suma godzin: Liczba godzin 1 2 2 2 2 2 2 2 15 Liczba godzin - Metody/Narzędzia dydaktyczne 1 2 3 4 Wykład Analiza przypadków Praca w laboratorium z wykorzystaniem narzędzi analitycznych Dyskusja Sposoby oceny F1 F2 Ocena formująca Krótkie testy przed przystąpieniem do zajęć laboratoryjnych Wypowiedzi w dyskusji wyników ćwiczeń Ocena podsumowująca P1 P2 P3 Egzamin pisemny w formie krótkich ustrukturyzowanych pytań – 60% końcowej oceny Krótkie testy przeprowadzone w trakcie wykładów (min. 4 testy) – 10% końcowej oceny Sprawozdania z wyników ćwiczeń – 30% końcowej oceny Obciążenie pracą studenta Forma aktywności Godziny kontaktowe z wykładowcą, w tym: udział w wykładach udział w zajęciach laboratoryjnych Praca własna studenta, w tym: Samodzielna lektura Przygotowanie do ćwiczeń w oparciu o literaturę przedmiotu samodzielne przygotowanie do zaliczenia wykładu Suma Sumaryczna liczba punktów ECTS dla przedmiotu, w tym: Liczba punktów ECTS uzyskiwana podczas zajęć wymagających bezpośredniego udziału wykładowcy Średnia liczba godzin na zrealizowanie aktywności 30 15 15 45 25 Liczba punktów ECTS w ramach zajęć o charakterze praktycznym (ćwiczenia, laboratoria, projekty) 10 10 75 3 2 1 Literatura podstawowa i uzupełniająca 2 1 2 3 4 Berry M. W., Kogan J., Text Mining: Applications and Theory, Wiley 2010 Markov Z., Larose D. T., Eksploracja zasobów internetowych. Analiza struktury, zawartości i użytkowania sieci WWW, PWN 2009 Dan Jurafsky, James H. Martin "Speech and Language Processing", Prentice-Hall, 2000 Mieczysław Kłopotek, "Inteligentne wyszukiwarki internetowe", Exit, 2001 Macierz efektów kształcenia Efekt kształcenia EK 1 Rozpoznaje zastosowania eksploracji i analizy danych tekstowych. EK 2 Wyjaśnia modele, metody i algorytmy stosowane w analizie danych tekstowych EK 3 Rozpoznaje narzędzia do eksploracji i analizy danych tekstowych EK 4 Posługuje się wybranymi narzędziami do eksploracji i analizy danych tekstowych EK 5 Potrafi korzystać z dostępnych w internecie materiałów i pomocy dla użytkowników oprogramowania narzędziowego EK 6 Potrafi współpracować z zespołem w czasie wykonywania zadań laboratoryjnych EK 7 Rozumie potrzebę uczenia się przez całe życie Odniesienie danego efektu kształcenia do efektów zdefiniowanych dla całego programu (PEK) Cele przedmiotu I2A_W03 C3 I2A_W01 C1, C2 I2A_W03 Treści programowe W1, L1-L8 Metody/Narzędzia dydaktyczne Sposób oceny 1,2,3 P1, P3 W2, W3, W4, W5, W6 1, 2 P1, P2 C1, C2 W5, W6, W7, W8, L1-L8 1, 2, 3, 4 F1, F2, P1, P2, P3 I2A_U018 C3 L1, L2, L3, L4, L5, L6, L7, L8 3, 4 F1, F2, P3 I2A_U1 C3 L1, L2, L3, L4, L5, L6, L7, L8 3,4 F1, F2, P3 I2A_K03 C3 L1, L2, L3, L4, L5, L6, L7, L8 3,4 F1, F2, P3 I1A_K01 C1, C2 W1, W5, W6, W7, W8 1,4 P1, P2 Formy oceny – szczegóły Na ocenę 2 (ndst) Na ocenę 3 (dst) EK 1 Nie potrafi wymienić zastosowań eksploracji i analizy danych tekstowych Potrafi wymienić zastosowania eksploracji i analizy danych tekstowych EK 2 Nie potrafi wymienić modeli, metod i algorytmów stosowanych w analizie danych tekstowych Potrafi wymienić modele, metody i algorytmy stosowane w analizie danych tekstowych i potrafi ogólnie scharakteryzować niektóre z nich Na ocenę 4 (db) Potrafi wymienić zastosowania eksploracji i analizy danych tekstowych i niektóre z nich potrafi ogólnie scharakteryzować Potrafi wymienić modele, metody i algorytmy stosowane w analizie danych tekstowych i potrafi szczegółowo scharakteryzować niektóre z Na ocenę 5 (bdb) Potrafi wymienić i szczegółowo scharakteryzować zastosowania eksploracji i analizy danych tekstowych Potrafi wymienić i szczegółowo wyjaśnić modele, metody i algorytmy stosowane w analizie danych tekstowych 3 EK 3 EK 4 EK 5 Nie potrafi wskazać narzędzi do eksploracji i analizy danych tekstowych Rozpoznaje narzędzia do eksploracji i analizy danych tekstowych i ogólnie charakteryzuje niektóre z nich Nie umie korzystać z przedstawionych na zajęciach laboratoryjnych narzędzi do eksploracji i analizy danych tekstowych Posługuje się przedstawionymi na zajęciach laboratoryjnych narzędziami do eksploracji i analizy danych tekstowych i wykonuje co najmniej 50% zadań Przy posługiwaniu się narzędziami analitycznym nie potrafi korzystać z dostępnych w internecie materiałów i pomoce dla użytkowników tego oprogramowania Przy posługiwaniu się narzędziami analitycznym wykorzystuje dostępne w internecie materiały i pomoce Nie potrafi współpracować z zespołem w czasie wykonywania zadań laboratoryjnych EK 6 EK 6 Rozumie potrzebę uczenia się przez całe życie Nie uczestniczy w wykładach i nie wykazuje wiedzy pozyskanej w drodze lektury Autor programu: Adres e-mail: Jednostka organizacyjna: W pracy nad zadaniami wykazuje przynajmniej 50% cech spośród niżej wymienionych: pomaga i doradza kolegom w razie potrzeby, rozumie celu i korzyści wynikające ze wspólnego realizowania zadań, współpracuje a nie rywalizuje z pozostałymi członkami zespołu, zgłasza konstruktywne wnioski usprawniające prace zespołu, słuchanie innych Wykazuje wiedzę pochodzącą z jednostronnego źródła nich Rozpoznaje narzędzia do eksploracji i analizy danych tekstowych i wyczerpująco charakteryzuje niektóre z nich Posługuje się przedstawionymi na zajęciach laboratoryjnych narzędziami do eksploracji i analizy danych tekstowych i wykonuje co najmniej 75% zadań Przy posługiwaniu się narzędziami analitycznym wykorzystuje dostępne w internecie materiały i pomoce oraz ogólnie uzasadnia ich wybór W pracy nad zadaniami wykazuje przynajmniej 75% cech spośród niżej wymienionych: pomaga i doradza kolegom w razie potrzeby, rozumie celu i korzyści wynikające ze wspólnego realizowania zadań, współpracuje a nie rywalizuje z pozostałymi członkami zespołu, zgłasza konstruktywne wnioski usprawniające prace zespołu, słuchanie innych Uczestniczy w wykładach, wykazuje wiedzę pozyskanej w drodze samodzielnego studiowania Rozpoznaje narzędzia do eksploracji i analizy danych tekstowych i wyczerpująco je charakteryzuje Posługuje się przedstawionymi na zajęciach laboratoryjnych narzędziami do eksploracji i analizy danych tekstowych i wykonuje 100% zadań Przy posługiwaniu się narzędziami analitycznym wykorzystuje dostępne w internecie materiały i pomoce oraz wyczerpująco uzasadnia ich wybór W pracy nad zadaniami wykazuje 100% cech spośród niżej wymienionych: pomaga i doradza kolegom w razie potrzeby, rozumie celu i korzyści wynikające ze wspólnego realizowania zadań, współpracuje a nie rywalizuje z pozostałymi członkami zespołu, zgłasza konstruktywne wnioski usprawniające prace zespołu, słuchanie innych Uczestniczy w wykładach, wykazuje wiedzę pozyskanej w drodze samodzielnego studiowania i podejmuje dyskusję Zbigniew Lach [email protected] Instytut Elektroniki i Technik Informacyjnych 4