Document 228376
Transkrypt
Document 228376
Uniwersytet im. Adama Mickiewicza w Poznaniu Wydział Matematyki i Informatyki Jędrzej Chruściel Numer indeksu: s329491 Język komunikacji uczestników gier sieciowych. Praca magisterska na kierunku INFORMATYKA Praca napisana pod kierunkiem Prof. UAM dr hab. Krzysztofa Jassema Poznań, czerwiec 2012 Oświadczenie autora pracy Świadom odpowiedzialności prawnej oświadczam, że niniejsza praca dyplomowa została napisana przeze mnie samodzielnie i nie zawiera treści uzyskanych w sposób niezgodny z obowiązującymi przepisami. Oświadczam również, że przedstawiona praca nie była wcześniej przedmiotem procedur związanych z uzyskaniem tytułu zawodowego w wyższej uczelni. Oświadczam ponadto, że niniejsza wersja pracy jest identyczna z załączoną wersją elektroniczną. Data Podpis autora pracy 3 Streszczenie W pracy przedstawiono rozważania na temat języka stosowanego w komunikacji uczestników gier sieciowych. Projektem towarzyszącym pracy jest implementacja oprogramowania pozwalającego na normalizację, czyli tłumaczenie slangu gier komputerowych na język możliwie zbliżony do słownikowego angielskiego. Słowa kluczowe tłumaczenie automatyczne, slang, komunikacja, gry sieciowe Dziedzina pracy (kody wg programu Socrates-Erasmus) 11.3 Informatyka Klasyfikacja tematyczna ACM Computing Classification: I.2.7 Natural Language Processing: Language parsing and understanding Tytuł pracy w języku angielskim Language of communication of online game participants. 4 Spis Treści Rozdział 1 – Wstęp ........................................................................................................................ 6 Rozdział 2 – Podstawy teoretyczne............................................................................................... 9 1. Podstawowe pojęcia ......................................................................................................... 9 2. Proces wykształcania się slangu społeczności internetowej ........................................... 12 3. Elementy slangu internetowego i metody jego tłumaczeń ............................................ 13 4. Obecny stan wiedzy na temat komunikacji elektronicznej i jej slangu ........................... 15 Rozdział 3 – Metody tłumaczenia slangu komputerowego ........................................................ 18 1. Algorytm działania tłumacza użyty w implementacji...................................................... 18 2. Algorytm rozpoznania typu slangu. ................................................................................ 19 3. Tłumaczenie kontekstowe w przypadku slangu.............................................................. 19 4. Identyfikacja i podmiana akronimów.............................................................................. 20 Rozdział 4 – Opis implementacji automatycznego tłumacza. ..................................................... 23 1. Architektura aplikacji. ..................................................................................................... 23 2. Dokładność tłumaczenia w zależności od rodzaju slangu. .............................................. 25 3. Przykłady slangu .............................................................................................................. 25 Rozdział 5 – Podsumowanie........................................................................................................ 29 1. Podsumowanie wyników tłumaczeń oraz wnioski.......................................................... 29 Bibliografia .................................................................................................................................. 30 Dodatek ....................................................................................................................................... 32 Dokumentacja Projektu Magisterskiego ..................................................................................... 44 Początek .................................................................................................................................. 44 Planowanie .............................................................................................................................. 46 Wykonanie .............................................................................................................................. 49 Zamykanie ............................................................................................................................... 50 5 Rozdział 1 – Wstęp „Społeczność internetowa grupy ludzi, którzy mogą, lub nie, spotkać się twarzą w twarz i którzy wymieniają słowa oraz idee za pośrednictwem klawiatury”- to chyba najlepsza i uniwersalna definicja społeczności internetowej z jaką można się powszechnie spotkać. Nie istnieje niestety powszechnie przyjęta definicja tego terminu, a co za tym idzie różni autorzy mogą stosować różne definicje. Problem z pojęciem " społeczności internetowej" polega głównie na tym iż odnosi się ono do bardzo szerokiego zakresu aktywności związanych z wykorzystaniem Internetu. W tej pracy termin "społeczności internetowe" odnosi się do wszystkich społeczności, które komunikują się przede wszystkim online, z głównym wskazaniem na społeczność użytkowników gier komputerowych, wydających się być zlepkiem każdej z możliwych społeczności internetowych. Istnieje spora liczba czynników kształtujących charakter społeczności internetowej. Cel społeczności (np. wsparcie zdrowia, edukacja, biznes, rozrywka) i środowisko technologiczne wspomagające ich działanie (np. forum dyskusyjne, czat, komunikatory internetowe, gry komputerowe, lub jak to obecnie najpowszechniejsza jakaś kombinacja tych mediów) znacznie wpływają na charakter wspólnoty. Przykładowo, wypowiedzi graczy gier typu MOBA czy też Hack’n’Slash są możliwe krótkie i nacechowane emocjonalnie, ciężkie lub prawie niemożliwe do przetłumaczenia osobom spoza środowiska, czasami wręcz wulgarne. Natomiast wypowiedzi użytkowników gier turowych i strategicznych mają bardziej rozbudowaną i przemyślaną formę. Jest to w głównej mierze wymuszone przez dynamikę rozgrywki, ale także przez niższy poziom trudności danej gry, co przyciąga użytkowników nieletnich. Struktura zarządzania społecznością oparta na decyzjach wspólnoty oraz rodzaje norm i przepisy, które rozwijają się wraz z ewolucją danej społeczności, zapewniają ramy dla interakcji w danej zbiorowości, które różnią się znacznie pomiędzy poszczególnymi wspólnotami, błyskawicznie budując autonomię nawet w małej wspólnocie graczy. Za autonomią idzie najczęściej wykształcenie się nowego rodzaju slangu. Inne czynniki, które przyczyniają się do różnorodności językowej w Internecie to przede wszystkim wielkość danej społeczności Duże społeczności obejmują szerszy przekrój wieku i są swoistym zlepkiem wielu różnych kultur współistniejących na danej platformie. Celem pracy jest zbadanie sposobu komunikacji między uczestnikami gier sieciowych, wraz ze wskazaniem rodzaju oraz budowy języka, którym się posługują. Badane będą aspekty radzenia sobie społeczności internetowych m.in. z problemami ograniczonej znajomości wspólnego języka oraz wymogiem szybkości i zwięzłości komunikacji. Przeanalizowany zostanie proces wykształcania się międzynarodowego slangu użytkowników gier komputerowych, opartego na języku angielskim, w trakcie wykształcania się danej społeczności. Slang używany w komunikacji graczy poddany zostanie analizie. 6 Przedyskutowane zostaną kierunki rozwoju tej formy komunikacji. Podjęta zostanie próba odnalezienia schematów tworzonych wypowiedzi. Zbadana zostanie także częstotliwość występowania poszczególnych słów w określonych okresach czasu istnienia społeczności oraz zmiany w ilości ich wystąpień w tym czasie. Wysunięta zostanie hipoteza co do górnej granicy czasowej, po której slang przestaje ewoluować dynamicznie i możliwe jest jego zrozumienie i przetłumaczenie na język tradycyjny bez potrzeby istotnych aktualizacji słowników. Pogrupowane i skategoryzowane zostaną rodzaje slangu występujące najpowszechniej w Internecie. Stworzone zostaną słowniki slangu podstawowego, używanego powszechnie, oraz slangów hermetycznych używanych przez zamknięte społeczności użytkowników Internetu. Większość danych do analizy oraz budowy słowników zostanie pozyskana z for dyskusyjnych oraz chatów. Zapewni to odpowiednio duży korpus tekstu do uzyskania miarodajnych wyników badań. Przedstawione zostaną przykładowe statystyki występowania danych słów. Celem analizy będzie sformułowanie wniosków mających umożliwić automatyczne przetworzenie wypowiedzi w slangu komputerowym do poprawnej słownikowo postaci w języku angielskim. Praktyczną implementacją będzie oprogramowanie pozwalające na normalizację języka, którym posługują się gracze, czyli przetłumaczenie go na zrozumiałą wersję języka angielskiego. Będzie ono musiało uwzględnić zasób słownictwa specyficzny dla danej gry/społeczności, oraz weryfikować tak podstawowe błędy jak powtórzenia wyrazów. Do tłumaczeń wykorzystane zostaną słowniki zawierające tłumaczenia każdego spornego, tj. uznawanego za slangowe, wyrazu oraz słowniki dodatkowe zawierające slang oraz akronimy i znaki specjalne, które w Internecie używane są najpowszechniej. Niniejsze opracowanie może okazać się przydatnym do analizy teoretycznej i przetwarzania nowych języków wytworzonych przez społeczności internetowe. Rozdział 2 rozpoczyna się wprowadzeniem ważniejszych pojęć związanych ze slangiem internetowym , jego środowiskiem oraz procesem rozwoju. Opisuje kolejne etapy jego wykształcenia się oraz wpływ środowiska i czynników zewnętrznych. Pokrótce opisane są także najpopularniejsze, dotąd wykształcone, rodzaje slangu, z jakimi powszechnie można spotkać się w Internecie. W rozdziale trzecim przedstawione zostały różne podejścia do translacji slangu komputerowego do tekstu możliwie zbliżonego do poprawnej angielszczyzny. Zaprezentowane zostało praktyczne podejście do tłumaczenia języków slangowych w postaci implementacji tłumacza. Podjęta została próba rozpoznawania typu slangu użytego w tłumaczonym tekście. Rozdział czwarty skupia się na szczegółowym opisie implementacji automatycznego tłumacza tekstu slangowego. Prezentuje drobiazgowo szczegóły 7 architektury aplikacji. Ocenia także dokładność tłumaczenia w zależności od rodzaju użytego slangu. 8 Rozdział 2 – Podstawy teoretyczne 1. Podstawowe pojęcia Slang - potoczna odmiana języka używana przez określoną grupę zawodową lub środowiskową. Slang internetowy - slang tworzony i stosowany przez użytkowników Internetu. Ułatwia i przyspiesza komunikację poprzez zmniejszanie liczby kliknięć w klawiaturę. Stosowany jest w komunikacji internetowej: na czatach internetowych, forach dyskusyjnych, IRC-u, w poczcie elektronicznej i komunikatorach internetowych. Nowi, niedoświadczeni użytkownicy często mają problemy ze zrozumieniem wyrażeń slangowych. Dlatego, jak każdy żargon, slang internetowy może tworzyć pomiędzy użytkownikami wrażenie wtajemniczenia. Computer-mediated communication (CMC) - nazwa technik komunikowania się oraz samego procesu komunikacyjnego za pomocą komputera. Za polski odpowiednik tego wyrażenia możemy uznać termin komunikacja komputerowa (KK). Massively Multiplayer Online Game (MMOG lub MMO) - typ gry komputerowej, do której dostęp możliwy jest zazwyczaj tylko online. Gra najczęściej ma charakter ciągły i jest rozgrywana jednocześnie przez wielu graczy. Gry tego typu zapewniają prawie nieograniczone możliwości interakcji między graczami, mocno wykraczające poza to, co oferują zwykłe gry sieciowe, tj. gry zawierające także tryb single-player. Często są swoistym alternatywnym modelem rzeczywistości z własną ekonomią oraz prawem. Downloadable content (DLC) – dodatek do gry udostępniany przez wydawcę do pobrania za pośrednictwem Internetu. Istnieją rozliczne rodzaje pakietów DLC, począwszy od wersji demonstracyjnej produktu, poprzez różnego rodzaju rozszerzenia do podstawowej wersji gry, np. wyposażenie, lokacje czy pakiety misji. Akronim internetowy1 - skrót utworzony z pierwszych liter często używanego wyrażenia, który stosują uczestnicy kanałów IRC lub innych usług związanych z "rozmowami" w Sieci. Umieszczane są także na stronach WWW i w nieoficjalnych emailach. Akronimami określamy skróty spotykane w codziennym życiu w postaci skrótowców literowych jak AGD - Artykuł Gospodarstwa Domowego czy też skrótowce głoskowe jak GUS - Główny Urząd Statystyczny. Różnica między akronimem internetowym a tym używanym w języku potocznym polega właśnie na fakcie jego odrębności środowiskowej, tzn. fakcie, że jego użycie możliwe jest tylko w środowisku wirtualnym. Interesującym przykładem może być najpowszechniej stosowany akronim czyli AFAIK (As Far As I Know- z tego co mi wiadomo), stosowany nagminnie jako nie do końca skromne podkreślenie faktu wyższości w dyskusji. Następnym ciekawym przykładem akronimu przy okazji zawierającego w sobie homofonię może być inb4 (in before). Jest on powszechnie używany na forach dyskusyjnych i odnosi się do sytuacji kiedy użytkownik wysyłający odpowiedź w dyskusji chce się odnieść do możliwości 1 http://www.digipedia.pl/def/doc/id/447664208/name/Akronim-internetowy/ 9 oczywistej odpowiedzi na swoją wiadomość. Po prawidłowo użytym wyrażeniu inb4 następuje wyraz lub krótka fraza której użycia spodziewa się użytkownik w dalszej dyskusji. Uważam że rząd ogranicza moje swobody obywatelskie i niepotrzebnie manipuluje gospodarką. inb4 Nie jestem fanem Korwina-Mikke Tłumaczenia oparte na interlingwie, interlingual translation (IT) - metoda tłumaczenia języka opartego na interlingwie. Interlingwa jest sztucznym tworem językowym, odgrywającym rolę pośrednika w tłumaczeniu – tekst jest tłumaczony na język pośredni, a następnie z niego na właściwy język docelowy. Tłumaczenie oparte na transferze, transfer-based (TB) - metoda tłumaczenia języka, w odróżnieniu od interlingwy, ograniczona do danej pary języków, np. angielskifrancuski, przy czym przekład w przeciwną stronę wymaga nowego zestawu reguł. Sam transfer jest etapem pośrednim, a więc przekład można sprowadzić do trzech faz: analiza, transfer oraz synteza. System ten opracowany np. dla czterech języków będzie wymagał nie czterech a dwunastu zestawów reguł (np. polski-japoński, polski-angielski, polski-niemiecki, jap-angielski, jap-niemiecki, japoński-polski, angielski-polski, angielski-niemiecki, angielski-jap, niemiecki-polski, niemiecki-japoński, niemieckiangielski). Wyrażenia regularne: Niech ∑ - alfabet skończony. Zbiór regularny nad alfabetem ∑ definiujemy następująco: 1. ∅ - zbiór pusty - jest zbiorem regularnym nad ∑, 2. {ε} - zbiór zawierający słowo puste jest zbiorem regularnym nad ∑, 3. {a} - jest zbiorem regularnym nad ∑, dla każdego a∈∑, 4. Jeśli P i Q - są zbiorami regularnymi nad ∑ - to również zbiory: P∪Q, P⋅Q oraz P* - są zbiorami regularnymi nad ∑, 5. Nic innego nie jest zbiorem regularnym nad ∑. Inaczej mówiąc - pewien zbiór jest zbiorem regularnym nad ∑, tylko wtedy gdy jest bądź zbiorem pustym, bądź jest równy {ε} lub jest równy {a} dla dowolnego a ∈ ∑, bądź może być sumą, konkatenacją lub nieskończoną iteracją pewnych zbiorów regularnych. Wyrażenia regularne (ang. regular expressions, w skrócie regex lub regexp) nad alfabetem ∑ i zbiór regularny, który ono wyznacza definiujemy następująco: 1. ∅ - jest wyrażeniem regularnym, wyznaczającym zbiór regularny - ∅ 2. ε - jest wyrażeniem regularnym, wyznaczającym zbiór regularny - {ε}, 3. Jeśli a∈∑, to a - jest wyrażeniem regularnym, wyznaczającym zbiór {a} 4. Jeśli p i q 2 są wyrażeniami regularnymi, wyznaczającymi zbiory regularne: P i Q to (p+q), (pq) oraz (p)* - są też wyrażeniami regularnymi, wyznaczającymi odpowiednio zbiory: P∪Q, P⋅Q oraz P* . 10 5. Nic innego nie jest wyrażeniem regularnym. 2 Odległość Levenshteina - metryka określająca ilość różnic pomiędzy dwoma sekwencjami znaków. Nazwę tę często stosuje się naprzemiennie z „odległością edycyjną”. Odległość Levenshteina między dwoma ciągami jest zdefiniowana jako minimalna liczba działań prostych, jakie należy wykonać, aby dokonać konwersji jednego ciągu na drugi. Jako działania proste definiuje się: wstawienie, usunięcie lub podmianę pojedynczego znaku. Paronim (fr.) - wyraz kojarzący się z innym ze względu na wspólność rdzenia, np. abstrakcja i dystrakcja, lub podobieństwo brzmienia, np. adoptować i adaptować.3 Społeczność wirtualna/internetowa - grupy ludzi, którzy mogą, lub nie, spotkać się twarzą w twarz i którzy wymieniają słowa oraz idee za pośrednictwem klawiatury 4. Multiplayer Online Battle Aren – znana także jako action real-time strategy (strategia czasu rzeczywistego skupiona na akcji), jest podgatunkiem strategii czasu rzeczywistego, w której zwyczajowo dwie lub więcej drużyn współzawodniczą ze sobą w oddzielnych rozgrywkach, w których każdy z graczy kontroluje tylko jednego bohatera. Charakterystyczny jest brak podziału na tury. Hack and slash lub hack'n'slash (ang. hack- rąbać i slash- ciąć) – gatunek gier komputerowych, w których dominującą rolę w rozgrywce odgrywa zabijanie potworów, zdobywanie doświadczenia i rozbudowywanie statystyk postaci. 2 http://www.ii.uj.edu.pl/~rosek/epi/Wyklad2.pdf http://sjp.pwn.pl/slownik/2570770/paronim 4 Abercrombie i in.: The Penguuin Dictionary of Sociology, London 1994 3 11 2. Proces wykształcania się slangu społeczności internetowej Rysunek 1 Ilość nowych slangowych słów w zależności od miesiąca. W rozdziale przedstawiony zostanie proces wykształcania się slangu społeczności internetowej. Przedstawione zostaną kolejne etapy wraz z przybliżonymi ramami czasowymi ich trwania wraz z opisem zachodzących w nich procesów. I. Społeczność zamknięta. Nowi użytkownicy nie są w ogóle przyjmowani lub są wybierani z wąskiego grona testerów. Granice czasowe: od wydania grywalnej wersji gry (miesiąc „0”) do 4 miesiąca jej istnienia. Bezpośrednio po powstaniu społeczność składa się ona głównie z założycieli, ewentualnie wąskiego grona testerów danej gry. Początkowo posługują się oni przeważnie żargonem wykształconym w trakcie jej tworzenia oraz powszechnie stosowanym slangiem internetowym. Okres ten trwa do wypuszczenia otwartej wersji gry (wyjście z zamkniętej fazy beta testów przedstawione na Rysunku 1). II. Zawiązanie się danej społeczności. Masowy napływ nowych użytkowników Granice czasowe: między 5 a 13 miesiącem istnienia gry. Po „otwarciu” społeczności spora część z masowo napływających nowych użytkowników przyjmuje większość starego slangu modyfikując go, tzn. eliminując elementy niezrozumiałe/przestarzałe oraz dokładając własne (Rysunek 1- czas od 5 do 13 miesiąca). III. Ustalenie poziomu dyskusji, adaptacja nowych słów Granice czasowe: między 6 a 13 miesiącem istnienia gry W tym etapie ustalony zostaje poziom kultury dyskusji oraz hierarchia 12 użytkowników gry. Użytkownicy bardziej zaawansowani technicznie, oraz o lepszych wynikach, są w stanie w dużym stopniu wpływać na całokształt używanego języka. Co ważne, ze względu na anonimowość, jaką zapewnia Internet wiek użytkowników zazwyczaj pełni drugorzędną rolę. Społeczność dynamicznie adaptuje nowe słownictwo w razie wystąpienia potrzeb takich jak nowe umiejętności i cechy postaci, rozwój map oraz dokładanie i modyfikacja przedmiotów przez twórców gry (Rysunek 1- czas od 6 do 13 miesiąca). IV. Hermetyzacja języka Granice czasowe: między 14 a 20 miesiącem istnienia bazowej wersji gry bez żadnych rozszerzeń i dodatków typu patch czy też DLC Do slangu dochodzi nowe słownictwo specyficzne tylko dla danej gry, nie tylko jej typu. Określa ono tak charakterystyczne cechy jak: konkretne strategie, „czary”, zagrania i zdarzenia podczas rozgrywki. Na tym etapie język ten przestaje być zrozumiały dla ludzi „z zewnątrz” (Rysunek 1- czas od 14 do 20 miesiąca). Przykładowe wypowiedzi przed hermetyzacją języka: „This is the tank I’ve build, it’s got cool spell buffs.” Zdanie po hermetyzacji: „Dis is my tanky dps melee with AS buffs and epic diving ultimat” V. Dalsze zmiany wynikające ze specyfiki danej gry Granice czasowe: zazwyczaj po około 21 miesiącach istnienia gry, pod warunkiem kontynuowania projektu Przy każdym pojawieniu się aktualizacji gry, dodatków, nowych strategii oraz pomysłów wymagane słowa dodawane są do ogólnego słownika, a najchętniej stosowane są adaptowane na stałe (Rysunek 1- czas od 21 miesiąca). 3. Elementy slangu internetowego i metody jego tłumaczeń Najpowszechniejszymi elementami wchodzącymi w skład slangu internetowego są: o Skróty internetowe o Akronimy internetowe o Emotikony - emotikony kaomoji o Zapis fonetyczny o Pseudoznaczniki o Leetspeak 13 Należy zaznaczyć iż rzadko występują one pojedynczo, zazwyczaj mieszają się ze sobą bez żadnego schematu ani regularności. Ich szczegółowe omówienie zostało przedstawione poniżej. I. Skrótem internetowym nazywam każdą skróconą i powszechnie stosowaną w Internecie formę wyrazową. Jest nią na przykład wyrażenie „nara (na ra)”, czyli skrócona forma „na razie”, obecnie przeniesiona już z chatów i komunikatorów do komunikacji twarzą w twarz. II. Akronim internetowy jest podzbiorem ciągiem znaków, utworzonym z pierwszych liter wyrażenia popularnie stosowanych w Internecie. Przykłady często spotykanych akronimów to: "lol" dla "Lots of Laughs" (pol. dużo śmiechu, bardzo się uśmiałem) i "BTW" "By The Way" (pol. przy okazji). III. Emotikony są symbolami często występującymi na forach internetowych, komunikatorach i grach online. Co ciekawe, są one specyficzne kulturowo i w związku z tym niektóre z nich występują tylko w określonych językach, a w innych nie. Na przykład japońskie odpowiedniki emotikonów – kaomoji (dosłownie "Znaki twarzy") – , koncentrują się na oczach, a nie na ustach jak w emotikonach pochodzących z kultury zachodniej. Prawdopodobnie ewoluowały one autonomicznie, ponieważ prezentują kompletnie inny koncept. Odczytywane są one od prawej górnej strony, na przykład emotikona zadowolenia: ^_^ Rysunek 2 Emotikona kaomoji IV. Popularniejsze emotikony z innych części świata, jak odpowiedni emotikony z Rysunku 4: =) Rysunek 3 Emotikona standardowa V. VI. czytane są oczywiście od lewej do prawej. Co najważniejsze, w porównaniu do emotikonów używanych w kulturach zachodnich takich jak Stany Zjednoczone, kaomoji odgrywają bardzo wyraźną rolę społeczną w dyskursie internetowym. Zapis fonetyczny (homofonia liter) Homofonia liter polega na zastępowaniu pomniejszych części wyrazów literami o podobnym do nich brzmieniu. Przykładowo wyrażenie See You bywa zastępowane przez bicie liter CU, które w wymowie brzmi bardzo podobnie. Pseudoznaczniki/składnie języków programistycznych Czerpią głównie ze składni języków znaczników oraz języków programistycznych. Są to zazwyczaj bardzo proste zapożyczenia jak na przykład „[ot]Wypowiedz niezgodna z głównym tematem [/ot]” gdzie znacznik ot znaczy tyle co „off topic” czyli „poza tematem”. Ich funkcja jest podobna do emotikonów - mają one podkreślić nastrój piszącego lub charakter wypowiedzi. 14 VII. 4. Leetspeak Leetspeak lub 1337, jest alternatywnym sposobem zapisu słów języka angielskiego, który wykorzystuje różne kombinacje znaków ASCII do zastępowania standardowych liter alfabetu. W podstawowej wersji obejmuje on prostą zamianę grupy znaków „LZEAS6TBGO” na „1234567890”. Jego korzenie wywodzą się z hackerstwa, jednak jego zastosowanie rozpowszechniło się również w grach online. Najbardziej prawdopodobną genezą leetspeaka są częste pomyłki oprogramowania OCR starszej generacji biorącego litery za cyfry i odwrotnie. Jak w każdym innym rodzaju internetowego slangu nie istnieje jego oficjalna specyfikacja. W bardziej zaawansowanej wersji żargon ten stosuje także fonetyczny lub zbliżony zapis/odczyt liter i angielskich słów (często w formie homofonii np. "b" – czytane jak nazwa litery zamiast czasownika be, "r" zamiast are), opuszczanie niewymawianych liter, umyślne błędy typograficzne (np. pr0n zamiast porn), nadużywanie "z" w miejsce "s" jako końcówki liczby mnogiej itp. Powstawanie takich zniekształceń ma swoją przyczynę w próbach uniknięcia cenzury nakładanej przez niektórych usługodawców sieciowych na treści stron kolidujące z obowiązującym prawem jak np. nielegalne oprogramowanie, pornografia, włamania komputerowe itp. Leetspeak, jak większość żargonów internetowych, stale i dość szybko ewoluuje, dostosowując się do filtrów cenzorskich5. Przykłady: - 3y3, EyE (z ang. I) – ja - box, b0x (z ang. box) – pudło, skrzynka, metafora komputera desktopu - d00d (z ang. dude) – koleś - 1337, l33t (z ang. elite) – elita Obecny stan wiedzy na temat komunikacji elektronicznej i jej slangu Badanie komunikacji komputerowej wymaga integracji szeregu dziedzin nauki, poczynając od ściśle technicznych aż pod odłamy humanistyki. Badacze starają się określić wpływ komputerów oraz rozwoju ich oprogramowania na możliwości komunikatywne człowieka i rozwój języka. Należy zauważyć że pierwsze wzmianki dotyczące CMC pojawiały się już we wczesnych latach 906 i rozwój tej dziedziny trwa nieprzerwanie , co potwierdzają np. pozycje Susan Barnes7 oraz Alice Tomic. Autorzy ci poruszali zazwyczaj kwestie związane z publikowaniem i udostępnianiem informacji oraz technologiami, które to umożliwiają. Sporo uwagi Internetowi jako środkowi masowej komunikacji i jego dynamicznie rozwijającemu się językowi poświęcone zostało w książce The World Wide Web: A Mass Communication Perspective, w której to autorzy przedstawiają ogólnoświatową sieć (Internet) jako źródło nieograniczonych możliwości komunikacji i problemów z niej wynikających (tzn. właśnie różnic językowych oraz powstawanie 5 http://pl.wikipedia.org/wiki/Leet_speak Alexander J. Romiszowski, COMPUTER-MEDIATED COMMUNICATION , 1992 7 Computer-Mediated Communication: Human-to-Human Communication Across the Internet, 2002 6 15 trudnych w tłumaczeniu slangów). Mocno wizjonerska w tej kwestii była książka Steve’a Jonesa8, która traktuje o zawiązywaniu się społeczności internetowych oraz ich szybkiej ewolucji. Należy wspomnieć, iż książkę tę autor napisał w roku 1998 czyli wtedy, kiedy pierwsze większe skupiska internautów dopiero się tworzyły, a o grach MMO nikt jeszcze nie słyszał, głównie ze względu na brak technicznych możliwości wdrożenia takowych, tj. zbyt małą dostępność łącz szerokopasmowych. Bardzo ciekawego omówienia tematyki przenoszenia się wspólnot w świat wirtualny dokonał James Slevin9 pisząc o wpływie Internetu na współczesną kulturę oraz logice dominacji mającej wpływ na kształt takowej kultury. 1. Metody tłumaczenia między językami I. Oparte na regułach Paradygmat tłumaczenia opartego na regułach uwzględnia metody tłumaczenia oparte na transferze semantycznym, tłumaczeniu międzyjęzykowym wykorzystującym interlingwę oraz tłumaczeniu bezpośrednim opartym na słowniku. W określonych przypadkach efektywnym może być połączenie kilku wyżej wspomnianych metod. i. Tłumaczenie oparte na transferze semantycznym Tłumaczenia oparte na zasadzie transferu semantycznego są oparte na idei interlingwy i są obecnie jednymi z najczęściej stosowanych metod tłumaczenia automatycznego. Zarówno tłumaczenia oparte na transferze semantycznym jak i te oparte na interlingwie opierają się na tej samej idei, tzn. do wykonania tłumaczenia konieczne jest określenie pośredniej reprezentacji zdania oddającego jego znaczenie w celu wygenerowania odpowiedniego tłumaczenia. W tłumaczeniach opartych na interlingwie ta reprezentacja pośrednia musi być niezależna od języka oryginalnego tekstu, natomiast w tłumaczeniu opartym na transferze semantycznym uwzględnia rodzaj języka pierwowzoru. Sposoby działania systemów tłumaczących typu TB różnią się dość istotnie między sobą, jednak w ogólności ich sposób działania polega na ustaleniu zbiorów reguł lingwistycznych opartych na zależnościach pomiędzy strukturą tekstu źródłowego a docelowego. Pierwszych krokiem jest dokładna analiza tekstu pod względem morfologii, składni, oraz w rzadkich przypadkach semantyki w celu stworzenia wewnętrznej wersji tekstu. Na podstawie tej wersji, z pomocą dwujęzycznych słowników oraz reguł gramatycznych generowane jest docelowe tłumaczenie . ii. Tłumaczenia oparte na interlingwie. W tłumaczeniu opartym na interlingwie tekst źródłowy jest zamieniany na niezależną językowo od języka źródłowego wersję tekstu zapisaną w interlingwie. Docelowe tłumaczenie jest wtedy generowane bezpośrednio z interlingwy. Następnie na podstawie odpowiednio dobranych reguł gramatycznych generowane jest 8 Cybersociety 2.0: Revisiting Computer-Mediated Community and Technology, 1998 Slevin, J. (2000) The Internet and Society, Cambridge, Polity Press 9 16 docelowe tłumaczenie . IV. iii. Tłumaczenia oparte na metodzie słownikowej. Tłumaczenie maszynowe oparte na metodzie słownikowej wykorzystuje metody tłumaczenia oparte na bezpośrednim korzystaniu z wpisów zawartych w dwujęzycznych wpisach słownikowych co oznacza, że słowa są tłumaczone bezpośrednio wedle słownika, bez uwzględnienia kontekstu zdania. Ten typ tłumaczenia jest bardzo wydajny w przypadku translacji tekstu bez konkretnej struktury, np. slangu internetowego. II. Tłumaczenie statystyczne. Przy statystycznym podejściu do tłumaczenia tekstu treść jest tłumaczona na podstawie metod statystycznych, opartych na dwujęzycznych korpusach tekstu. Teksty tłumaczone są wedle rozkładu prawdopodobieństwa opartego na założeniu, że tekst, pochodzący z korpusu treści w języku docelowym jest najczęstszym tłumaczeniem tekstu w języku źródłowym. Problemem w stosowaniu tej metody tłumaczenia jest oczywiście zdobycie odpowiednio dużych korpusów tekstu, które są poprawnie przetłumaczone – zarówno pod względem gramatyki jak i morfologii, gdyż właśnie to jest warunkiem koniecznym otrzymania tłumaczenia o wysokiej dokładności. III. Tłumaczenie oparte na przykładach. i. Tłumaczenie oparte na przykładach opiera się głównie na wykorzystywaniu dwujęzycznych korpusów tekstu. Tłumaczenie tekstu opiera się na analogii pomiędzy tekstem tłumaczonym a tekstem zawartym w pamięci systemu. Tłumaczenie hybrydowe. Tłumaczenia hybrydowe wykorzystują zarówno zalety tłumaczeń statystycznych jak i opartych na przykładach. Istnieje kilka podejść do sposobu budowy silnika tłumaczeń hybrydowych: i. Podejście oparte na regułach wedle statystyk - przekład tekstu jest dokonywany wedle silnika opartego na regułach. Następnie użyte są narzędzia statystyczne w celu dopasowania i korekcji tekstu wyjściowego. ii. Podejście oparte na statystyce wedle reguł - zestawy reguł są użyte do wstępnego parsowania tekstu w celu lepszego naprowadzenia (kalibracji) silnika tłumaczącego, opartego na narzędziach statystycznych. Reguł można użyć później ponownie w przypadku np. potrzeby normalizacji tekstu. Podejście to zapewnia sporą elastyczność oraz kontrolę podczas tłumaczenia tekstu. 17 Rozdział 3 – Metody tłumaczenia slangu komputerowego 1. Algorytm działania tłumacza użyty w implementacji Ze względu na specyfikę tłumaczonego języka, jakim jest slang komputerowy pochodzenia angielskiego, najlogiczniejszym wyjściem okazało się oparcie implementacji na metodzie tłumaczenia słownikowego. Slang pozbawiony jest ścisłej struktury oraz gramatyki, co uniemożliwia tłumaczenia i korekcję wedle reguł. Cały system, dzięki oparciu o duży zasób przetłumaczonych słów, odpowiednio dobranych dla danego tekstu algorytmu badającego rodzaj slangu i dopasowującego do niego słowniki, posiada pewne elementy tłumaczenia statystycznego, co zauważalnie poprawia jakość tłumaczenia tekstu slangowego. Jak zostało wspomniane, sprawą podstawową w przypadku tłumaczenia Rysunek 4 Podstawowy algorytm tłumaczenia slangu będzie odpowiednio duży słownik slangu użyty do tłumaczeń. Został on pozyskany z zasobów Internetu odpowiednich dla danego słownika, czy to z leksykonu standardowego slangu internetowego, czy też z zasobów bardziej specjalistycznych jak fora gier internetowych. Przebieg samego procesu tłumaczenia jest następujący: od użytkownika pobierany zostaje tekst źródłowy, którynastępnie poddany zostaje działaniu mechanizmu parsującego,. Mechanizm ten na zasadzie typowego systemu tłumaczenia bezpośredniego podmienia wyrazy znajdujące się w tekście. Tekst zostaje wstępnie przetłumaczony przy użyciu domyślnych ustawień programu, czyli z wyborem najpowszechniej stosowanego slangu. Przy okazji wstępnego tłumaczenia tekstu podjęta zostaje próba rozpoznania rodzaju slangu. Na tej podstawie sugerowane są dodatkowe słowniki, które warto byłoby uwzględnić przy tłumaczeniu. Możliwy jest również wybór słowników przez użytkownika. Nad procesem tłumaczenia czuwa dodatkowa funkcja zapewniająca usunięcie powtórzeń wyrazów. Dzięki temu np. zestawienie w postaci „ranged ad carry” („ad carry” oznacza „ranged attack character”) przetłumaczone zostanie bez powtórzenia wyrazu „ranged”. Następnie jeżeli użytkownik jest zadowolony z otrzymanego tłumaczenia, proces się kończy. Jeżeli jest inaczej, możliwe są dalsze zmiany w wyborze słowników lub 18 edycja, ewentualnie utworzenie nowych zbiorów tłumaczeń. 2. Algorytm rozpoznania typu slangu. Istnieją różnorakie statystyczne podejścia do identyfikacji języka tekstu na podstawie różnych technik klasyfikowania danych. Jednym z podstawowych podejść jest porównanie podatności na kompresję tekstu źródłowego oraz tekstów w zestawie znanych języków. Podejście to jest znane jako badanie miary odległości tekstów opartej na informacji wzajemnej. Ta sama technika może zostać zastosowania do empirycznego zbudowania drzew rodziny języków, które ściśle odpowiadają drzewom zbudowanym z użyciem metod historycznych. Inną metodą jest zbudowanie modelu językowego opartego na n-gramach z tekstu treningowego dla każdego z języków. Przez tekst wzorcowy rozumie się korpus tekstu zawierający możliwie dużo znaków diakrytycznych, charakterystycznych dla danego języka złożeń oraz słów. Modele te mogą zostać oparte na znakach lub kodowaniu bajtów. W drugim przypadku identyfikacja języka oraz rozpoznawanie kodowania znaków są zintegrowane. Proces samego tłumaczenia rozpoczyna się od utworzenia modelu dla języka źródłowego, a następnie porównaniu go z modelami wzorcowymi. Podejście to może okazać się bezużyteczne w przypadku analizy języka, dla którego nie został stworzony wzorcowy model. W takim przypadku metoda ta zwróci język o największym stopniu podobieństwa spośród tych, których modele zawarte są w systemie. Najbardziej problematyczne są teksty składające się z mieszaniny języków. Jest to sytuacja występująca nagminnie w tekstach internetowych i z tego też powodu w przykładowej implementacji zostało zastosowane, naturalne w takiej sytuacji, zmodyfikowane rozwiązanie, łączące podejścia omówione w dwóch powyższych akapitach. Mianowicie, tekst źródłowy rozbijany jest na pojedyncze słowa o długości co najmniej 2 znaków alfanumerycznych i porównywany z posiadanymi słownikami slangu. Na tej podstawie obliczany jest procent słów w tekście źródłowym pochodzenia slangowego i sugerowany jest odpowiedni słownik. 3. Tłumaczenie kontekstowe w przypadku slangu. Idea tłumaczenia kontekstowego opiera się na próbie możliwie najdokładniejszego uwzględnienia kontekstu współwystępujących w tekście słów w celu lepszego doboru ich odpowiedników słownikowych. Algorytm analizuje statystyczne korelacje różnych ekwiwalentów występującego w danym tekście słownictwa lub struktur gramatycznych. Jego ważną cechą jest fakt, iż nie wymaga on wzorcowego przetłumaczonego tekstu, tak jak ma to miejsce np. w przypadku tłumaczenia statystycznego. Na pierwszy rzut oka mógłby być to argument za użyciem tej metody tłumaczenia, jednak dalsze cechy tego paradygmatu wykluczają jego użycie. Bazowa metoda działania opiera się o model użycia pełnego dwujęzycznego słownika, języka źródłowego i docelowego, oraz translatora wykorzystującego długie, wielowyrazowe n-gramy. Proces tłumaczenia jest dodatkowo wspomagany przez podmianę w tekście wyrazów, których kontekstu nie można dokładnie określić, na ich synonimy lub wyrazy bliskoznaczne. Jest to jeden z powodów, który 19 powoduje, iż metoda ta byłaby niewłaściwą dla tłumaczenia slangu. W przypadku slangu graczy, mającego tendencję do minimalizmu i maksymalnej wręcz kompresji wypowiedzi, podmiana nawet pojedynczego wyrazu jest w stanie całkowicie zafałszować ogólny sens wypowiedzi. Wobec powyższych jedyną metodą przynoszącą spodziewane rezultaty jest bezpośrednie tłumaczenie słownikowe z ewentualną korekcją stylistyki oraz gramatyki wypowiedzi. 4. Identyfikacja i podmiana akronimów. Mechanizm identyfikacji oraz podmiany akronimów jest możliwie prosty, a co za tym idzie niezwykle wydajny. Źródłowy plik tekstowy jest wczytywany do pamięci programu i rozbijany na pojedyncze wyrazy. Jeżeli ich odpowiednik zostanie znaleziony w słownikach, użytych przy tłumaczeniu, jest on podmieniany. Następnie sprawdzane są błędy typu powtórzenia wyrazów i są one usuwane. W teorii możliwe jest zastosowanie odległości edycyjnej, na przykład odległości Levenstheina w celu wyłapywania wyrazów slangowych napisanych z błędem lub objętych celową obfuskacją czyli „zaciemnieniem” utrudniającym jego poprawne odczytanie. Jest to jednak kolejna możliwość wprowadzenia przekłamań w tłumaczeniu ze względu na częste występowanie wyrazów różniących się pojedynczymi znakami. Istotnym jest także fakt, że w przypadku slangu internetowego nie można do końca mówić o konkretnych błędach w zapisie, ponieważ nie istnieje żaden ścisły jego standard. Jedynym, co tak naprawdę mogłoby poprawić dodatkowo system podmiany akronimów jest np. dodatkowy słownik wyjątków, których nie należy podmieniać. Przykładowo F4, jako nazwa klawisza, powinien pozostać wyrazem nieprzetłumaczonym na FA (pomimo zastosowania tłumaczenia Leetspeak) tak samo jak F16, jako nazwa samolotu nie powinien zostać przetłumaczonym na FLG. 1. Tłumaczenie zapisu fonetycznego . Tłumaczenie zapisu fonetycznego słów wymaga dodatkowego indeksu sylab oraz głosek, których podobne brzmienie jest wykorzystywane przez internatów do dokonywania modyfikacji słów. Konieczny jest osobny zbiór nie tylko dla każdego rodzaju slangu, ale także ze względu na pochodzenie internautów, gdyż ze względu na różnice wymowy podmiany fonetyczne mogą różnić się od siebie. Pierwszą fazą w takim przypadku byłoby kolejno podmienienie części wyrazu (np. sylaby) zmienionej przez internautów na jej poprawną wersję a następne korekcja całego wyrazu. W projekcie związanym z pracą zaimplementowano możliwość tłumaczenia tylko podstawowych i najczęściej spotykanych wypowiedzi slangowych stosujących zapis fonetyczny. Jest spowodowane małą próbką przykładowego tekstu, a co za tym idzie ubogim słownikiem. 2. Leetspeak i pochodne. Leetspeak ze względu na brak ustalonej struktury jest odmianą slangu możliwą do tłumaczenia tylko bezpośredniego. Najbardziej zadowalające efekty można otrzymać kolejno rozpoznając rodzaj slangu jako 1337 poprzez wykrycie 20 nagromadzenia kombinacji znaków specjalnych (główna cecha tego slangu). Następnie należy dokonać podmiany wedle tabeli kodowania liter (Tabela 1 zamieszczona poniżej). Po tych operacjach leetspeak powinien już zostać doprowadzony do postaci standardowego, „słownikowego” slangu, z którego tłumaczeniem bezproblemowo poradzi sobie standardowy algorytm tłumacza użyty w implementacji. Należy jednak pamiętać o ciągłej ewolucji tej odmiany slangu i możliwości podmiany liter na odpowiedniki spoza standardowo używanych zakresów kodowania znaków, na przykład w celu ominięcia zabezpieczeń cenzorskich. Możliwości w tym zakresie są praktycznie nieograniczone, co sprawia, iż w przypadku konieczności stworzenia sprawnie działającej implementacji konieczne byłyby jej ciągłe aktualizowanie. Dodatkowo, należy uwzględnić fakt częstego występowania powtórzeń znaków i tworzenia ich kombinacji. Z trudnością tą można sobie jednak częściowo poradzić stosując odpowiednio dobrane wyrażenia regularne, eliminujące powtórzenia. Zasadniczo jednak jedyną niepodważalnie skuteczną metodą byłoby stworzenie słownika zawierającego tłumaczenia najczęściej występujących wyrażeń regularnych i konsekwentne dodawanie do niego kolejnych wyrazów podczas ich napotykania. A 4 /\ @ /-\ ^ aye ∂ B 8 13 |3 ß P> |: !3 (3 /3 )3 |-] C [ © ? T) I7 cl ¢ < ( D ) |) (| |o [) I> |> E 3 & £ { [- |=- F |= ƒ |# ph /= v € G 6 & (_+ 9 C- gee (γ, H # /-/ [-] ]-[ )-( (-) I 1 ! ¡ [, {, <- (. :-: |~| |-| ]~[ }{ | eye 3y3 ][ ? }-{ ] J _| _/ ¿ </ (/ </ _[ K X |< |{ ]{ |X L 1 £ 7 1_ | |_ el [_, M |v| [V] (Y) {V} em AA |\/| /\/\ (u) (V) (\/) /|\ N ^/ |\| /\/ [\] <\> {\} O 0 () oh [] []\ // [] /V ₪ ^ p P |* |o |º ? |^(o) |> |" 9 []D | |7 21 ^^ /|/|//\|\|\ Q (_,) ()_ 0_ <| 0 R |` |~ |? /2 |^ S 5 $ z lz |9 2 ® [z Я .- |2 § ehs es T 7 + -|- 1 '][' U (_) |_| v L| µ † V \/ |/ \| W \/\/ vv \N '// \\' \^/ dubya (n) \V/\X/ \|/ \_|_/\_:_/ Ш uu X >< Ж }{ ecks × Y j `/ Ч 7 \|/ Z 2 7_ -/_ % >_ χ )( ][ }{ s Tabela 1 Zbiór podstawień występujących w leetspeak 22 Rozdział 4 – Opis implementacji automatycznego tłumacza. 1. Architektura aplikacji. Rysunek 5 Główne okno programu Implementacja oprogramowania tłumaczącego została wykonana zgodnie ze standardem Python w wersji 2.7 oraz Qt 4.8.0. Kombinacja ta pozwala zarówno na szybką implementację algorytmów jak i sporą przenośność oprogramowania. Warstwa graficznego interfejsu użytkownika jest oddzielona od warstwy logicznej aplikacji w dość wyraźny sposób. Pliki słowników trzymane są w osobnym folderze o nazwie „dic”. Konfiguracja aplikacji, w której zawiera się wybór słowników, zapisywana jest w pliku config.txt (Rysunek 6). Głównym plikiem wykonywalnym w wersji niedystrybucyjnej (to znaczy nie spakowanej do pojedynczego pliku i dającej wgląd w źródła) jest plik main.py wywołujący główne okno programu (Rysunek 5). Każde następne okno zdefiniowane jest w osobnym pliku. Pozwala to zachować przejrzystość w działaniu aplikacji oraz daje możliwość modyfikacji graficznego interfejsu użytkownika środowiska bezpośrednio w Qt Designerze. Implementacja pozwala także na swobodny dostęp do listy słowników i przeglądania ich treści (Rysunek 7). Przewidziana została także możliwość edycji słowników już istniejących oraz dodawania nowych (Rysunek 8). 23 Rysunek 6 Okno wyboru słowników Rysunek 7 Przeglądanie istniejących słowników 24 Rysunek 8 Edycja słowników 2. Dokładność tłumaczenia w zależności od rodzaju slangu. Jako że całkowita poprawność stylistyczna i gramatyczna nie była celem powstania aplikacji, wypowiedzi tłumaczone są do poziomu w którym możliwe jest ich zrozumienie przez osoby władające językiem angielskim, jednak niezaznajomione ze slangiem internetowym. Poniżej przedstawione zostaną przykłady dwóch rodzajów slangu, tzn. slangu, którym porozumiewają się gracze gry „League of Legends” oraz odmiany mniej hermetycznej czyli slangu występującego powszechnie na forach dyskusyjnych czy też chatach internetowych. 3. Przykłady slangu Przykłady slangu z gry League of Legends: Przykładowe zdanie: „So a tanky dps melee with a banshee vail on low cd, fear, damage buff+speed buff and an epic diving ultimat” 25 Tłumaczenie: „So a resistant damage per second close range attack character with a Banshee Vail (spell) on low spell renewal time, fear, damage reinforcement+speed reinforcement and an epic diving ultimate attack” Znaczenie: „Tak więc [przyp. aut. jest to] wzmocniona (odporna na obrażenia) postać z szybkim atakiem o małym zasięgu zaklęciem Wycie Bashee z niskim czasem odnowienia, odstraszaniem przeciwników, podwyższeniem obrażeń i szybkości oraz epickim (pokazowym) kończącym atakiem nurkującym.” Przykładowe zdanie: „a ranged ad carry, squishy, with damage buffs, invisibility and AS buffs.” Tłumaczenie: „a ranged attack character, weak, with damage reinforcements, invisibility and active spell reinforcements.” Znaczenie: „Postać atakująca na odległość, słaba, ze wzmocnieniem obrażeń, niewidzialnością oraz wzmocnieniem aktualnie używanego zaklęcia.” Przykładowe zdanie: „any1 ells having this problem ?” Tłumaczenie: „anyone els having this problem ?” Znaczenie: „Czy ktoś jeszcze ma ten problem?” Przykładowe zdanie: Tried to feed them in SR and tried to not help in dominion, but the bots still ended up 3 lvls below my teammates in SR and underfed with items both SR and dominion while letting us take bake a base to easy. Tłumaczenie: Tried to well develop them in Summoners Rift map and tried to not help in Dominion game mode, but the bots still ended up 3 lvls below my teammates in Summoners Rift map and underfed with items both Summoners Rift map and Dominion game mode while letting us take bake a base to easy. Znaczenie: Próbowałem rozwinąć ich na mapie „Szczelina Przyzywaczy” i próbowałem nie grać wedle stylu Dominion, jednak boty wciąż były o 3 poziomy niżej w rozwoju niż pozostali członkowie mojej drużyny, którzy mieli już przedmioty zdobyte zarówno w „Szczelinie Przyzywaczy” jak grając w Dominion, przez co zdobycie bazy było dla nas 26 zbyt łatwe. Wnioski z tłumaczenia są bardzo widoczne, tzn. ten rodzaj slangu jest zasadniczo zlepkiem wyrażeń związanych z grą oraz różnymi wariacjami powszechnego slangu internetowego. Tłumaczenie wymyka się standardowym podejściom ze względu na brak poprawnej składni oraz przestrzegania zasad stylistyki oraz ortografii. Najskuteczniejszą metodą okazało się tłumaczenie słownikowe na podstawie zbioru słownictwa związanego z grą. Przykłady powszechnie występującego slangu internetowego: Przykładowe zdanie: “I’m @ the store. <3 U all.” Tłumaczenie: „I’m at the store. love you all” Znaczenie: „Poszłam do sklepu. Kocham was.” Przykładowe zdanie: wut? o i gt wut u mean lolkthxbai. Tłumaczenie: What? Ough I get what you mean Lots of Laugh, OK, Thank you, bye. Znaczenie: Co? A już wiem o co ci chodziło, śmieszne, ok, dzięki, na razie. Przykładowe zdanie: brb, afk Tłumaczenie: be right back, away from keyboard Znaczenie: Zaraz wracam, odchodzę od komputera. W tym przypadku należy dodatkowo zaznaczyć że zwroty te nie powielają się wzajemnie, użycie samego „brb” oznaczało by chwilowe przerwanie rozmowy ale definiowało odejścia od komputera, mogłoby oznaczać np. potrzebę sprawdzenia jakichś informacji, wyszukania plików i tym podobne. Można zauważyć, iż częstotliwość występowania poszczególnych słów jest większa niż innych, te najpopularniejsze przeszły już z rzeczywistości wirtualnej do 27 komunikacji międzyludzkiej prowadzonej twarzą w twarz. Statystycznie najczęściej występujące słowa slangowe pobrane z przykładowych for dyskusyjnych10 to kolejno: 1. cool 2. ya 3. yeah 4. whateva 5. argh 6. no worries 7. geek 8. gonna 9. dunno 10. bro 10 forums.somethingawful.com, forums.digitalspy.co.uk 28 Rozdział 5 – Podsumowanie 1. Podsumowanie wyników tłumaczeń oraz wnioski Przy dokonywaniu oceny jakości tłumaczenia bierze się pod uwagę kilka kryteriów: - dokładność, styl, gramatykę, formatowanie Trudno do końca zdefiniować, jaki powinien być udział procentowy każdego kryterium, gdy dokonujemy oceny jakości tłumaczenia, np. tekstów biznesowych. Czy któreś z nich w największym stopniu decyduje o tym, że tłumaczenie jest skuteczne? "Rodzaj tekstu" jest tutaj kluczowym zwrotem, szczególnie w przypadku slangu internetowego. Oczywiście każdy z wymienionych czynników wpływa na jakość tłumaczenia, jednak zależnie od rodzaju tekstu, ich procentowy wpływ powinien być różny. Wiadomo przecież, że w bajce dla dzieci dokładność nie będzie grała tak wielkiej roli jak styl i gramatyka (jest ona jednym z tych czynników, który w jakimkolwiek rodzaju tekstu niezmiennie będzie miał ogromny wpływ na jakość tłumaczenia). Z kolei w tekście medycznym czy handlowym styl nie będzie aż tak istotny jak dokładność. Rodzaj tłumaczonego tekstu i oczekiwane wyniki wymuszają użycie odpowiedniej metody, zwłaszcza biorąc pod uwagę fakt dalszego przeznaczenia tekstu. Wszystko zależy od rodzaju tłumaczonego tekstu. Z powyższej pracy jasno wynika, iż tłumaczenie slangu, pomimo iż niełatwe- jest możliwe. Jest to głównie kwestia zebrania odpowiednio dużego zasobu słownictwa, a następnie umiejętnego podstawiania go w tekście. Prowadzi to do jasnych wniosków, iż w przypadku slangu internetowego najlepiej sprawdzającą się metodą jest metoda tłumaczenia bezpośredniego z użyciem rozbudowanego słownika. Pozwala to na uzyskanie względnie poprawnej wersji w języku angielskim, którą można poddać dalszej obróbce. Największym problemem jaki pojawił się podczas tworzenia pracy oraz oprogramowania był dobry dostęp do zasobów słownikowych oraz ich tłumaczeń. Myślę, że w przypadku rozwoju podobnego projektu przez społeczność zamiast pojedynczą jednostkę można by otrzymać o wiele lepsze rezultaty końcowe. Podsumowując, można powiedzieć, iż jakość tłumaczeń otrzymanych w wyniku działania przedstawionego w pracy oprogramowania tłumaczącego jest zadowalająca, tzn. pozwala zrozumieć intencje piszącego niezaznajomionego ze specyfiką wypowiedzi internautów. 29 Bibliografia 1. J. Grzenia, Komunikacja językowa w Internecie, Wydawnictwo Naukowe PWN, Warszawa 2006 2. Joanna Wrycza, Galaktyka języka Internetu, Novae Res, Gdynia 2008 3. Becela J., Gruszczyński W. (2003). Polszczyzna na czatach. [w:] "Studia Medioznawcze" 4. Oczkowski M. (1999). Język użytkowników sieci komputerowej Internet. 5. Van der Leun G., Mandel T. (1998). Netykieta - kodeks dla internautów. 6. Computer Mediated Communication: Social Interaction and the Internet, 2004 7. Barbara Kaye, The World Wide Web: A Mass Communication Perspective, 2001 8. Łukasz Bogucki, Tłumaczenie wspomagane komputerowo, 2009 30 31 Dodatek Załącznik 1 Lista częściej występujących akronimów internetowych11 Skrót 2U2 4 4U A/S/L AAAAA Rozwinięcie angielskie To You Too For For You Age, Sex, Location American Association Against Acronym Abuse AAE AAMOF AAR ABCDTF ABOC ABT ACATS ADN AFAIC AFAICR AFAICT AFAIK AFAIR AFAR AFAYC AFAYK AFINIAFI AFITP AFJ AFK AFS AFU AI At All Events As A Matter Of Fact At Any Rate A Burnt Child Dreads The Fire A Bone Of Contention About As Cross As Two Sticks Any Day Now As Far As I'm Concerned As Far As I Can Recall As Far As I Can Tell As Far As I Know As Far As I Remember As Far As Remember As Far You're Concerned As Far As You Know A Friend In Need Is A Friend Indeed A Flash In The Pain April Fool's Joke Away From Keyboard At First Sight All Fucked Up 1. As If 2. Artificial Intelligence Another IBM Mistake Ah I See It As I Understand It Also Known As As Late As Possible Adios, Mother Fucker All My Love And Now For A Word From Our Sponsors And Now For Something Completely Different Army Of Lamers A Rain Day As Soon As Fucking Possible As Soon As Possible Age, Sex, Location Any Stick To Beat A Dog All The Best At The Moment Along The Same Line Anything You Say As Well As Are We Going To Have To Go Through All This Again? Are We Going To Have To Go Through This Again? Absent Without Leave Awaiting Your Reply Ask Your Fucking Question At Your Own Risk AIM AISI AIUI AKA ALAP AMF AML ANFAWFOS ANFSCD AOL ARD ASAFP ASAP ASL ASTBAD ATB ATM ATSL ATYS AWA AWGTHTGTATA AWGTHTGTTA AWOL AWYR AYFQ AYOR 11 www.noslang.com/dictionary 32 Znaczenie polskie Wzajemnie Dla Dla Ciebie, Dla was Wiek, płeć, miejscowość Amerykańskie Stowarzyszenie Przeciwko Nadużywaniu Skrótów Na wszelki wypadek W istocie W każdym razie Kto się sparzy gorącym, ten na zimne dmucha Przedmiot sporu, Kość niezgody Mniej więcej, w przybliżeniu Zły jak osa, Rozgniewany Na dniach Jak tylko się skoncentruję O ile sobie przypominam O ile mogę powiedzieć Z tego co mi wiadomo O ile pamiętam O ile pamiętam Jak tylko się skoncentrujesz Z tego co Ci wiadomo Przwdziwego przyjaciela poznaje się w biedzie Słomiany ogień; Fiasko; Klapa Żart Prima Aprilisowy Z dala od klawiatury Na pierwszy rzut oka Wszystko się spieprzyło 1. Jak gdyby, jakby 2. Sztuczna inteligencja Kolejna pomyłka... Aha, rozumiem Na ile to rozumiem Znane (-y/-a) także jako Tak późno, jak to jest możliwe Żegnaj skurwielu Wszystkie moje miłości A teraz słowo od naszych sponsorów A teraz coś zupełnie innego Rzesze lamerów Czarna godzina; Ciężkie chwile Tak szybko jak tylko to kurwa możliwe Tak szybko jak tylko to możliwe Wiek, płeć, miejscowość Kto chce psa udeżyć, zawsze kij znajdzie Wszystko najlepsze; Wszystkiego najlepszego W tej chwili Wzdłuż tej samej linii Cokolwiek powiesz Jak również; Zarówno Czy znowu musimy to wszystko przechodzić? Czy znowu musimy to przechodzić? Nieobecność bez opuszczania Oczekując Twojej odpowiedzi Zadaj swoje pieprzone pytanie Na Twoje własne ryzyko AYPI AYPTF B B/C B4 B4N BAD And Your Point Is Are You Playing The Fool? Bye Because Before Bye For Now Broken As Designed BAF BAK BAM Brain Alredy Fried Back At Keyboard By All Means BAMF BAT BB4N BBFN BBIAB BBIAF BBL BBN BBR BBS BBSL BC BCNU BD BEG BF BFAI BFD BFFL BFI BFN BG BGFETE BICBW BIF BIMBW BIOYIOP BITB BKA BM BNM Bad Assed Mother-Fucker Back At Terminal Bye Bye For Now Bye Bye For Now Be Back In A Bit Be Back In A Few (Minutes, ...) Be Back Later Bye Bye Now Burnt Beyond Repair Be Back Soon Be Back Soon Or Later Because Be Seein' You Big Deal Big Evil Grin Boy Friend Brute Force And Ignorance Big Fucked Deal Best Friends For Life Brute Force And Ignorance Bye For Now Big Grin Big Grin From Ear To Ear But I Could Be Wrong Basis In Facts But I May Be Wrong Blow It Out Your I/O Port Back In The Business Better Known As Bite Me By No Means BOC BOFH BOHICA BOT BOWY BRB BRBGTGP BRGDS BRS BS BSOD BST BTA BTDT BTDTGTS BTS BTU BTW BWFH BWK BWL But Of Course Bastard Operator From Hell Bend Over, Here It Comes Again Back On Topic Be Off With You Be Right Back Be Right Back, Got To Go Pee Best Regards Big Red Switch Bull Shit Blue Screen Of Death But Seriously Though But Then Again Been There Done That Been There Done That, Got the T-Shirt Better Than Shit Back To You By The Way Bastard Webmaster From Hell Big Wet Kiss Bursting With Laughter A Twoim punktem widzenia jest... Czy Ty sobie kpisz? Cześć (na do widzenia) Ponieważ Wcześniej Do zobaczenia, na razie Zepsute z założenia Złamany zgodnie z planem Mózg mi się już usmażył Z powrotem przy klawiaturze (komputerze) Wszelkimi sposobami Za wszelką cenę Oczywiście Pierdolony skurwysyn Z powrotem przy terminalu (komputerze) Do zobaczenia, na razie Do zobaczenia, na razie Wracam za moment (za bit) Wracam za chwilę (kilka minut,...) Wracam później Na razie Spalić, gdyż jest nie do naprawy Wracam wkrótce Wrócę za chwilę lub później Ponieważ Do zobaczenia Wielka mi rzecz Złośliwy uśmiech Chłopak (w sensie sympatii) Brutalna siła i ignorancja Wielka mi kurwa rzecz Najlepsi przyjaciele w życiu Brutalna siła i ignorancja Do zobaczenia; Na razie Wielki uśmiech Wielki uśmiech od ucha do ucha Ale mogę (mogłem) się mylić Oparte na faktach Lecz mogę sie mylić Wyrzuć to z siebie; Powiedz wreszcie Z powrotem w interesie Lepiej znany jako... Ugryź mnie! Stanowczo nie Bynajmniej W żadnym razie Wcale Ależ oczywiście Pieprzony operator Pochyl się, To nadchodzi znowu Wracając do tematu Idź stąd Zaraz wracam Zaraz wracam, muszę iść się wysikać Najlepsze życzenia "Duży czerwony wyłącznik" Gówno prawda Niebieski ekran śmierci (błąd w sustemie Windows) Jednak na poważnie Ale przecież.... Byłem tam, zrobiłem to Byłem tam, zrobiłem to i wygrałem podkoszulek Lepsze niż gówno Wracając do Ciebie Swoją drogą; Przy okazji; A'propos; A tak w ogóle Pieprzony webmaster Namiętny pocałunek Wybuchnąć śmiechem 33 BYOB C&G C4N CAD CB CBL CFN CIS Bring Your Own Booze Chuckle And Grin Ciao For Now Ctrl + Alt + Del Citizens Band Come Back Later Ciao For Now Compuserve (Consumer) Information Service CNP CRAFT CSS CU CUL CUL8R CUNT CWYL CYA CYL DIIK DILLIGAD DILLIGAF DIY DL (D/L) DLN DPAITNWL Continued in Next Post Can't Remember A Fucking Thing Can't Stop Smiling See You See You Later See You Later See You Next Time Chat With You Later See You See You Later Damned If I Know Does It Look Like I Give A Damn? Does It Look Like I Give A Fuck? Do It Yourself Download Don't Leave Now Disturbing People And Irritating The Neighbours With Laughter Desperately Seeking Help Do The Right Thing Did You See That? Don't Worry Be Happy Do You Have A Boyfriend? Do You Have A Girlfriend? Do Your Own Homework Evil Grin E-mail Me Later E-mail Message End Of Discussion End Of Message End Of Transmission (Thread) Eat Shit And Die Eat Shit And Die Eat Shit And Die Mother Fucker Extended Three Letter Acronym Easy Face To Face Frequently Asked Question For A Second For A While Furrowed Brow For Better Or For Worse Falling Down, Rolling On The Floor, Laughing Fire And Forget Fire And Forget Fucked If I Know First In, Still Here Fill In The Blanks Fuck Off And Die Friend Of A Friend Finger Of Death Falling Off The Chair Laughing Face To Face Faster Then Light From Time To Time Fouled/Fucked Up Beyond All Recognition/Repair For What It's Worth Fuck You DSH DTRT DUCT DWBH DYHABF DYHAGF DYOH EG EMML EMSG EOD EOM EOT ES&D ESAD ESADMF ETLA EZ F2F FAQ FAS FAW FB FBOFW FDROTFL F&F FF FIIK FISH FITB FOAD FOAF FOD FOTLC FTF FTL FTTT FUBAR FWIW FY 34 Przynieś swój własny alkohol Chichocząc i śmiejąc się Do zobaczenia, na razie Ctrl + Alt + Del Pospolite ruszenie Wrócę później Do zobaczenia, na razie Punkt pomocy dla użytkowników komputerów (konsumentów) Dokończenie w następnej wiadomości Nie mogę sobie tego przypomnieć Nie mogę przestać się śmiać Do zobaczenia Do zobaczenia później Do zobaczenia później Do zobaczenia następnym razem Pogadam z Tobą później Do zobaczenia Do zobaczenia później Naprawdę nie wiem Czy wygląda to tak, jakby mnie to obchodziło? Czy wygląda to tak, jakby mnie to obchodziło? Zrób to sam Ściąganie plików Nie odchodź teraz, Nie przestawaj Przeszkadzając ludziom i irytując sąsiadów śmiechem Rozpaczliwie poszukuję pomocy Zrób coś dobrego / Zrób to dobrze Widziałeś to?, Wiedziałeś o tym? Nie przejmuj się Czy masz chłopaka? Czy masz dziewczynę? Odrób swoją pracę domową Diabelski uśmiech Napisz do mnie później Wiadomość pocztowa Koniec dyskusji Koniec wiadomości Koniec dyskusji (wątku) Spadaj; spieprzaj Spadaj; spieprzaj Spadaj; spieprzaj skurwysynie Rozszerzony trzyliterowy skrót Łatwizna Twarzą w twarz; określenie na spotkanie w rzeczywistości Często zadawane pytania Na sekundę Na chwilkę Zmarszczone brwi Na dobre i na złe Tarzać się ze śmiechu Spal i zapomnij Spal i zapomnij Kurwa, nie wiem Pierwszy wszedł i ciągle jest Wypełnij puste miejsca Spierdalaj Przyjaciel przyjaciela Dotyk śmierci Usiąść sobie ze śmiechu Twarzą w twarz; określenie na spotkanie w rzeczywistości Szybciej niż światło Od czasu do czasu Tego już nie da się naprawić Na ile to jest tego warte Pieprz się FY&TSYRIO FYA FYATHYRIO FYBITS FYDITM FYE FYEO FYI G GA GAFIA GAMMD GBH GBH&K GD&R GDM8 GFC GFD GG GH GIGO GIWIST GL GLGH GOK GMTA GR8 GTG GFSY GW H HAGN H&K HAK HAND HB HF HHIS HHOJ HHOK HHOS HHTYAY HIWTH HIH HMP HNY HORU HSIK HTH HYCFAPMSFTJ IAC IAE IAIYH IANAL IC ICBW ICN ICOCBW IDA IDK IDTT IIR IIRC IIRCAID IIRR IITYWIMIWHTKY Fuck You And The Sysop You Rode In On For Your Amusement Fucked You And The Horse You Rode In On Fucking You, Buddy, I'm The Sysop Fuck You Directly In The Mouth For Your Entertainment For Your Eyes Only For Your Information Grin Go Ahead Get Away From It All Go Ahead Make My Day Great Big Hug Great Big Hug And Kiss Grinning, Ducking And Running Good Day Mate Going For Coffee Going For Drink Gotta Go Getting Hard Garbage In Garbage Out Gee, I Wish I'd Said That Good Luck Good Luck And Good Hunting God Only Knows Great Minds Think Alike Great Got To Go Glad To See You Getting Wet Hug Have A Good Night Hug And Kiss Hug And Kiss Have A Nice Day Hug Back Have Fun Hanging Head In Shame Ha Ha Only Joking Ha Ha Only Kidding Ha Ha Only Serious Happy Holidays To You And Yours Hate It When That Happens Hope It Helps Help Me Please Happy New Year How Old Are You How Should I Know Hope That Helps Honestly You Couldn't Find A Person More Suited For The Job In Any Case In Any Event It's All In Your Head I Am Not A Lawyer I See I Could Be Wrong I See Now I Could Of Course Be Wrong I Dislike Acronyms I Don't Know I'll Drink To That! If I Recall If I Recall Correctly If I Recall Correctly And I Do If I Recall Rightly If I Tell You What It Means, I Will Have To Kill You 35 Pieprzę Ciebie i Sysop'a któremu włazisz w dupę Aby Cię ucieszyć Pieprzę Ciebie i konia na którym przyjechałeś Pieprzę Cię, jestem sysopem (administratorem systemu) Pieprzę Cię Aby Cię ucieszyć Tylko do twojego wglądu Dla twojej informacji Uśmiech No, dalej Zabieraj się stąd No, dalej pokaż co potrafisz Mocne uściski Mocne uściski i ucałowania Uśmiech, unik i ucieczka Miłego dnia Idę na kawę Wyskakuję na drinka Muszę spadać Twardnieje Śmiecie na wejściu, śmiecie na wyjściu Ojej, życzyłbym sobie powiedzieć coś takiego Powodzenia Powodzenia i pomyślnych łowów Bóg jeden raczy wiedzieć Wielkie umysły myślą podobnie Świetnie, super Muszę iść Cieszę się, że Cię widzę Staje się wilgotna Uściski Życzę Ci miłej nocy Uściski i ucałowania Uściski i ucałowania Życzę Ci miłego dnia Uściski wzajemnie Baw się dobrze Spuścić głowę ze wstydu Ha ha to był żart Ha ha to był żart Ha ha to było na poważnie Miłych wakacji Nie cierpię jak to się dzieje Mam nadzieję, że to pomogło Proszę o pomoc Szczęśliwego Nowego Roku Ile masz lat Jak miałem to wiedzieć? Mam nadzieję że to pomoże Naprawdę nie moglibyście znaleźć osoby bardziej nadającej się do tej roboty W każdym razie; w każdym przypadku W każdym razie; w każdym przypadku To wszystko masz w głowie Nie jestem prawnikiem Aha Mogę się mylić Aha, teraz już wiem Mogę się oczywiście mylić Nie lubię skrótów Nie wiem Wypiję za to! O ile pamiętam Jeśli dobrze sobie przypominam Jeśli dobrze sobie przypominam, a sądzę, że tak Jeśli dobrze sobie przypominam Jeśli powiem ci, co to znaczy, będę musiał cię zabić IITYWIMWYBMAD IKWYM ILIC ILU ILY IMAO IMCAO IMCO IME IMHO IMNSHO IMO IMOBO IMPE IMPOV IMS IMVHO INL INPO IOU1 IOW IRL ISTM ISTR ISWYM ITRW ITYM IWALU IWBNI IWBS IYD IYHO IYKWIM IYKWIMAITYD IYSWIM J4G JAM JAS JASE JFG JFYI JIC JK (J/K) JMO JONCL JSNM JTLYK JTYWTK K KB KHYF KISS KMYF KOC KOL KOTC KWIM L L8R L8R G8R LAB&TYD If I Tell You What It Means, Will You Buy Me A Drink? I Know What You Mean I Laughted, I Cried I Love You I Love You In My Arrogant Opinion In My Completely Arrogant Opinion In My Considered Opinion In My Experience In My Humble Opinion In My Not So Huble Opinion In My Opinion In My Own Biased Opinion In My Personal/Previous Experience In My Point Of View I'm Sorry In My Very Humble Opinion I'm Not Laughing In No Particular Order I Owe You One In Other Words In Real Life I Seems To Me I Seem To Recall/Remember I See What You Mean In The Real World I Think You Mean I Will Always Love You It Would Be Nice If I Was Being Stupid In Your Dreams In Your Humble Opinion If You Know What I Mean If You Know What I Mean And I Think You Do If You See What I Mean Just For Grins Just A Minute Just A Second Just Another System Error Just For Grins Just For Your Information Just In Case Just Kidding Just My Opinion Jumping Onto Neighbour's Car Laughing Just Stark Naked Magic Just To Let You Know Just Thought You Wanted To Know Kiss Kiss Back Know How You Feel Keep It Simple, Stupid Kiss Me You Fool Kiss On Cheek Kiss On Lips Kiss On The Cheek Know What I Mean Laugh Later Later 'Gater Life Is A Bitch & Then You Die LABTYD Life Is A Bitch, Then You Die LAFS LAGNAF LAY Love At First Sight (Site) Let's All Get Nacked And Fuck Looking At You 36 Jeśli powiem ci, co to znaczy, postawisz mi drinka? Wiem co masz na myśli Śmiałem się, płakałem Kocham Cię Kocham Cię Moim aroganckim zdaniem Moim kompletnie aroganckim zdaniem W mojej rozważonej opinii W moich doświadczeniach Moim skromnym zdaniem Moim nieskromnym zdaniem Moim zdaniem Moim "zakręconym" zdaniem Według moich osobistych/wcześniejszych doświadczeń Z mojego punktu widzenia Przepraszam Moim bardzo skromnym zdaniem Nie śmiałem się Niekoniecznie w dobrej (tej) kolejności Jestem Ci winien jedną, jedno (kolejkę, piwo itp.) Innymi słowy W rzeczywistym świecie Wydaje mi się Wydaje mi się, że sobie przypominam (że pamiętam) Wiem co masz na myśli W rzeczywistym świecie Myślę, że chodzi ci o.... Zawsze będę Cię kochał Byłoby miło gdyby... Byłem głupi W Twoich marzeniach Twoim skromnym zdaniem Jeśli wiesz co mam na myśli Jeśli wiesz co mam na myśli, a wydaje mi się że wiesz Jeśli wiesz co mam na myśli Po prostu dla śmiechu Za moment Za sekundę Po prostu kolejny błąd systemu Po prostu dla śmiechu Właśnie dla Twojej wiadomości Na wypadek To tylko żart Po prostu w mojej opinii Skacząc ze śmiechem po samochodzie sąsiada Pełna całkowita magia Powinieneś to wiedzieć Pomyśl jeśli chcesz wiedzieć Buziak Buziak wzajemnie Wiem co czujesz, wiem jak się czujesz Niech to będzie proste Całuj mnie głupcze Buziak w policzek Całus w usta Buziak w policzek Wiesz co myślę? Śmiech Do zobaczenia później Na razie, trzymaj się Życie jest brutalne i pełne zasadzek ("Lajf is brutal and full of zasadzkas") Życie jest brutalne i pełne zasadzek ("Lajf is brutal and full of zasadzkas") Miłość od pierwszego wejrzenia Rozbierzmy się wszyscy i pieprzmy się Patrząc na Ciebie LDR LHM LHU LIS LJBF LLAL LLTA LMAO LO LOIS LOL LOL LOLA LOLAK LOOL LOMS LTIP LTNC LTNS LTNT LTS LTR LU4E&A LUWAMH LWR LY LYL LYLAB LYLAS M8 MCIBTYC MEG MEGO MHBFY MMF MOF MOFO MORF MOTAS MOTOS MOTSS MPTY MSG MTFBWY MYK MYOB N2S NA (N/A) NALOPKT NB NBD NBIF NC NFI NFW NFWM NG NHOH NIMBY N-Joy NK NM NMTBS NONYB NOYB NP (N/P) NPNG NRN Long Distance Relationship Lord Help Me Lord Help Us Lost In Space Let's Just Be Friends Laughing Like A Lunatic Lots And Lots Of Thunderous Applause Laughing My Ass Off Lust (Love) Object Laughing On The Inside Laugh Out Loud Lots Of Love Laugh Out Loud Again Lots Of Love And Kisses Laughing Out Outrageously Loud Looking Over My Shoulder Laughing Till I Puke Long Time, No See Long Time, No See Long Time, No Type Laughing To Self Long Term Relationship Love You For Ever And Always Love You With All My Heart Launch When Ready Love You Love You Lots Love You Like A Brother Love You Like A Sister Mate My Computer Is Better Than Your Computer Mega Evil Grin My Eyes Glaze Over My Heart Bleeds For You Make Money Fast Male Or Female My Own Fucking Organization Male Or Female Member Of The Appropriate Sex Member Of The Opposite Sex Member Of The Same Sex More Power To You Message May The Force Be With You! Minimize Your Keystrokes Mind Your Own Business Needless To Say Not Acceptable/Available Not A Lot Of People Know That Nota Bene No Big Deal No Basis In Facts No Comments No Friggin' Idea No Fucking Way No Fucking Way Man Nice Guy/Gal Never Heard Of Him/Her Not In My Backyard Enjoy New Kid Never Mind Nothing More To Be Said Non Ya Business None Of Your Business No problem No Pain No Gain No Replay Neccessery 37 Znajomość (miłość) na odległość Panie (Boże) pomóż mi Panie (Boże) pomóż nam Zagubiony w przestrzeni Bądźmy przyjaciółmi Śmiać się jak obłąkany Gorący aplauz Śmiejąc się do rozpuku Obiekt pożądania (miłości) Śmiać się w duchu Śmiech na sali Gorące pozdrowienia Ponownie śmiech na sali Gorące pozdrowienia i ucałowania Szalony śmiech na sali Patrząc przez ramię Śmiech aż do rozpuku (w oryginale: do porzygania się) Wiele czasu się nie widzieliśmy Wiele czasu się nie widzieliśmy Wiele czasu nie pialiśmy do siebie Śmiać się do siebie Znajomość na dłuższą metę Kocham Cię na wieki Kocham Cię całym sercem Włącz gdy będziesz gotowy Kocham Cię Kocham Cię mocno Kocham Cię jak brata Kocham Cię jak siostrę Przyjaciel (potocznie: żona, mąż) Mój komputer jest lepszy od Twojego Bardzo złośliwy uśmiech Wzruszyłem się Moje serce krwawi przez Ciebie Szybki zarobek Facet czy kobieta? Moja własna pieprzona organizacja Facet czy kobieta? Przedstawiciel (-ka) właściwej płci Przedstawiciel (-ka) przeciwnej płci Przedstawiciel (-ka) tej samej płci Więcej władzy dla Ciebie Wiadomość Niech moc będzie z Tobą! Przestań o tym pisać (gadać) Pilnuj swoich spraw Nie ma potrzeby mówić Nie dozwolone / Nie osiągalne Mało ludzi wie o tym Nota bene (warto zaznaczyć, zauważyć) Bez rewelacji Bezpodstawnie Bez komentarza Nie dopracowany pomysł Nie ma mowy! Nie ma mowy! Fajny chłopak (dziewczyna) Nigdy nie słyszałem o nim/niej Nie w mojej Organizacji (ekipie, paczce,...) Ciesz się Nowy (kolejny) dzieciak Nic ważnego, Nie ma sprawy Nic więcej do dodania Nie Twój interes Nie Twój interes Nie ma sprawy Nie ma bólu, nie ma zysku Odpowiedź nie jest konieczna NSS NTDBWY NTG NTK NTK NTYMI OAO OATUS OAUS OB OBJ OBTW OIC OH OK OL OM OMG ONNA ONNTA OO OOI OOO OOTC OOTQ ORN OT OTF OTL OTOH OTOOH OTT OTTH OUSU P? PB PCYLIHOONL PDA PDS PFM PG PITA PLMK PLS PM PMBI PMFBI PMFJI PMJI PMP POETS POM POS POSSLQ POV PPL PSSSLQ PTB PTL Q&A QL QT RAD RAEBNC RAW RE RE No Shit, Sherlock Nice To Do Business With You Not This Group Need To Know Nice To Know Now That You Mention It Over And Out On A Totally Unrelated Subject On An Unrelated Subject Obligatory Obligatory Joke Oh, By The Way Oh I See Off Hand All Correct Old Lady Old Man Oh My God Oh No, Not Again! Oh No, Not This Again! Over And Out Out Of Interest Out Of Order Obligatory On Topic Comment Out Of The Qestion Oh Really Now Off-Topic On The Floor Out To Lunch On The Other Hand On The Other Other Hand Over The Top On The Third Hand Oh, You Shut Up! Beg Your Pardon? Potty Break Please Cross Your Legs, I Have Only One Nail Left Public Display of Affection Please Don't Shoot Pure Fucking Magic Pretty Good Pain In The Ass Please Let Me Know Please Preventive Maintenance Pardon My Butting In Pardon Me For Butting In Pardon Me For Jumping In Pardon My Jumping In Peeing My Pants Piss Of Early Tomorrows Saturday Phase Of The Moon Piece Of Data Person Of Opposite Sex Sharing Living Quarters Point Of View People Person Of Same Sex Sharing Living Quarters Powers That Be Praise The Lord Questions & Answers Cool Cutie Raw, Unadulterated Dumbness Read And Enjoyed, But No Comment Rules As Written Regarding Hi Again 38 Poważnie?, Co Ty nie powiesz? Miło robić z Tobą interesy Nie ta grupa Potrzebuję wiedzieć Dobrze by było wiedzieć Skoro już o tym wspominasz Bez odbioru Kompletnie nie w temacie Nie w temacie Obowiązkowo Nie na poważnie (koniecznie żartuj) Och, a tak przy okazji... Och rozumiem, Aha Precz z łapami Wszystko w porządku Starsza pani Starszy pan O, Boże! Och nie, tylko nie znowu! Och nie, tylko nie znowu to samo! Bez odbioru Poza zainteresowaniem Zepsute Obowiązkowy komentarz do tematu Nie ma mowy Teraz poważnie Nie na temat Na podłodze Wyszedłem na obiad Z drugiej strony... Z drugiej, drugiej strony... Ponad wszystko A jeszcze z innej strony... Zamknij się! Słucham? Pora do kibelka Proszę, skrzyżuj nogi, został mi tylko jeden gwóźdź Publiczne obnażanie się ze swoich uczuć Proszę nie strzelać Czysta pieprzona magia Nieźle Uciążliwe (jak czyrak na dupie) Proszę poinformujcie mnie Proszę Profilaktyczna konserwacja (ochrona) Przepraszam za wtrącanie się Przepraszam za wtrącanie się Przepraszam za wtrącanie się Przepraszam za wtrącanie się Oszczałem swoje spodnie Odczep się , jutro sobota Faza księżyca Fragment danych Współlokator przeciwnej płci Punkt widzenia Ludzie Współlokator tej samej płci Siła (władza) to jest to Chwała Bogu Pytania i odpowiedzi Ekstra Kochanie Prawdziwy, niedojrzały głupek Czytaj i się ciesz, ale nie komentuj Zasady jak napisano W odpowiedzi na... / W odniesieniu do... Witam znowu REHI RE'S RFC RFD RFI RGDS RL ROFL ROTFL ROTFLAHMS ROTFLBTC ROTFLBTCUTS ROTFLGO ROTFLMAO ROTFLMAOAPMP ROTFLSTC ROTM RSN RTD RTFAQ RTFF RTFFAQ RTFM RTM RTSM RUOK RU M/F RUMOF RTW RYFM S S S&N SASB SB SCNR SED SETE SFLA SHIT SHTSI SIG SIL SIP SITD SLV SMO SMOff SNAFU SO SOB SOHF SOL SOOL SOS SOS SOSDD SOVS SPAM SS SSEWBA ST-TNG ST-TOS SUP Hi Again Hi Again Request For Comment Request For Discussion Request For Information Regards Real Life Roll On Floor Laughing Roll On The Floor Laughing Roll On The Floor Laughing And Holding My Side Roll On The Floor Laughing Biting The Carpet Roll On The Floor Laughing Biting The Carpet Unable To Stop Roll On The Floor Laughing Guts Out Roll On The Floor Laughing My Ass Off Roll On The Floor Laughing My Ass Off And Peeing My Pants Roll On The Floor Laughing Scaring The Cat Right On The Money Real Soon Now Read The Documentation Read The FAQ Read The Fucking FAQ Read The Fucking FAQ Read This Fucked Manual/Message Read This Manual/Message Read The Stupid Manual/Message Are You OK? Are You Male/Female Are You Male Or Female Repeat Whole Thing Read Your Fucking Manual Sigh Smile Smile And Nod Sobbind And Sniffing Bitterly Smile Back Sorry, Could Not Resist Said Enough Darling Smiling Ear To Ear Stupid Four Letter Acronym Sure Happy It's Thursday Somebody Had To Say It Special Interest Group Sister In Law Self-inflicxted Problem Still In The Dark C'est la vie Serious Mode On Serious Mode Off Situation Normal, All Fucked Up Significant Other Son Of The Bitch Sense Of Humor Failure Sooner Or Later Still Out Of Luck Someone Special Same Old Sucker Same Old Sucker Different Day Someone Very Special Stupid Persons' Advertisement So Sleepy Someday Soon, Everything Will Be Acronym Star Trek - The Next Generation Star Trek - The Original Series what'S UP 39 Witam znowu Witam znowu Prośba o komentarz Dyskusja pożądana Prośba o informacje Pozdrowienia Rzeczywiste (prawdziwe) życie Tarzając się po podłodze ze śmiechu Tarzając się po podłodze ze śmiechu Tarzając się po podłodze ze śmiechu i trzymając za boki Tarzając się po podłodze ze śmiechu i gryząc dywan Tarzając się po podłodze ze śmiechu i gryząc dywan i nie mogąc przerwać Tarzając się po podłodze ze śmiechu i wypluwając wnętrzności Tarzając się po podłodze ze śmiechu do rozpuku Tarzając się po podłodze ze śmiechu do rozpuku i lejąc w spodnie Tarzając się po podłodze ze śmiechu i strasząc kota Tylko dla pieniędzy Teraz; już Przeczytaj dokumentację Przeczytaj FAQ Przeczytaj pieprzone FAQ Przeczytaj pieprzone FAQ Przeczytaj ten pieprzony podręcznik/komunikat Przeczytaj ten podręcznik/komunikat Przeczytaj ten głupi podręcznik/komunikat Wszystko w porządku? Jesteś mężczyzną czy kobietą? Jesteś mężczyzną czy kobietą? Powtórz całość Przeczytaj swój pieprzony podręcznik Westchnienie Uśmiech Uśmiech i przytaknięcie Płacząc i żałośnie pociągając nosem Uśmiech nawzajem Przepraszam, nie mogłem się oprzeć Powiedziałeś (-aś) dość kochanie Śmiejąc się od ucha do ucha Głupi czteroliterowy skrót Na szczęście to tylko czwartek Ktoś już to powiedział Szczególnie interesująca grupa Szwagierka, bratowa Samowywołujący się problem Ciągle błądzisz w ciemnościach Takie jest życie Na poważnie Niepoważnie Sytuacja jest normalna, wszystko jest do niczego Połowica Sukinsyn Popsuło się poczucie humoru Prędzej czy później Ciągle masz pecha Ktoś specjalny To samo co zawsze To samo co zawsze tylko inny dzień Ktoś bardzo specjalny Głupie ogłoszenie Jestem śpiący Pewnego dnia wkrótce do wszystkiego będą skróty Star Trek - Następne pokolenie Star Trek (oryginalna seria) Jak leci? SWAK SWALK SWEIN SWMBO SYL SYS SYSOP SYT TA TAFN TANJ TANSTAAFL TARFU TBA TBDL TBDML TBH TCB TDK TFTT TGIF THX TIA TIATLG TIC TINWIS TL&EH TLA TLG TMTOWTDT TNT TNX TNX1.0E6 TOY TPTB TT TTBOMK TTFN TTUL TTYL TTYS TTYT TVM TWIT TX TY TYCLO TYVM U U2 UCCOM UL (U/L) UOK UOM$ UOMM UR UTBA VBG VEG VES VFM VR VWG VWS W W8 WAD WAUF Sealed With A Kiss Sealed With A Loving Kiss So What Else Is New? She Who Must Be Obeyed See You Later See You Soon SYStem OPeratpr See You Tonight Thanks Again That's All For Now There Ain't No Justice There Ain't No Such Thing As A Free Lunch Things Are Really Fucked Up To Be Announced To Be Discussed Later To Be Discussed Much Later To Be Honest Trouble Come Back The Dog's Knob Thanks For The Tip Thanks God It's Friday Thanks Thanks In Advance Truly, I Am A Living God Tongue In Cheek That Is Not What I Said True Love And Eternal Happiness Three Letter Acronym The Living God There's More Than One Way To Do This Till Next Time Thanks Thanks A Million Thinking Of You The Powers That Be Take That To The Best Of My Knowledge Ta Ta For Now Talk/Type To You Later Talk To You Later Talk To You Soon Talk To You Tomorrow Thanks Very Much That's What I Think Thanks Thank You Turn Your CAPS LOCK Off! Thank You Very Much You You Too You Can Count On Me Upload Are You OK? You Owe Me Money You Owe Me Money You Are Use The Bloody Altavista Very Big Grin Very Evin Grin Very Evin Smile Value For Money Virtual Reality Very Wicked Grin Very Wicked Smile Wink Wait Without A Doubt Where Are You From? 40 Przypieczętowane pocałunkiem Przypieczętowane miłosnym pocałunkiem I co poza tym nowego Ta, której trzeba słuchać Do zobaczenia później Do zobaczenia wkrótce Operator systemu, "szef" kanału na IRC-u Do zobaczenia wieczorem Ponownie dzięki Na razie to wszystko; to by było na tyle Nie ma sprawiedliwości Nie ma czegoś takiego, jak darmowy lunch Wszystko jest naprawdę popieprzone Ogłasza się (skrót poprzedzający jakieś ogłoszenie) Dyskusja odbędzie się później Dyskusja odbędzie się znacznie później Szczerze mówiąc Problemy powróciły Bardzo dobrze; bardzo dobry Dzięki za poradę Dzięki Bogu mamy piątek Dzięki Dziękuje z góry Naprawdę, jestem żyjącym bogiem Sarkastycznie To nie jest to co powiedziałem Prawdziwa miłość i niegasnące szczęście Trzyliterowy skrót Żyjący (Prawdziwy) bóg Jest więcej niż jeden sposób aby zrobić to Do następnego razu Dzięki Wielkie dzięki Myśląc o Tobie Potęga życia Weź to O ile wiem Do zobaczenia Porozmawiam z Tobą / Napiszę do Ciebie później Porozmawiamy później Porozmawiamy wkrótce Porozmawiamy jutro Wielkie dzięki To wszystko co o tym myślę Dzięki Dziękuję Ci Wyłącz CAPS LOCK'a! Dziękuję Ci bardzo Ty Ty również Możesz na mnie liczyć Wysyłanie plików Wszystko w porządku? Jesteś winien mi forsę Jesteś winien mi forsę Jesteś Użyj pieprzonej Altavisty (wyszukiwarki) Bardzo duży uśmiech Bardzo złośliwy uśmieszek Bardzo złośliwy uśmieszek Wartość pieniędzy Rzeczywistość wirtualna Bardzo nikczemny uśmiech Bardzo nikczemny uśmiech Mrugnięcie okiem Poczekaj Bez wątpliwości Skąd jesteś? WAW WB WBASAP WBMBF WBMGF WBS WDOI WDYMBT WFM WG WGO WH WIBNI WISP WIYR WOFTAM WOL WRT WRU WT WTH WTF WTFRU WTHDTM WTTC WTTM WTY WU WYGIWYAF WYGIWYG WYGIWYPF WYSINNWYG WYSIWYG XYL YA YABA YABSA YAFIYGI YATOM YBS YD YGLT YGWYPF YHBT YHBM YHM YIU YL YM YMBJ YMMV YMMVG YNF YW YWIA |LY|&+LY Why Ask Why Welcome Back / Write Back Write Back As Soon As Possible Wanna Be May Boy Friend? Wanna Be May Girl Friend? Write Back Soon Wouldn't Dream Of It What Do You Mean By That? Works For Me Wicked Grin What's Going On? What's Happening? Would It Be Nice If Winning Is So Pleasurable Where Is Your Replay Waste Of Flaming Time And Money Win Or Lose With Regard To Who Are You? Without Thinking What The Hell? What The Fuck? Who The Fuck Are You? What The Hell Does That Mean? Welcome To The Club Without Thinking To Much Waving To You What's Up? What You Get Is What You Asked For What You Get Is What You Get What You Get Is What You Pay For What You See Is Not Necessarily What You Get What You See Is What You Get Ex Young Lady Yet Another Yet Another Bloody Acronym Yet Another Bloody Stupid Acronym You Asked For It You Got It Yet Another Off-Topic Message You'll Be Sorry You're Dead You're Gonna Love This You Get What You Pay For You Have Been Trolled You Have Bin Mail You Have Mail Yes, I Understand Young Lady Young Man You Must Be Joking Your Mileage May Very Your Mileage May Very Greatly You're Not Funny You're Welcome You're Welcome In Advance Absolutely And Positively 41 Dlaczego pytasz dlaczego? Witamy znowu / Odpiszę Odpiszę tak szybko jak będzie to możliwe Chcesz być moim chłopakiem? Chcesz być moją dziewczyną? Odpiszę wkrótce Możesz o tym nawet nie marzyć Co o tym myślisz? U mnie działa / Pracuj dla mnie Podły uśmiech Co się dzieje? Co się stało? Byłoby miło gdyby... Zwyciężanie jest tak przyjemne Gdzie jest twoja odpowiedź? Strata czasu i pieniędzy Zwyciężyć lub przegrać Z pozdrowieniem dla Kim jesteś? Bezmyślnie / Nie myśląc Co się dzieje? Co do cholery? Kim ty do cholery jesteś? Co to ma znaczyć? Witamy w klubie (grupie, towarzystwie,...) Nie myśląc zbyt wiele Macham do Ciebie Jak leci? Dostajesz to o co prosiłeś Dostajesz to co dostajesz Dostajesz to za co zapłaciłeś To co widzisz - niekoniecznie dostaniesz To co widzisz - dostaniesz Już nie młoda kobieta Jeszcze jeden Jeszcze jeden cholerny skrót Jeszcze jeden cholerny głupi skrót Prosiłeś się, to masz Jeszcze jedna wiadomość nie na temat Pożałujesz Już jesteś martwy To ci się spodoba Dostałeś to za co zapłaciłeś Dałeś się nabrać Dostałeś niepotrzebny e-mail Dostałeś e-mail Tak, rozumiem Młoda kobieta Młody mężczyzna Chyba żartujesz Różnica doświadczenia Wielka różnica doświadczenia Nie jesteś zabawny Witam Cię Ależ proszę Absolutnie i bez wątpienia 42 Tabela 2 Najczęściej występujące słownictwo slangowe w League of Legends Skrót tanky dps melee cd buff ad carry squishy SR Dominion dominion ss MIA gank caster back door top jungler support solo top push b/recall blue buff red buff banshee vail debuff any1 ultimat Tłumaczenie resistant damage per second close range attack character spell renewal time reinforcement ranged attack character weakfeed Summoners Rift map Dominion game mode Dominion game mode hiding from other players by switching sides missing in action trap set up by other players a magic oriented character attack oponents base when he is distracted top front linemid character skilled to fight in the jungle character skilled in supporting other players playing alone in the top front line focus on front line attack recall all units to base power-up from blue opponents power-up from red opponents Banshee Vail (spell) negative enhancement anyone ultimate attack 43 Dokumentacja Projektu Magisterskiego Tytuł projektu Program konwertujący tekst w formie gwary graczy gier komputerowych na tekst możliwie najbliższy poprawnemu angielskiemu. Początek Zwięźle opisz wizję na swój projekt. Istotą projektu jest zaprezentowanie możliwości translacji tekstu nie trzymającego się żadnych konkretnych zasad ortografii oraz składni na tekst możliwie poprawny. Oprogramowanie na wejściu otrzymywać będzie tekst w języku „pseudoangielskim”, na podstawie którego, dzięki zastosowaniu słowników różnych gwar, będzie w stanie w miarę możliwości przekształcić tekst na poprawny angielski. Tekst taki z kolei można tłumaczyć na inne języki i/lub odczytać za pomocą syntezatora mowy. Ważnym elementem aplikacji będą słowniki, tworzone dzięki scraperowaniu for tematycznych wybranych gier. Na podstawie częstotliwości występowania danych wyrazów można stworzyć listę „ważnych” słów oraz skrótó9.w. Rozważana jest jeszcze opcja automatycznego rozpoznawania rodzaju gwary oraz dobierania rodzaju słowników na tej podstawie. Algorytm takowego rozpoznania miałby opierać się między innymi właśnie na gęstości występowania danych wyrazów slangowych. 44 Przykładowe funkcje programu: rozwijanie popularnych internetowych skrótów oraz akronimów tłumaczenie wyrażeń hermetycznych dla danych gier komputerowych rozpoznawanie wyrazów, których podmieniać nie należy Opisz zwięźle uzasadnienie istnienia projektu. Jakie problemy zostaną rozwiązane? Podstawową funkcją programu będzie prezentacja możliwości tłumaczenia slangu a co za tym idzie pseudojęzyków bez określonych reguł oraz składni. Dodatkowo program pozwoli osobie niedoświadczonej w komunikacji internetowej na zrozumienie tekstu slangowego. Jest to trudne zwłaszcza dla osób, które Internetu używały zazwyczaj do oficjalnej komunikacji używając formalnego języka. Należy także uwzględnić fakt, iż język konkretnych gier bywa mocno hermetyczny, a więc niezrozumiały także dla osób obeznanych z innymi grami. Ponadto tekst przetłumaczony na poprawny angielski będzie mógł być przeczytany przez syntezator mowy podczas rozgrywki online (pozwoli to graczom na skupienie się na rozgrywce zamiast na śledzeniu komunikatów). Głównym z rozwiązanych problemów będzie tutaj możliwość doprowadzenia tekstu do stanu w którym wykonalne będzie tłumaczenie tekstu przy pomocy istniejących obecnie narzędzi, które z oczywistych powodów nie radzą sobie ze slangiem. Zdefiniuj główne cele projektu. zaprojektowanie algorytmu tłumaczenia tekstu slangowego stworzenie słowników slangu graczy przykładowych gier określenie związku między wiekiem slangu a dokładnością jego tłumaczenia 45 Jakie rezultaty są kluczowe dla projektu? tworzenie tłumaczenia zrozumiałego przez każdą osobę znającą język angielski w dostatecznym stopniu poprawne tłumaczenie zarówno popularnych akronimów jak i wyrazów hermetycznych dla danych gier wyrażeń Przedstaw członków podstawowego zespołu oraz głównych zainteresowanych (interesariuszy). Zespół: Jędrzej Chruściel Główni zainteresowani: prof. UAM dr hab. Krzysztof Jassem Jakich zasobów wymaga projekt? dowolny system operacyjny z rodziny Windows/Linux zdolny do obsługi oprogramowania napisanego w Pythonie obsługę interfejsu graficznego w systemie operacyjnym użytkownika Planowanie Opisz wymagania funkcjonalne projektu wraz z opisem zakresu projektu. Wymaganie Rozpoznawanie skróconych form wyrazowych w zdaniach Opis Parser analizuje tekst pod kątem wystąpienia form skróconych i podmienia je na poprawne rozwinięcia. Dane wejściowe Plik źródłowy zawierający plaintext (lub wklejony ze schowka), zawierający elementy slangu (np. brb, afk). Dane wyjściowe Poprawnie rozpoznane skróty, rozróżnienie ich od pełnoprawnych wyrazów oraz wyrazów końca zdania. 46 Warunek początkowy Tekst kodowany w UTF-8 / Windows-1250. Stan końcowy Tworzony jest plik wynikowy z przetłumaczonym tekstem. Wymaganie Graficzny interfejs użytkownika pozwalający na edycję i wprowadzanie tekstu Opis Graficzny interfejs, w którym użytkownik może dokonywać swobodnych zmian w tłumaczonym tekście, wczytywać go oraz zapisywać do plików tekstowych. Dane wejściowe Interfejs uruchamia się ze standardową konfiguracją i włączonymi domyślnymi słownikami pobranymi z pliku konfiguracyjnego. Dane wyjściowe Po przetłumaczeniu wczytanego tekstu dostępna jest opcja jego zapisu, lub skopiowania z okna edycji. Warunek początkowy System użytkownika pozwala na obsługę graficznych interfejsów użytkownika. Wersja tekstowa interfejsu nie jest przewidziana. Stan końcowy Użytkownikowi udostępniony zostaje graficzny interfejs pozwalający na pełną konfigurację programu. Wymaganie Automatyczne wykrywanie rodzaju slangu Opis Program automatycznie wykrywa rodzaj slangu we wprowadzonym tekście. Dane wejściowe Plik źródłowy zawierający plaintext (lub wklejony ze schowka). Dane wyjściowe Poprawnie rozpoznany rodzaj slangu. Warunek początkowy Wprowadzony tekst musi zawierać jeden z rodzajów slangu, obsługiwanych przez System. Stan końcowy Automatyczny dobór konfiguracji do rodzaju rozpoznanego slangu Wymaganie Edycja oraz zarządzanie słownikami Opis Użytkownik dostaje dostęp do edycji słowników, może dodawać i usuwać słowa oraz edytować istniejące wpisy. Dane wejściowe Wbudowany w program słownik slangu lub nowy plik słownika. Dane wyjściowe Plik nowego słownika ze zmodyfikowaną bazą wyrazów. Warunek początkowy Poprawne otworzenie okna edycji słownika, do którego dostęp nie jest w żaden sposób zablokowany. Stan końcowy Plik słownika zostaje poprawnie zapisany na dysku. 47 Wymaganie Tłumaczenie pełnych zdań na słownikowy angielski Opis . Ze względu na to, że w wielu przypadkach składnia praktycznie nie występuje, za sukces uważane będzie doprowadzenie tekstu do postaci zrozumiałej, tzn. tekst wynikowy ma być w miarę możliwości najbliższy słownikowemu. Dane wejściowe Plik źródłowy zawierający plaintext (lub wklejony ze schowka), docelowo zawierający wypowiedzi slangowe. Dane wyjściowe Poprawnie przetłumaczony tekst w którym wyrazy slangowe zostają zastąpione przez ich słownikowe tłumaczenia. Warunek początkowy Podano tekst w slangowym języku angielskim, bez formatowań. Stankońcowy Tworzony jest plik wynikowy z przetłumaczonym tekstem. Zakres projektu: algorytm tłumaczenia tekstu program implementujący algorytm tłumaczenia tekstu słowniki odpowiadające danemu slangowi Wymień zagrożenia dla powodzenia projektu oraz sposoby ich zminimalizowania? Zagrożenie dla powodzenia projektu Sposób zminimalizowania Prawdopodobie ństwo wystąpienia Wpływ na powodzenie projektu nieukończenie projektu w terminie dobra organizacja pracy nad projektem wysokie wysoki trudności w tworzeniu słownika slangu korzystanie z pomocy społeczności średnie wysoki niska precyzja w działaniu programu analiza algorytmu tłumaczenia średnie niski niewystarczająca szybkość działania programu optymalizacja programu niskie niski 48 Dołącz prosty plan prac wykonywanych na osi czasu Poprawienie Poprawki w błędów w graficznym obecnej wersji interfejsie użytkownika 27.03 Dodania obsługi rozpoznawania rodzaju slangu 03.04 Ewentualne fixy wedle wskazań osób zainteresowanych 10.04 Wykonanie Napisz krótki opis z każdego przeglądu stanu projektu. Przegląd1: 20.03.2012 Program realizuje swoje podstawowe zadanie. Tekst podawany na wejściu jest przetwarzany przez translator. Tworzony jest wynikowy plik tekstowy z tłumaczeniem tekstu źródłowego. Program umożliwia obsługę zewnętrznych, bilingualnych, słowników zawierających przetłumaczony slang. Poprawnie usuwane są powtórzenia wyrazów w tekście. Opracowane są słowniki dla najczęściej występujących odmian slangu - oraz dodatkowy dla gry League of Legends12. Wymagane będzie dodanie zaawansowanej edycji i zarządzania słownikami oraz w miarę możliwości systemu sugerującego użytkownikowi dobór słownika. Przegląd 2: 18.04.2012 Dodany został system rozpoznający rodzaj slangu użytego w tekście źródłowym. Dokonane zostały dodatkowe optymalizacje w kodzie programu przyśpieszające proces tłumaczenia. Uwzględniona została możliwość konfiguracji słowników używanych przy tłumaczeniu przez użytkownika. Użytkownik może także samodzielnie dodawać nowe 12 http://eune.leagueoflegends.com 49 słowniki oraz edytować istniejące. Wzbogacone zostały słowniki slangu, z których korzysta oprogramowanie. Zamykanie Czy użytkownicy i promotor są usatysfakcjonowani? Jeśli nie, wyjaśnij dlaczego. Prezentacja ostatecznej wersji projektu miała miejsce dnia 17.05.2012. Program spełniał założenia. Jedyną sugestią było przeniesienie statystyk związanych z rozpoznawaniem typu slangu do osobnego okna w graficznym interfejsie użytkownika opcja ta została wdrożona tego samego dnia. Wymień czego się nauczyłeś podczas tworzenia projektu. Podczas tworzenia projektu nauczyłem się: sposobów badania zmian zachodzących w języku adaptacji na własne potrzeby istniejących metod tłumaczeń tekstu efektywnego zarządzania korpusami tekstu oraz słownikami zapoznałem się z paradygmatami automatycznego tłumaczenia tekstu wielu podejść dotyczących przetwarzania tekstu Dodatkowo poszerzyłem znacznie swoją wiedzę dotycząca Pythona, zwłaszcza jeśli chodzi o przetwarzanie tekstu oraz projektowanie graficznych interfejsów użytkownika z użyciem biblioteki Qt. Przy okazji zbierania danych napisane zostały także skrypty pomocnicze pobierające listy słów ze stron internetowych i przygotowujące je do dalszej obróbki. 50 Czy zostało już wszystko ukończone? Jeśli nie, wyjaśnij to. Podstawowe funkcjonalności programu zostały ukończone i działają zgodnie z oczekiwaniami. Większość dodatkowych funkcjonalności także działa, w późniejszym czasie dokonywane były już głównie poprawki o charakterze estetycznym. Ewentualnie większe zmiany będą dotyczyć już tylko edycji słowników i/lub dodatkowych funkcji niewymienionych w specyfikacji dodanych z chęci rozwinięcia oprogramowania. 51