Tyflo 1_2014

Transkrypt

Tyflo 1_2014
www.tyfloswiat.pl
Kwartalnik, nr 1 (22) 2014, bezpłatny, ISSN: 1689-8362
TYFLO{WIAT
NVDA
a płatne screenreadery
BlackBerry
– wreszcie
z czytnikiem ekranu
Quo vadis
Window-Eyes?
www.tyfloswiat.pl
Kwartalnik, nr 1 (22) 2014, bezpłatny, ISSN: 1689-8362
W numerze
TYFLO{WIAT
NVDA
a płatne screenreadery
BlackBerry
3 Komputer w środowisku wielojęzycznym
Damian Przybyła zaznajamia czytelników z problematyką
wielojęzykowej pracy na komputerze i stara się odpowiedzieć
na pytanie, czy współczesne programy udźwiękawiające są do tego
naprawdę gotowe.
– wreszcie
z czytnikiem ekranu
6 Złota klatka
Quo vadis
Window-Eyes?
Damian Przybyła wrzuca kilka kamyczków do ogródka wielbicieli
urządzeń spod znaku nadgryzionego jabłka.
8 Dostępność informacji w roku 2013
Jacek Zadrożny dokonuje autorskiego przeglądu najważniejszych
z punktu widzenia tyfloinformatyki i dostępności informacji wydarzeń
roku 2013.
KWARTALNIK
NR 1 (22) 2014
WYDAWCA
Fundacja Instytut Rozwoju Regionalnego
ul. Wybickiego 3a, 31-261 Kraków
http://www.firr.org.pl
tel.: (+48) 12 629 85 14; faks: (+48) 12 629 85 15
e-mail: [email protected]
Organizacja Pożytku Publicznego
Nr konta 77 2130 0004 2001 0255 9953 0005
UTILITIA
12 JAWS dla Windows
Kamil Żak próbuje przekonać czytelników, że JAWS, najdroższe
oprogramowanie na rynku, jest naprawdę wart swojej ceny.
19 Android czy iOS – wybór głuchoniewidomych
UTILITIA
Krzysztof Wostal opisuje, na co powinni zwrócić uwagę
głuchoniewidomi klienci, zanim zdecydują się na kupno urządzenia
UTILITIA
obsługiwanego przez Android czy iOS.
PR Z E J DŹ NA D O S T Ę PN Ą S T R O N Ę
Utilitia sp. z o.o.
ul. Jana Pawła II 64
TILITIA
32-091UMichałowice
http://www.utilitia.pl
tel.: (+48) 663 883 600
e-mail: [email protected]
PR Z E J DŹ NA D O S T Ę PN Ą S T R O N Ę
UTILITIA
Podmiotem odpowiedzialnym za publikację
treści merytorycznych jest Fundacja
Instytut Rozwoju Regionalnego
UTILITIA
Podmiotem odpowiedzialnym za działalność
reklamową jest Utilitia sp. z o.o.
PR Z E J DŹ NA D O S T Ę PN Ą S T R O N Ę
REDAKTOR NACZELNY
Joanna Piwowońska
tel. kom. (+48) 663 883 332
e-mail: [email protected]
INTERNET
www.tyfloswiat.pl
SKŁAD komputerowy
More Concept
Marcin de Lehenstein Werndl
Fotografia na okładce
vs148
DRUK
K&K
Dział reklamy
e-mail: [email protected]
Redakcja nie odpowiada za treść
publikowanych reklam, ogłoszeń, materiałów
sponsorowanych i informacyjnych.
23 Screenreadery wczoraj i dziś
Michał Kasperczak podsumowuje rozwój screenreaderów i nakreśla
kierunki na przyszłość.
UTILITIA
UTILITIA
28 Syntezatory mowy. Ich rozwój i stan obecny
Patryk Faliszewski opowiada o historii i współczesności syntezatorów
mowy i podpowiada, jak rozwiązać często spotykane problemy z ich
funkcjonowaniem.
35 Window-Eyes – kilka słów o historii i działaniu
programu
Michał Molek przedstawia czytelnikom swoje doświadczenia, zyskane
podczas wieloletniej pracy z programem.
40 Quo Vadis Window-Eyes?
Michał Dziwisz rozważa, jaka będzie przyszłość jednego
z najpopularniejszych programów udźwiękawiających.
Nakład dofinansowany ze środków Państwowego
Funduszu Rehabilitacji Osób Niepełnosprawnych.
Redakcja zastrzega sobie prawo skracania, zmian
stylistycznych i opatrywania nowymi tytułami materiałów nadesłanych do druku. Materiałów niezamówionych nie zwracamy.
Wszystkie teksty zawarte w tym numerze czasopisma Tyfloświat dostępne są na licencji Creative
Commons Uznanie autorstwa 3.0 Polska. Ponownie
rozpowszechniany utwór, dostępny na tej licencji,
musi zawierać następujące informacje: imię i nazwisko autora tekstu, nazwę czasopisma oraz jego
numer. Zdjęcia zawarte w czasopiśmie chronione
są prawem autorskim i ich przedruk wymaga zgody autora.
47 NVDA kontra reszta świata
Czy NVDA może zastąpić komercyjny screenreader? W jakich sytuacjach
przewyższa go swoją funkcjonalnością? Na te i inne pytania odpowiada
Michał Dziwisz.
53 Blackberry wreszcie z czytnikiem ekranu
Paweł Masarczyk zgłębia temat pierwszego udźwiękowienia obsługi
telefonów marki Blackberry.
3
Damian Przybyła
Komputer
w środowisku wielojęzycznym
Problem korzystania z komputerów w środowisku wielojęzycznym
istnieje od zawsze. Kto pamięta czasy, gdy nie było jeszcze
okienek, wie, że samych tylko standardów kodowania polskich
liter było bodaj kilkanaście. Jeżeli dodamy do tego podobną
mnogość w innych językach, jeżeli jeszcze weźmiemy pod uwagę
różne sposoby zapisu brajlowskiego i różne syntezatory mowy,
różne czytniki ekranu, to otrzymamy prawdziwy gąszcz, przez
który naprawdę trudno będzie się przebić.
Teza, której będę tu bronić
brzmi: żaden dostępny na rynku,
liczący się czytnik ekranu nie
obsługuje dobrze potrzeb
osoby niewidomej związanych
z korzystaniem ze środowiska
wielojęzycznego.
Pod uwagę należy wziąć trzy
obszary:
1. Praca w języku systemu.
Wydaje się, że najprostsze
rozwiązanie polega na przydzieleniu jakiegoś głosu syntetycznego do komunikatów
i kontrolek systemowych.
W takim przypadku przeglądamy angielskojęzyczny
dokument, a w tym czasie
informacje o przyciskach,
statusach innych zadań itp.
dostajemy w języku systemu.
Rozwiązanie takie zastosowali twórcy NVDA. Poszli oni
jednak chyba nie do końca
w dobrym kierunku. Możemy
bowiem używać języka
interfejsu różnego od języka
tekstu, nazwy kontrolek
na stronie internetowej będą
odczytywane w tym języku,
ale jeśli tak ustawiony język
jest różny od języka używanego przez menu obsługiwanej aplikacji, to może
NR 1 (22) 2014
4
się okazać, że paski menu
czy komunikaty systemu
czytane są w “nieodpowiednim” języku. Czy jednak
to rozwiązanie jest dobre?
Może znajdą się tacy, którzy przechodząc na roboczy
angielski, chcieliby wszystko
mieć w tym jednym języku?
To wydaje się zresztą nierealne, bo trudno tworzyć
jakieś środowisko wirtualnego interfejsu, zmieniające
i ujednolicające język komunikacji z użytkownikiem.
2. Praca z aplikacjami, których
język interfejsu jest różny
od języka systemu.
W wypadku zatem aplikacji,
których język interfejsu różni
się od języka systemu operacyjnego dobrze byłoby mieć
możność ustawienia języka,
który ma być przez czytnik
ekranu używany do obsługi
interfejsu. Inaczej mówiąc:
dobra obsługa wielojęzyczności wymagałaby trzech różnych, ustawianych w zależności od potrzeb, głosów
syntetycznych.
3. Obsługa treści
wielojęzycznych.
Problem obsługi treści
wielojęzycznych wydaje się
bardziej skomplikowany.
Po pierwsze, czy język
czytnika ekranu powinno
się zmieniać ręcznie czy
też może automatycznie?
Narzuca się odpowiedź,
że automatyczne zmienianie
języka byłoby lepsze, ale
wtedy należy zapytać w oparciu, o co to robić. Dokumenty
niby mają możność osadzania
w nich danych lingwistycznych, ale mechanizm ten sam
w sobie często mało doskonały i jeszcze częściej zupełnie nieautomatyczny sprawia, że automat zmieniałby
język zupełnie niezgodnie
z naszymi oczekiwaniami.
Zmieniajmy zatem język
ręcznie. Rozwiązanie dobre,
o ile można to łatwo robić.
Powstaje jednak jeszcze
jedna kwestia. Gdzie mianowicie jest granica pomiędzy
treścią a interfejsem? Prosty przykład – czy podczas
czytania stron internetowych,
powiedzmy po angielsku,
lepiej słyszeć „header”
czy polskim syntezatorem
„nagłówek”, czy tak jak to ma
miejsce obecnie, mocno
kaleczone przez angielski
syntezator słowo „nagłówek”.
Jak radzić sobie ze statusami
wiadomości w skrzynce pocztowej: czytać nazwy statusów zgodnie z ustawionym
syntezatorem, czy używając podstawowego głosu/
języka systemu? Co zrobić
z interpunkcją i liczbami
(to ostatnie akurat wydaje się
oczywiste, ponieważ zdrowy
rozsądek domaga się w takim
przypadku uzgodnienia
języka)?
A jaki jest aktualny stan
rzeczy?
Liczące się na rynku czytniki
ekranu, próbują w różny sposób
radzić sobie z tym problemem.
JAWS proponuje nam mechanizm profilów językowych
z automatycznym zmienianiem
języka w oparciu o tzw. osadzone dane lingwistyczne. Użytkownicy jednak radzą, by ten
automatyczny mechanizm wyłączać, a i do profilów miewają
wiele zastrzeżeń i modyfikują je
zgodnie ze swymi potrzebami.
NVDA oraz Orca mają możliwość zmiany syntezatora, ale
ponieważ pracę w środowisku
wielojęzycznym traktują marginalnie, ustawienie odpowiadające za zmianę języka jest w tych
czytnikach ekranu głęboko
ukryte i nie nadaje się do częstego stosowania podczas pracy.
Voiceover pozwala na łatwe
zmienianie „głosów synteza-
5
fot. cybrain, shutterstock, Genpies Design
tora”, ale autorzy tej aplikacji
zdają się w ogóle nie zauważać
potrzeb osób wielojęzycznych.
Nie ma zatem możliwości ustawiania i zapamiętania różnych
parametrów mowy dla różnych
syntezatorów, nie wspominając
o czytaniu elementów nawigacyjnych, interpunkcji itp. zgodnie
z językiem syntezatora.
W przypadku Window-Eyes
mamy bardzo niedoskonały
mechanizm automatycznego
zmieniania języka na stronach
internetowych, ale nie działa
on już w dokumentach pakietu
MS Office. Na pozytywne
wyróżnienie zasługuje łatwość
zmieniania często używanych
syntezatorów i automatyczne
zapamiętywanie ich parametrów.
Na naganę jednak zapracowuje
sobie omawiany tu czytnik
z powodu niedającego się wykorzystać, przez tzw. standardowego użytkownika, mechanizmu
profilów. Tutaj, tak jak w przypadku VO, zmiana głosu jest
traktowana jako zmiana głosu,
a nie języka.
Odrębnym zagadnieniem jest
wielojęzyczność brajla. W tym
wypadku żaden czytnik ekranu
nie daje użytkownikowi możliwości łatwego zmieniania tablic
brajlowskich. O ile dla osób
korzystających z języków używających jednego alfabetu nie
stanowi to większego problemu,
o tyle jednak dla mieszkańców
Bliskiego Wschodu, obszaru
rosyjskojęzycznego czy krajów
azjatyckich niemożność łatwego
zmieniania tablic brajlowskich
może być przyczyną istotnego
dyskomfortu w pracy z czytnikiem ekranu.
Wielojęzyczność
w urządzeniach mobilnych
Jeśli ktoś koniecznie musi korzystać z wielu języków w swoim
telefonie czy tablecie, to wydaje
się, że najlepszym wyborem
będą urządzenia od Apple.
Zarówno telefony, jak i tablety
tej firmy dają możliwość łatwego
zmieniania języka odczytywanego tekstu. W przypadku
dokumentów (przez dokument
rozumiem tu każdy obiekt
dostępny jako tekst to czytania) deklarujących język źródła,
VoiceOver potrafi zmieniać język
automatycznie. Co więcej zachowuje on przy tym odrębny głos
systemowy do odczytywania,
zarówno elementów nawigacyjnych na stronach internetowych,
jak i menu aplikacji.
Urządzenia z systemem
Android także pozwalają
na zmianę języka odczytywanego tekstu, ale ponieważ jest
on traktowany jako zwyczajna
zmiana głosu wykorzystywanego syntezatora, rozwiązanie
to należy uznać za zwyczajnie
nieeleganckie i w przypadku
niektórych języków może nas
narazić na problemy z powrotem
do głosu systemowego. Wadą
Androida jest ponadto konieczność przebijania się przez kilka
pięter ustawień w celu “dogrzebania się” do opcji zmiany
języka.
Nie jest dobrze
Zagadnienie wielojęzyczności
jest przez wszystkich twórców
czytników ekranu traktowane
raczej marginalnie. Zakładają oni
bowiem, że osoba niewidoma
jest niewykształcona i powinna
zadowolić się możnością jakiegokolwiek dostępu do treści
cyfrowych. Uważają, że wobec
szczupłości zasobów nie muszą
poświęcać czasu i energii
na pracę nad zagadnieniami
o tak niskim priorytecie. Powyższe nie jest moją osobistą opinią,
lecz relacją z rozmów dotyczących omówionego zagadnienia
z deweloperami pracującymi nad
czytnikami ekranu.
NR 1 (22) 2014
6
Damian Przybyła
Złota
klatka
Minęły właśnie dwa lata, odkąd jestem użytkownikiem MacBooka. Gdy rozpoczynałem moją
przygodę z tym komputerem pozwoliłem sobie, jako doświadczony użytkownik systemu
Windows, napisać, znajdujący się na moim blogu, dziennik migracji. Nadal podzielam pogląd,
że zmiana systemu operacyjnego nie jest procesem bolesnym i jakkolwiek użytkownik Windowsa
wszystkiego musi uczyć się od początku, to nauka ta, przynajmniej na poziomie podstawowym,
nie trwa długo, a elementów wspólnych jest wiele. Teraz jednak stawiam sobie inne pytanie.
Rozważam mianowicie za i przeciw owym systemom.
Przesłanki techniczne
O ile jeszcze dwa lata temu zdanie, że komputer
od Apple’a nadaje się do aktywności o charakterze
wypoczynkowym, takich jak oglądanie filmów,
słuchanie muzyki czy przeglądanie Internetu,
a do pracy powinniśmy korzystać z solidnego
systemu od Microsoftu wydawało się, przynajmniej w wypadku użytkowników niewidomych,
prawdziwe, o tyle dziś ośmieliłbym się opinię
tę podważać. Mac OS z wersji na wersję jest coraz
lepszy i dotyczy to tak dostępności, jak kompatybilności z produktami Microsoftu. Na korzyść
Apple’a przemawia przy tym choćby taki drobiazg,
jak możliwość kupienia każdego z komponentów
pakietu biurowego iWork osobno, a co za tym
idzie korzystania z programów, których rzeczywiście potrzebujemy.
7
Z drugiej jednak strony, ktoś, kto potrzebuje
dobrej obsługi wielojęzycznego środowiska
pracy, powinien moim zdaniem pozostać przy
korzystaniu z pakietu MS Office. Przewaga zaś
Apple’a w dziedzinie rozrywki też nie jest już tak
oczywista. Dobrym przykładem niech będzie tutaj
popularna wśród lubiących słuchać muzyki z sieci
aplikacja Spotify. O ile w systemie Windows daje
się ona dość dobrze z czytnikiem ekranu obsłużyć, o tyle w przypadku MacOs jest po prostu
dla osoby korzystającej z czytnika ekranu nieużywalna. Skomplikujmy jeszcze bardziej nasz
wybór. Każdy użytkownik systemu Windows wie,
że stabilność nigdy nie była jego mocną stroną.
O ile oparty na solidnych unixowych podstawach MacOs jest stabilny jak skała, współpraca
z urządzeniami peryferyjnymi nie wymaga w tym
systemie od użytkownika żadnej wiedzy, zaś
aktualizacja oprogramowania może odbywać się
bez wiedzy i ingerencji użytkownika, o tyle Windows może nam we wszystkich tych obszarach
dostarczyć przeżyć tyleż kłopotliwych, co nieprzyjemnych. Za wszystko to jednak musimy zapłacić
wysoką cenę.
fot. shutterstock, Apple
Przesłanki filozoficzne
Od dłuższego już czasu wśród programistów, jak
i użytkowników komputerów, trwa spór o wyższość systemów otwartych nad zamkniętymi. Za
i przeciw każdemu z tych rozwiązań można by
przytoczyć wiele argumentów, a omówienie sporu
zapełniłoby nie jeden artykuł. Dlatego pozwolę
sobie nie zagłębiać się szczegółowo w to zagadnienie. Dość powiedzieć, że gdybyśmy postawili na skali otwartości systemu operacyjnego,
to na jednym jej końcu znalazłby się Android,
na drugim zaś MacOs i jego mobilny odpowiednik. Produkty Microsoftu umieścilibyśmy gdzieś
pośrodku. Wady, ocierającego się o popadnięcie
w chaos Androida, omówiłem w osobnym artykule. Cóż tedy można zarzucić produktom Apple’a?
Zarzut podstawowy to restrykcyjne podejście
do wymiany treści zapisanych cyfrowo. Treści
kupione w świecie Apple’a są jedynie pozornie
własnością ich użytkowników. Twórca może
w każdej chwili, bez podania jakichkolwiek powodów treści te na naszym urządzeniu skasować.
Ich wymiana pomiędzy różnymi platformami jest
poważnie utrudniona, o ile, w niektórych przypadkach, w ogóle możliwa. Posiadacz telefonu z systemem iOS będzie miał bardzo poważne problemy,
chcąc swoje własne, nawet stworzone przez
siebie pliki skopiować z komputera do telefonu.
To ostatnie zadanie jest oczywiście możliwe, ale
wymaga specjalnego oprogramowania o nazwie
iTunes, jedynej oficjalnie zaakceptowanej przez
Apple drogi do wymiany treści między komputerem a urządzeniem mobilnym. Inwestując w sprzęt
od Apple’a, musimy liczyć się z tym, że myślą przewodnią jego producentów nie jest nasze dobro,
lecz chciwość. Rozwijają oni swój produkt tak, aby
przynosił dochody, zaś dobro konsumentów jest
dla nich ważne tylko o tyle, o ile ci ostatni, dzięki
realizacji owego dobra, przyniosą więcej pieniędzy.
Tak więc walkę konkurencyjną między Applem
a Googlem (ten ostatni w swej filozofii jawnie
głosi, że stawia sobie za cel działanie na rzecz
dobra wspólnego), można w wielkim uproszczeniu
opisać jako walkę między Bogiem a Dolarem. Dla
mnie, ten ostatni fakt, ma decydujące znaczenie.
Jakkolwiek produkty firmy Apple mają doskonałą
jakość, jakkolwiek uwzględniają one lepiej niż produkty konkurentów potrzeby osób niepełnosprawnych, jednakże zawarty w nich zamach na podstawowe prawa i wolności człowieka w imię
bezwzględnego dążenia do maksymalizacji zysków
zasługuje na uwagę i zmusza mnie do wygłoszenia poważnego ostrzeżenia. Wyboru zaś niech
każdy dokonuje w sam.
NR 1 (22) 2014
8
Jacek Zadrożny
Dostępność
informacji
w 2013 roku
Podsumowania mijającego roku są bardzo popularne, a więc i ja postanowiłem przygotować
swoje. Rok 2013 był dla dostępności ważny, chociaż niewiele na to wskazywało jeszcze
kilka miesięcy wcześniej. Pierwszy zauważył to chyba Robert Drózd, pisząc w marcu krótką
informację na swoim blogu Dostępnościowe przebudzenie AD 2013 i chyba miał rację.
Coraz więcej ludzi i instytucji interesuje się dostępnością i cyfrowym włączeniem osób
niepełnosprawnych. Ja przedstawię subiektywny wybór wydarzeń, który nie jest kompletną
relacją, a jedynie daje ogólny obraz zachodzących zmian.
Styczeń - śmierć Symbiana
i przejęcie IVO przez Amazon
Pierwszy miesiąc roku to dwie
elektryzujące informacje dotyczące technologii asystujących.
Po pierwsze – Nokia oficjalnie
poinformowała o zakończeniu
rozwoju systemu operacyjnego
dla telefonów komórkowych
Symbian. To był koniec pewnej
epoki i początek innej – ekranów dotykowych i trudnych
decyzji – iPhone czy Android?
Część niewidomych użytkowników twardo trzyma się telefonów Nokia, ale one kiedyś się
skończą i konieczność podjęcia
decyzji też ich dopadnie. A może
za te kilka lat rynek będzie
wyglądał jeszcze inaczej, gdy
dojrzeje Firefox OS, BB OS lub
o dostępność wzbogaci się Windows Phone...
Druga wiadomość była może
mniej doniosła, a za to mogła
napawać dumą – polską firmę
Ivona Software przejął gigant
9
sprzedaży elektronicznej Amazon. Głosy tej firmy będą odczytywać ekrany i książki w tabletach i czytnikach książek Kindle,
a na tym pewnie ta ekspansja
się nie skończy.
Luty - walka z KRRiT
o procenty
Luty minął pod znakiem walki
z Krajową Radą Radiofonii i Telewizji. Rzecz szła o sposób interpretowania i realizacji zapisów
ustawy o radiofonii i telewizji,
które zobowiązywały nadawców
telewizyjnych do udostępniania części audycji z usługami
dodatkowymi, czyli audiodeskrypcją, napisami i tłumaczeniami na język migowy. KRRiT
zachowała się bardzo brzydko,
w arogancki sposób promując interesy nadawców ponad
potrzebami niepełnosprawnych widzów. Dość powiedzieć,
że „porozumienie w sprawie
dostępności” zostało zawarte
bez obecności organizacji, które
nad nim pracowały i w atmosferze protestu. Sposób pracy
W 2013 roku Nokia oficjalnie
poinformowała o zakończeniu wsparcia dla systemu
Symbian
Rok 2013 minął pod znakiem walki środkowiska osób niepełnosprawnych z KRRiT o zasady udostępniania treści
KRRiT potwierdza zaś realizacja
konsultacji społecznych rozporządzenia dotyczącego dostępności. Rozważenie wszystkich
zgłoszonych uwag zajęło jakieś
dwie godziny. Organizacje się
nie poddają i teraz będą walczyć o dobre zapisy w znowelizowanej ustawie o radiofonii
i telewizji.
Marzec - konsultacje
społeczne unijnego prawa
o dostępności
W grudniu 2012 roku ogłoszono
informację o tworzeniu dyrektywy unijnej o dostępności
publicznych serwisów internetowych. W marcu zaczął być
konsultowany kształt, zakres
podmiotowy i przedmiotowy
projektu, a wyjątkową aktywnością wykazał się europoseł
Rafał Trzaskowski. Jest to jeden
z bardzo nielicznych polityków,
który wie, co to jest dostępność informacji i dlaczego jest
ważna. Samej dyrektywy jeszcze
nie ma, ale powstaje za to akt
o wiele ogólniejszy, który będzie
dotyczył szeroko pojętej dostępności, a nie tylko stron internetowych, co wcale nie oznacza,
że dyrektywy o dostępnych
stronach nie będzie. Na razie
czekamy.
Kwiecień - warsztaty
o dostępności FDC i dostępna
kultura w Sejmie
Dwa dni spędzone na warsztatach zorganizowanych przez
Forum Dostępnej Cyberprzestrzeni to było wydarzenie, które
dało mi ogromnie dużo wiedzy. Zakładam, że inni uczestnicy skorzystali równie dużo,
a tematy były tak różnorodne,
że każdy znalazł coś dla siebie.
Rozmawialiśmy o dostępności
stron internetowych, audiodeskrypcji, napisach dla niesłyszących, nawigacji GPS, pętlach
indukcyjnych, rozwiązaniach
wspierających osoby niesprawne
manualnie. Każdy dawał od siebie najlepsze, co miał, a inni
mogli wchłonąć to, co chcieli. Ja
chcę więcej!
W tym samym miesiącu
w Sejmie odbyło się spotkanie
poświęcone dostępności kultury
dla osób niepełnosprawnych
wzrokowo lub słuchowo. Posłowie, rząd, producenci filmowi,
organizacje pozarządowe –
NR 1 (22) 2014
10
na systemy iOS (Apple), Android
i aplikacje webowe w HTML.
Teraz już nie ma wymówki,
że programista nie wie, jak robić
dostępne aplikacje. Wystarczy
sięgnąć i przeczytać. To nie jest
dokument wagi WCAG 2.0, ale
może być nawet bardziej przydatny w praktyce.
Lipiec - dostępny
e-podręcznik
W lipcu 2013 roku ukazał się e-podręcznik
wszyscy dyskutowali o dostępie
do dóbr kultury. Głównym organizatorem była Fundacja Kultury
Bez Barier, a dokładniej – Robert
Więckowski. Udało mi się potem
skonstruować kilka warunków
lepszego dostępu do kultury,
które kiedyś przełożę na coś
bardziej konkretnego.
Maj - WCAG 2.0 po polsku
i Accessibility Camp
Maj był ważnym miesiącem,
bo to właśnie w tym miesiącu
zdarzyły się dwie rzeczy: ukazało się polskie tłumaczenie
specyfikacji WCAG 2.0 oraz
odbył się pierwszy w Polsce
Accessibility Camp. Prace nad
tłumaczeniem WCAG 2.0 ślimaczyły się niemiłosiernie, ale
tuż przed Accessibility Campem
nabrały rozpędu i wreszcie są.
Wciąż nie są oficjalnym tłumaczeniem, bo na przeszkodzie stoi
asekurancka postawa administracji publicznej, ale jest to już
wersja ostateczna. WCAG 2.0
jest najważniejszym dokumentem dla dostępności informacji
elektronicznej i po prostu musiał
być przetłumaczony.
Accessibility Camp zorganizowaliśmy 9 maja, czyli
dokładnie w Global Accessibility
Awareness Day. W ten sposób
przyłączyliśmy się do światowej
inicjatywy i było to pierwsze
i największe tego typu wydarzenie w naszej części Europy. Trochę po partyzancku, w nerwach
i na ostatnią chwilę udało się
wszystko dopiąć i zgromadzić
w jednym miejscu większość
tych, którzy o dostępności mają
coś sensownego do powiedzenia. Udało się nawet zrobić transmisję online, chociaż
jeszcze dzień wcześniej wcale
nie było to pewne. A wszystko
własnymi rękami kilkorga ludzi.
Czerwiec - mobilna
dostępność od BBC
Telewizja BBC to nie tylko
najbardziej dostępna telewizja
na świecie. Od czerwca to także
instytucja, która opublikowała
Mobile Accessibility Guidelines,
czyli wytyczne dla tworzenia
dostępnych treści mobilnych.
Obszerny i bogato ilustrowany
przykładami dokument opisuje,
w jaki sposób tworzyć aplikacje
W lipcu ukazał się podręcznik
o dostępnym e-podręczniku.
E-podręcznik to projekt realizowany przez Ośrodek Rozwoju
Edukacji przy Ministerstwie
Edukacji Narodowej. Jego celem
jest przygotowanie darmowych
i otwartych podręczników
elektronicznych, które mają być
także dostępne. Mają bowiem
spełniać wymagania WCAG
2.0 na poziomie AA, co oznacza między innymi tworzenie
w odpowiedni sposób treści
przez autorów. To właśnie dla
nich powstał podręcznik, jak
takie treści przygotowywać,
także dostępny na otwartej
licencji. E-podręcznik dla wszystkich wydało Forum Dostępnej
Cyberprzestrzeni.
Sierpień - Konkurs MAiC
na cyfrowe włączenie
Dostępność i cyfrowe włączenie
osób niepełnosprawnych jest
ważnym tematem w Ministerstwie Administracji i Cyfryzacji.
Pierwszy w historii tego resortu
konkurs dotacyjny obejmował
między innymi narzędzie wspomagające ewaluację dostępności serwisów internetowych.
To właśnie za środki z tego
konkursu powstało narzędzie
fot. shutterstock, FIRR
11
A3Web, o którym nieco dalej.
Jednak sam fakt, że dostępność
stała się jednym z tematów konkursowych świadczy, że MAiC
ma tę problematykę na uwadze.
Szkoda tylko, że nie idzie za tym
autoryzacja polskiego tłumaczenia WCAG 2.0, ale może i to się
zmieni wkrótce.
się w tym celu metodę re-speakingu, czyli rozpoznawania
mowy przez program komputerowy. Efektywność procesu
podnosi się przez wykorzystanie
specjalnie przygotowanego speakera, który powtarza wypowiedzi usłyszane podczas wydarzenia. To naprawdę działa.
Wrzesień - Program
Operacyjny Cyfrowa Polska
i napisy na żywo
Październik - nagrody FDC
Przypisałem program operacyjny
„Cyfrowa Polska” do września,
chociaż prace nad nim trwały
od czerwca. Jednak to właśnie we wrześniu ukazała
się ostateczna jego wersja,
z którą autorzy ruszyli w kraj
na konsultacje społeczne. Jest
to dokument opisujący sposób
wydatkowania środków unijnych
w latach 2014-2020 w obszarze
szeroko pojętej informatyzacji
Polski. Znalazło się tam miejsce
dla dostępności i wymienionej
wprost specyfikacji WCAG 2.0,
a także cyfrowe włączenie osób
niepełnosprawnych. Oznacza
to, że dostępność znalazła się
w głównym nurcie informatyzacji, a nie gdzieś na jej obrzeżu.
Teraz trzeba będzie pilnować
realizacji, ale przynajmniej jest
już czego pilnować.
Warto też wspomnieć
o uwieńczonym sukcesem
eksperymencie z napisami
na żywo, jaki odbył się w Sejmie, a potem w Pałacu Prezydenckim. Oferowanie napisów
dla osób niesłyszących podczas
transmisji na żywo zawsze było
dużym wyzwaniem technicznym, ale wydaje się, że już jest
to problem rozwiązany. Stosuje
W październiku przyznano
po raz drugi nagrody Forum
Dostępnej Cyberprzestrzeni.
Otrzymali je serwis internetowy Informaton.pl, europoseł
Rafał Trzaskowski, internetowa telewizja glusitv.pl, firma
Transition Technologies oraz
Mazowieckie Stowarzyszenie
Pracy dla Niepełnosprawnych
De Facto. Wręczenie nagród
odbyło się w hotelu Gołębiewski
w Karpaczu.
Listopad - nowy minister
administracji i cyfryzacji
W listopadzie nastąpiła rekonstrukcja rządu, w efekcie której
odszedł dotychczasowy minister administracji i cyfryzacji
Michał Boni. Na jego miejsce
wszedł zaś... Rafał Trzaskowski! Ten sam, który prowadził
konsultacje społeczne projektu
dyrektywy o dostępnych stronach internetowych i otrzymał
nagrodę FDC. Może to oznaczać,
że MAiC będzie miało dostępność jeszcze bardziej na względzie, niż do tej pory.
Grudzień - A3Web
i nowy kierunek studiów
podyplomowych
Piszę ten tekst pod koniec listopada, więc kalendarz powinie-
nem zakończyć na tym miesiącu.
Jednak pokuszę się o kilka
informacji, które prawdopodobnie będą prawdziwe. Po pierwsze - dostępne będzie narzędzie
wspierające ewaluację dostępności serwisów internetowych
A3Web. Nie jest to automatyczny
walidator, jak Utilitia, Sort4Site
lub WAVE, ale kreator raportów z audytu. Jego zadaniem
jest nauczyć nowicjuszy, w jaki
sposób robić audyty dostępności i jak przygotować raport
z rekomendacjami do wdrożenia.
Mocno ściskam kciuki za jego
sukces, bo włożyłem sporo pracy
w jego powstanie.
Druga zapowiedź, która się
najprawdopodobniej spełni,
to uruchomienie nowego kierunku studiów podyplomowych
na Uniwersytecie Śląskim.
Kierunek obejmować będzie
cyfrowe włączenie, dostępność
stron internetowych, audiodeskrypcję i pokrewne tematy.
Celem powstania tego kierunku
jest wykucie nowych kadr
administracji publicznej, świadomej problematyki dostępności
informacji i umiejącej tworzyć
dostępne treści.
A co w przyszłym roku?
W przyszłym roku największym
wyzwaniem będzie monitorowanie wdrażania dostępności.
Mamy ustawę o radiofonii
i telewizji, rozporządzenie o KRi,
programy operacyjne, a być
może będziemy mieli też przepisy unijne. Jednak bez pilnowania mogą to być puste zapisy.
Wierzę jednak, że będzie inaczej
i dlatego trzeba nadal uświadamiać, edukować i pilnować.
NR 1 (22) 2014
12
Kamil Żak
JAWS
dla Windows
Program JAWS dla Windows to, według mnie,
jego wieloletniego użytkownika, najbardziej
pełen potencjału, najbardziej elastyczny, choć
wcale nie pozbawiony wad, czytnik ekranu
na rynku. Biorąc jednak pod uwagę dzisiejszą
sytuację na rynku czytników ekranu, należy
zastanowić się i zadać następujące pytania.
Czy ten program jest dla każdego? Czy warto
wydać tak duże pieniądze, ponieważ JAWS
jest niestety najdroższym screenreaderem
na rynku? A może jednak kupić tańsze
rozwiązanie lub wybrać darmową alternatywę?
Program NVDA w ciągu kilku lat swojego istnienia w pewnych dziedzinach, mimo braku szerokiej
gamy ustawień, prześciga dziś lub dorównuje
w wielu obszarach działania komercyjnym rozwiązaniom znanym od wielu lat.
Jako użytkownik wszystkich trzech czytników
ekranu, tj. JAWS, NVDA i Window-Eyes postaram się
odpowiedzieć na te pytania z mojej perspektywy.
Krótka historia programu JAWS dla Windows
i nieco dłuższy opis jego rozwoju
JAWS powstał w roku 1989 i został stworzony
przez Teda Hentera, który stracił wzrok w wyniku
wypadku w 1978 roku.
W pierwszej połowie lat dziewięćdziesiątych
wydawano wersję JAWS dla systemu MS Dos, dziś
dostępna jest ona do pobrania na stronie producenta bezpłatnie.
Pierwsza wersja JAWS dla Windows – wersja 1.0 powstała w 1995 roku, ale prace nad nią
trwały już od roku 1992, czyli dokładnie od czasów, gdy Windows zaczynał zdobywać swoją,
wielką do dziś, popularność.
Obecnie nowa wersja programu jest wydawana
w wersji stabilnej raz w roku (zwykle jesienią)
przez Freedom Scientific, firmę, która powstała
w roku 2000 w wyniku połączenia się firm Henter-Joyce inc., Blazie Engineering i Arkenstone.
13
Rozwój i zmiany w programie
w latach 2004 – 2014
Ponieważ jestem użytkownikiem programu JAWS
od roku 2004, skupię się na tym czasie i postaram
się opisać, jakie zmiany były dla mnie najważniejsze w czasie tych 10 lat rozwoju programu.
Jedną z największych bolączek wieloletnich
użytkowników JAWS jest fakt, że producent nie
nadąża tak jak kiedyś za rozwojem środowiska Windows i zmianami w nim zachodzącymi,
co wynika zarówno z przyspieszenia tempa
wydawania nowych wersji i aktualizacji systemu
Windows przez firmę Microsoft, jak i ze zmiany
cyklu wydawniczego programu JAWS przez firmę
Freedom Scientific.
Wystarczy spojrzeć na listę zmian, nowości
i poprawek w programie JAWS 4.0, 4.50 czy 4.51,
albo, nie szukając daleko, porównać zmiany między
wersjami JAWS 5.0 i 5.1, od których rozpocząłem
naprawdę poważne użytkowanie tej aplikacji. Jak
możemy się przekonać, nowości tych było bardzo
dużo przy każdej wersji, zarówno przy zmianie
głównego numeru wersji, np. z 3 na 4 czy z 4 na 5,
jak i podwersji z 4.5 na 4.51 czy ze wspomnianej
już 5.0 na 5.1. Na przestrzeni lat pojawiały się takie
nowości, jak rozwój obsługi HTML, dodawanie
nowych skrótów nawigacyjnych, rozbudowa opcji
konfiguracyjnych w menedżerze konfiguracji (później centrum ustawień), świetna obsługa każdej
wersji Microsoft Office, wsparcie programu Mozilla
Firefox od wersji JAWS 7.1 czy w późniejszym czasie
podstawowe wsparcie dla programu Mozilla Thunderbird od wersji JAWS 12.0 i tak dalej.
Pojawiły się też takie ciekawe funkcje jak
znaczniki położenia w HTML-u, od JAWS 5 ulep-
Jaws dla Windows - wersja 12
szano personalizację ustawień dla poszczególnych
witryn/domen i poszczególnych stron internetowych czy nawet dokumentów PDF i Office.
Dziś to bardzo rozbudowane mechanizmy i tak
naprawdę w każdym dokumencie można mieć
ustawione takie opcje odczytu, jakie w danym
momencie się przydadzą. Z ważniejszych rzeczy
dodam tutaj jeszcze aliasy głosów, które można
tworzyć dla różnych syntezatorów, schematy
mowy i dźwięków ulepszane i wprowadzone
w JAWS 5. W JAWS dodano również od wersji 6
możliwość etykietowania kontrolek i pól formularzy w Office, przycisków i innych kontrolek formularzy w HTML-u.
W JAWS 6 pojawiła się możliwość dostosowywania sposobu odczytywania pasków postępu,
co dla mnie było bardzo znaczące. Właśnie wiele
takich nowości, w stylu „mała rzecz, a cieszy”
i naprawdę się przydaje, pojawiło się w programie
JAWS od wersji 3.7 do wersji 7.10.
Niestety od wersji 8.0 zrezygnowano z wersjonowania stosowanego do czasów JAWS 7.10.
Powstały zatem kolejno JAWS wersja 8.0, 9, 10, 11,
12 i 13, a wreszcie 14 i 15. Do wersji JAWS 12 lista
nowości i zmian była jeszcze zawsze dość imponująca, chociaż już nie tak długa, jak we wcześniejszych wersjach, i zawierająca ulepszenia wiele
wnoszące do codziennego użytkowania programu.
Ciekawe nowości w JAWS 8 to obsługa Windows Vista, Startowy kreator uruchamiania,
służący do ustawienia podstawowych opcji
na początku pracy z JAWS-em i dostępny zawsze
z menu pomoc.
W wersji 9. JAWS pojawiło się ulepszenie okna
„Dostosuj opcje JAWS”, wiele usprawnień w Micro-
Jaws dla Windows - wersja 14
NR 1 (22) 2014
14
soft Office, wprowadzenie możliwości kopiowania ze strony internetowej lub dokumentu PDF
fragmentów tekstu lub całości z zachowaniem
formatowania.
W wersji 10. dodano funkcję JAWS tandem,
która umożliwia zdalne połączenie między dwoma
użytkownikami programu JAWS w wersji obsługującej JAWS tandem i przeprowadzenie na przykład
szkolenia lub udzielenie pomocy w rozwiązaniu
jakiegoś problemu z komputerem.
Rozwiązaniem, które docenią wszyscy, którzy
mają do swojego komputera podłączoną więcej
niż jedną kartę dźwiękową, jest właśnie obsługa
wielu takich urządzeń. Umożliwia to przekierowanie mowy na wybraną przez użytkownika
kartę dźwiękową. Funkcję tę dodano również
w JAWS 10.
W późniejszych wersjach JAWS-a, od wersji 11 i wyżej, było to już głównie nadążanie za
systemem Microsoft Windows i wspieranymi
aplikacjami oraz poprawki znalezionych błędów.
Nie znaczy to oczywiście, że nowości w JAWS 11
i wyższych wcale nie były ciekawe.
Powstanie wersji 11. przyniosło nam warstwowe kombinacje klawiszy, służące do wywoływania takich funkcji jak „JAWS zbadaj to” czy
„tryb tabel”.
Nie mogę nazwać na pewno czymś pożytecznym modułów „JAWS zbadaj to”, ang. Research it.
Dla polskich użytkowników większość modułów,
poza Wiki-słownikiem, modułem do przeszukiwania Wikipedii lub modułem dotyczącym pogody
oraz konwersji walut czy śledzenia przesyłek UPS
po numerze monitorowania, właściwie nie jest
przydatna. Uważam powstanie funkcji „zbadaj
to” za pewną stratę czasu programistów tworzących JAWS i pewien brak pomysłów na nowości,
ponieważ to tylko gadżety, bez których screenreader może się świetnie obejść, podobnie zresztą
jak Windows Vista czy Windows 7 nie potrzebuje
wcale gadżetów, zaproponowanych nam razem
z interfejsem Aero. Nie znalazłem wielu ciekawych
gadżetów na te systemy do paska bocznego Visty
czy też do galerii gadżetów Siódemki.
W wersji JAWS 12 przełomowe okazało się dodanie nowego centrum ustawień, co było świetnym
15
posunięciem, biorąc pod uwagę ilość opcji, w jakiej
już coraz trudniej było poruszać się przy użyciu
starego menedżera konfiguracji, który odszedł
na zasłużoną programową emeryturę. Wyszukiwanie poszczególnych opcji do zmiany naprawdę
umiliło pracę przy konfiguracji programu JAWS.
Pojawiły się też nowe funkcje, wykorzystujące wprowadzone w JAWS 11, warstwowe skróty
klawiszowe, dla mnie przydatne przede wszystkim
Insert+Spacja+I, kombinacja ta blokuje klawiaturę
komputera. Funkcja bardzo przydatna, gdy na komputerze trwa jakiś proces, którego przerwanie
może być uciążliwe lub spowodować utratę wrażliwych danych.
Wersja 12. wniosła też ułatwienia w nawigacji
po wstążkach pakietu MS Office i całkiem sporo
usprawnień dotyczących brajla, np. możliwość pisania skrótami brajlowskimi pierwszego stopnia.
Wersja 13. wniosła dwie interesujące rzeczy,
a mianowicie okno szybkie ustawienia pod dobrze
już znanym skrótem Insert+v, co jest kolejnym ulepszeniem tej znanej funkcji. Kolejnym istotnym elementem jest JAWS OCR, czyli podręczne narzędzie,
służące do rozpoznawania zawartości na ekranie,
która nie jest tekstem, lecz obrazem, na przykład
niedostępne okna menu filmów DVD mogą zostać
odczytane przy użyciu funkcji OCR, a program
JAWS użyje kursora JAWS, czyli kursora myszki
do poruszania się i klikania w rozpoznany tekst.
JAWS w wersji 14.0 to obsługa nowych Windows
8 i 8.1 oraz elastyczne przeglądanie Web, pozwalające za pomocą specjalnych reguł pomijać w wirtualnym buforze wyświetlanej strony internetowej,
elementy takie jak ramki serwisów społecznościowych (Facebook, Twitter, Google+).
W JAWS 15.0 ulepszono obsługę Windows 8.1,
wprowadzono kursor dotykowy, aby usprawnić
nawigację na tabletach i ekranach dotykowych.
Kursor ten działa oczywiście również przy użyciu
klawiatury. W chwili, gdy piszę ten tekst, nadal nie
ma polskiej wersji JAWS 15.
Podsumowanie rozwoju
Jak można się przekonać z mojego krótkiego
opisu nowości, w każdej wersji było ich dużo, ale
w nowszych zdecydowanie mniej niż w starszych
wersjach.
Po opisaniu historii rozwoju programu, przejdę
teraz do rozprawy z tą aplikacją i spróbuję Wam,
Czytelnikom dostarczyć wskazówek pomocnych
do określenia tego, czy program JAWS jest właśnie
dla Was, ponieważ każdy sam powinien podjąć
ostateczną decyzję.
Wady programu JAWS
Jako zdeklarowany już zwolennik tej aplikacji rozpocznę od wad i niedogodności, ponieważ jest ich
nadal mniej niż zalet tego programu.
Wysoka cena
Pierwszą wadą jest cena programu. Biorąc pod
uwagę rozwój darmowej alternatywy, czy możliwe przyszłościowe zintegrowanie programu
Window-Eyes z systemem Windows oraz już teraz
mocną współpracę Microsoftu z firmą GW Micro,
naprawdę dziwię się, że cena dumnego konkurenta
nie schodzi z wysokiego pułapu i nadal jest to najdroższy program na rynku.
Duże rozmiary aplikacji i problemy z jej
optymalizacją
Na kolejną wadę składa się w zasadzie kilka cech
programu, które sprawiają, że nie będzie on nadążał
za szybkim rozwojem aplikacji, takich jak przeglądarki sieci Web czy internetowe aplikacje biurowe.
Program JAWS to jedna, zintegrowana, spójna
całość, dostajemy go w jednym dużym pakiecie
instalacyjnym, który jest już dziś zbyt duży (co stanowi kolejną wadę). Proces powstawania stabilnej
wersji jest nadal rodem z czasów Windowsa XP,
który na swojego następcę, tj. na Windows Vista,
czekał 6 lat. Dziś systemy i większe aktualizacje
do nich są wydawane znacznie szybciej, co sprawia,
że JAWS ma coraz większe problemy z zapewnieniem stabilnej obsługi najnowszych wersji Microsoft Windows.
Darmowy konkurent – NVDA jest zdecydowanie mniejszą aplikacją, dzięki czemu poprawianie
błędów i nadążanie za najnowszymi popularnymi
aplikacjami jest znacznie łatwiejsze.
Nieprzyjazny sposób autoryzacji
Kolejną wadą programu JAWS jest jego mechanizm autoryzacyjny. W czasach, gdy większość
NR 1 (22) 2014
16
z nas miała tylko jeden komputer, a część z nas
mogła korzystać z tego dobrodziejstwa tylko
w bibliotece czy szkole, nie był to aż taki problem.
Dziś, gdy często dysponujemy dwoma lub nawet
trzema komputerami, problem zaczyna się robić
poważniejszy. Na serwerach aktywacyjnych dla
każdej licencji dostępne są tylko 3 klucze w trybie aktywacji internetowej. Niestety mechanizm
autoryzacji internetowej jest tak wrażliwy, że zdarza się czasem utrata autoryzacji bez wyraźnego
powodu, np. wczoraj zamknęliśmy system i komputer został poprawnie wyłączony, a dzisiaj JAWS
nie działa i komputer nie ma pełnej wersji programu, za który przecież producentowi zapłacono.
Z kluczem sprzętowym jest jeszcze gorzej,
ponieważ jest on przywiązany tylko do jednego
komputera, co jest całkiem logiczne. Nie rozumiem jednak, dlaczego nie można dokupić do tej
samej licencji drugiego klucza sprzętowego. Ciągłe
przepinanie klucza z komputera do komputera
szkodzi zarówno kluczowi USB, jak i wejściom USB
w obu komputerach.
Wadę, ale również zaletę ma sposób internetowej autoryzacji programu Window-Eyes, czyli
Everlock. Licencja umożliwia instalację programu
aż na pięciu komputerach i jest możliwe zwracanie i pobieranie klucza z serwera w dowolnym
momencie. Podczas, gdy 3 klucze w JAWS można
zresetować bez specjalnego tłumaczenia dystrybutorowi i producentowi, podając tylko powód
utraty klucza z bieżącej instalacji, nie częściej
jednak niż co 3 miesiące, to w Window-Eyes, gdy
klucza nie uda się zwrócić, np. w przypadku awarii
dysku, to odzyskanie tego klucza, nawet utraconego nie z winy użytkownika, nie jest już takie
proste.
Jak można wywnioskować, oba płatne czytniki
mogłyby mieć nieco lepiej rozwiązany mechanizm
zabezpieczenia przed piractwem, bo obecnie najczęściej cierpią właśnie legalni użytkownicy.
17
Problemy z wersją przenośną (Portable)
Następną wadą JAWS jest przenośność programu… a właściwie to prawie jej brak.
Kilka lat temu z komputera korzystało się
najczęściej w domu lub pracy, przynajmniej
w przypadku niewidomych. Dzisiaj jest to zdecydowanie częstszy przypadek, np. u znajomych
czy w kawiarence internetowej. Mamy ponownie
wypływającego na powierzchnię konkurenta obu
dużych komercyjnych czytników ekranu. Program
NVDA umożliwia bardzo proste i szybkie utworzenie kopii przenośnej na dysku zewnętrznym lub
pendrivie. Dzięki temu, bez instalacji czegokolwiek
na komputerze znajomych, mamy swoje własne ustawienia i dobrze znany program odczytu
ekranu. W przypadku programu JAWS sprawa nie
jest prosta. Wymaga on instalacji sterownika grafiki czy nawet syntezatora mowy SAPI 5, a to już
ingerencja w system osoby, która nam ten komputer udostępnia. Przenośność to w najlepszym razie
trudno osiągalna cecha programu JAWS.
Problemy programu JAWS w Internecie
Kolejną niepokojącą rzeczą jest fakt, że coraz
częściej przytrafiają mi się sytuacje, że na wielu
stronach internetowych, w duecie z przeglądarką
Firefox, NVDA radzi sobie zdecydowanie lepiej niż
Internet Explorer z JAWS.
Cieszy mnie rozwój NVDA, ale niepokoi fakt,
że oba płatne rozwiązania, a w tym przypadku
zwłaszcza Window-Eyes, często nie są w stanie
poprawnie zinterpretować i poprawnie przedstawić mi zawartości strony. Aplikacje kosztujące
kilka tysięcy złotych za jedną licencję nie powinny
zbyt często mieć takich problemów, a tym czasem zarówno w Window-Eyes, jak i w JAWS jest
to coraz częstsze zjawisko.
Zalety programu JAWS dla Windows
Ponarzekałem, teraz czas napisać, dlaczego, mimo
rozwoju darmowego NVDA, mimo posiadania
licencji na Window-Eyes w najnowszej wersji,
nadal moim głównym czytnikiem ekranu dla Windows pozostaje program JAWS.
Pierwszą rzeczą jest siła przyzwyczajenia,
która jest podobno drugą naturą człowieka, ale
to nie jest najprostsze wyjaśnienie.
Program JAWS posiada najwięcej utworzonych
przez lata funkcji personalizacji pracy z różnymi
typami danych, programów i tak dalej. To jedyny
screenreader, który w pełni umożliwia pisanie
skrótami brajlowskimi przy użyciu monitorów
brajlowskich firmy Freedom Scientific. (to wiem
na pewno, nie testowałem z innymi monitorami).
Żaden screenreader nie współpracuje tak świetnie jak JAWS z Microsoft Office (w szczególności
z Wordem, Excelem i moim ulubionym klientem
poczty e-mail Microsoft Outlook). Radzi sobie
też najlepiej z przeglądarką systemową Internet
Explorer. Przeglądarki Firefox czy nawet Chrome
są również obsługiwane, mimo szybkiego ich
rozwoju. Window-Eyes ma tutaj zdecydowanie więcej problemów, zwłaszcza w przypadku
Chrome, nie jest też tak dobry jak JAWS w obsłudze pakietu Office.
Program NVDA jest zdecydowanie mniej stabilny od programu JAWS czy nawet Window-Eyes,
który ostatnio odrabia straty w dziedzinie stabilności działania.
Podsumowując, można powiedzieć, że program
JAWS jest nadal moim pierwszym czytnikiem
ekranu, ponieważ posiada funkcje, których konkurencja albo nie posiada, albo wymaga włączenia,
bądź instalacji i odszukania jakiegoś dodatku lub
dodatków. Przykłady tych funkcji to:
• elastyczne przeglądanie Web,
• kompleksowa obsługa programu Winamp,
• dostosowywanie w JAWS kolejności odczytywania kolumn na listach, np. wiadomości
e-mail.
Program JAWS posiada również sterownik
do mojego ulubionego syntezatora mowy, czyli
Apollo 2. To jedyny czytnik ekranu, który jest
w stanie przeczytać mi książkę, używając ciągłego
czytania razem z tym syntezatorem, ani NVDA, ani
Window-Eyes tego nie potrafi.
Jest to czytnik ekranu, który posiada najwięcej skrótów klawiszowych lub skryptów, do których możemy przypisywać skróty w zależności
od potrzeb, w bardzo prosty sposób, przy użyciu
menedżera klawiatury.
Program JAWS ma bardzo łatwo przenośny profil, w przeciwieństwie do Window-Eyes
do konfiguracji użytkownika trafiają tylko nowe
NR 1 (22) 2014
18
Od wersji 10. znacznie poprawiła się też jakość
spolszczenia JAWS, pojawiła się możliwość prostej aktualizacji polskiej wersji, co do tej pory
było możliwe tylko w angielskiej. Mimo wszystko
program się rozwija i dlatego z optymizmem myślę
o następnych jego wersjach.
Dla kogo jest program JAWS?
Na koniec
Mam nadzieję, że w tym opisie programu JAWS
i jego porównaniu z konkurencją ukazałem następujące twierdzenie jako prawdziwe. Płatny czytnik
ekranu JAWS, mimo wysokiej ceny i swoich wad,
nadal ma wiele do zaoferowania użytkownikom,
nie rzadko więcej niż inne screenreadery, nawet
w starszych wersjach jak 12 czy 13 w systemie
Windows 7 czy Windows Vista.
fot. shutterstock, Freedom Scientific
lub zmodyfikowane pliki z konfiguracji domyślnych, co sprawia, że ustawienia dla danej wersji
raz dokonane można bezpiecznie przechowywać, przenieść je na nowy komputer lub nawet
importować do nowej wersji programu. W przypadku Window-Eyes przenoszonych jest bardzo
dużo plików. Program JAWS nie jest tak wrażliwy
na zmianę rozdzielczości ekranu jak Window-Eyes.
Konfiguracje dla Window-Eyes często są pisane
pod standardową rozdzielczość. Często zdarza się,
że gdy rozdzielczość ekranu jest niższa lub wyższa, konfiguracje nie spełniają swojej roli.
Program JAWS, jako jedyny, posiada zarządzanie ustawieniami aplikacji, to znaczy w prosty
sposób, bez zabawy w skojarzenia plików konfiguracyjnych możemy włączyć lub wyłączyć konfigurację JAWS dla danej aplikacji, jeżeli stwierdzamy
jakiś problem w pracy z programem.
Ostatnia z istotnych przewag JAWS nad konkurencją to praca w Internecie. Mimo zadyszki,
którą złapał program firmy Freedom Scientific
w wyścigu z darmowym NVDA, to ilość dostępnych w programie ścieżek rozwiązań różnych
problemów, prawie zawsze pozwala dotrzymać
mu kroku.
W moim odczuciu, jeżeli potrzeby są podstawowe, tzn. chcemy czytać pocztę, logować się
do różnych serwisów społecznościowych, bankowych, aukcyjnych, czytać informacje w Internecie,
słuchać muzyki, to wystarczy darmowy NVDA.
Jeżeli jednak jesteście tzw. power userami, czyli
użytkownikami lubiącymi testować różne aplikacje, sami uczycie się różnych rzeczy na komputerze, a do pracy zawodowej wykorzystujecie
Microsoft Office albo zaawansowane środowiska
programistyczne, to używając NVDA w pewnym
momencie możecie poczuć niedosyt. Użytkownicy Window-Eyes zarzucają programowi JAWS
skomplikowaną konfigurację. Dla użytkowników
lubiących eksperymentować program ten wyda
się świetnym polem do rozwinięcia zarówno
wiedzy, jak i umiejętności. Jeżeli pracujecie lub
zamierzacie podjąć pracę z dużą ilością stron
internetowych, na których trzeba będzie wyszukiwać informacje lub wchodzić w interakcję z ich
zawartością, np. wypełniać formularze, polecam
duet NVDA i JAWS. Program Window-Eyes ostatnio dużo stracił w wyścigu o przeglądanie stron
i radzenie sobie z trudną zawartością nie jest
jego mocną stroną.
Atutem programu Window-Eyes jest prostota
dla początkujących użytkowników w połączeniu
z dużą, nadal bardzo elastyczną i często jeszcze
lepszą od NVDA możliwością jego konfiguracji.
19
Krzysztof Wostal
Android czy iOS –
wybór głuchoniewidomych?
Ludzie komunikowali się między sobą od zarania dziejów.
Rzec by można, że to podstawa rozwoju naszego gatunku.
Wykorzystywali do tego różne, dostępne im metody
i technologie. Czyż to nie jest fascynujące, że żyją wśród nas
ludzie, którzy pamiętają, że gdy się urodzili, we wsi był tylko
jeden radioodbiornik i mieszkańcy schodzili się do posiadacza
tego sprzętu, by posłuchać jakiejś audycji.
Ci sami ludzie używają dziś
nie tylko radioodbiorników, ale
innych urządzeń i korzystają
z nowoczesnych technologii.
Komputer czy telefon nie jest
dla nich zagadką i potrafią
wykonywać za jego pomocą
nie tylko rozmowy, ale i inne
czynności.
Telefony podlegają ewolucji, tak jak sprzęt elektro-
niczny. Technologia zmienia się
na naszych oczach. To, co jeszcze wczoraj było dla nas, głuchoniewidomych niedostępne,
dziś możemy obsłużyć. Czasem
możemy obsłużyć wszystko,
czasem niewiele funkcji, ale
wszystko zmierza ku lepszemu.
Pamiętamy, że były kiedyś
telefony stacjonarne, które
obsługiwaliśmy bez problemu.
Aparaty telefoniczne zmieniały się i ewoluowały z takich
na korbkę, poprzez tarczowe,
do klawiszowych z wyświetlaczami, a także funkcjami
głosowymi.
Również telefony komórkowe
się zmieniały. Najpierw były
klawiszowe, których nie można
było obsługiwać ze względu
na brak udźwiękowienia ich
funkcji czy powiększenia tego,
co było widać na wyświetlaczach. Potem jednak pojawił
się system operacyjny Symbian,
co pozwoliło na instalację udogodnień dla inwalidów wzroku,
a także na rozmowy video,
z których mogły korzystać
osoby migające.
Nie ma jednak wątpliwości,
że ostatnie kilkanaście lat było
NR 1 (22) 2014
20
Nagrywanie w programie
Dragon Dictation
przełomowe, jeśli chodzi o rozwój telefonii komórkowej. Za
najważniejsze dla osób głuchoniewidomych wydarzenie w tej
dziedzinie należy z pewnością
uznać ukazanie się systemu
operacyjnego Symbian, pozwalającego korzystać z telefonów
komórkowych na nieosiągalnym do tej pory poziomie
funkcjonalności.
Technologia jednak wciąż
się zmienia i nadszedł jego
zmierzch. Nie będzie już nowych
aparatów z tym systemem.
A może smartphone?
W roku 2007 firma Apple
zaprezentowała iPhone – telefon z ekranem dotykowym,
posiadający, poza włącznikiem
i klawiszami głośności, tylko
jeden przycisk. Mimo początkowego sceptycyzmu, telefon
ten przyjął się na rynku bardzo
dobrze, a zastosowany w nim
system operacyjny – iOS, wraz
z całą gamą darmowych i płat-
nych aplikacji dodatkowych,
jest nadal rozwijany. Obsługa
urządzenia za pomocą gestów
na tyle się spodobała, że,
upraszczając nieco sprawę, inni
producenci zaczęli naśladować pomysł Apple. Przykładem
może być m.in. firma Google,
która zaproponowała producentom sprzętu mobilny system
operacyjny o nazwie Android.
Obecnie systemy operacyjne iOS
i Android królują w urządzeniach
mobilnych, gdzie telefon jest już
tylko jedną z funkcji, przez nie
oferowanych. Istnieją także inne
systemy operacyjne, ale dwa
wspomniane, to moim zdaniem
jedyne warte uwagi w kontekście użytkownika z jednoczesną
dysfunkcją wzroku i słuchu.
Warto w tym miejscu nadmienić, że o ile osoby słabowidzące
nierzadko nie potrzebują syntezy mowy, o tyle osoby niewidome bez niej prawie wcale
nie są w stanie posługiwać się
smartphonem – chyba, że używają go z monitorem brajlowskim. Warto też wiedzieć, że zdecydowana większość aparatów
słuchowych posiada wbudowaną
cewkę indukcyjną, pozwalającą
na odbiór sygnału za pomocą
pętli indukcyjnej, która może
być podłączona do telefonu.
Trwają też prace nad możliwością bezprzewodowego łączenia
aparatów słuchowych z telefonami, bez potrzeby przełączania aparatów w tryb cewki
indukcyjnej. Są także aparaty
słuchowe, które świetnie sobie
radzą bez konieczności przełączania na cewkę, gdy odpowiednio ustawimy głośnik słuchawki,
będziemy słyszeli naszego
rozmówcę. Zależy to jednak nie
tylko od samego aparatu słuchowego, ale i urządzenia przez
które rozmawiamy, a także stanu
słuchu użytkownika.
Warto wiedzieć, że na system
iOS mamy darmowe oprogramowanie, które możemy wykorzystać do wzajemnej komunikacji.
Jest to program Dragon Dictation, któremu możemy podyktować tekst, by pokazać go osobie
głuchej, która może nam odpowiedzieć pisząc, co my z kolei
usłyszymy. Jest też darmowy,
cały czas rozwijający się program Spread Signs, który działa
na zasadzie tłumacza. Możemy
wpisać jakieś słowo lub wyrażenie, by po chwili mieć je przetłumaczone na język migowy (PJM).
Dodatkowo znak ten możemy
zobaczyć w wielu językach
migowych świata.
Program Spread Signs
działa na zasadzie tłumacza
na język migowy (PJM)
21
Zdecydowana większość aparatów słuchowych posiada wbudowaną cewkę indukcyjną, pozwalającą na odbiór sygnału za pomocą pętli indukcyjnej, która może być podłączona do telefonu
Ponieważ Symbian się skończył, a trend światowy jest taki,
że coraz więcej urządzeń jest
obsługiwanych dotykiem, trzeba
zaplanować, co dalej. Czytelnicy
z pewnością zastanawiają się
nad tym, jak można w ogóle
obsłużyć urządzenie z dotykowym ekranem w sytuacji osoby
całkowicie niewidomej i przy
tym z uszkodzonym słuchem.
Zapewniam, że jeśli jesteśmy
sprawni manualnie, nie powinno
stanowić to większych trudności. Autor niniejszego tekstu,
który jest osobą głuchoniewidomą – jednocześnie całkowicie
niewidomą i słabosłyszącą,
sam używa iPhone'a, które jest
urządzeniem w pełni dotykowym, gdzie w wykonaniu 99,9%
czynności trzeba się posłużyć
jakimś gestem. Na marginesie
wyjaśnię, że gest to odpowiedni
dla danej czynności ruch palców,
bądź stosowne stuknięcie. Przykładowo w iPhonie, by uruchomić aplikację, stukamy dwa razy
jednym palcem w ekran, aby
przeczytać zawartość ekranu
przeciągamy z góry na dół
dwoma palcami.
Pytanie nie powinno więc
brzmieć: „Czy używać urządzeń
dotykowych?”
Pytanie powinno brzmieć:
„Z jakim systemem wybrać
urządzenie dotykowe, by w jak
najbardziej efektywny dla siebie
sposób z niego korzystać?”
Co więc wybrać?
Przy wyborze systemu operacyjnego warto pamiętać, że system
iOS na wszystkich urządzeniach,
na których jest zainstalowany,
działa stabilnie, dobrze i tak
samo. Jeśli chodzi o Android,
to jest wiele wersji tego systemu
i nie zawsze wszystko będzie
działało tak samo na wszystkich
urządzeniach mimo, że wersja
systemu Android będzie wskazywała na to, że można w niej
spodziewać się funkcji ułatwień
dostępu.
Firma Apple oferuje użytkownikom sprzęt i zintegrowany z nim system operacyjny,
nie pozwalając zbytnio na jego
modyfikację. Google natomiast,
w porozumieniu z producentami sprzętu, zaczął wyposażać
w system Google Android urządzenia wszelkiej maści i marki.
Możemy go więc spotkać
NR 1 (22) 2014
22
w smartphone’ach, tabletach,
odtwarzaczach multimedialnych, urządzeniach do odbioru
telewizji, a nawet netbookach,
oferowanych przez różnych
producentów. Dlatego też
we wszystkich urządzeniach
z systemem operacyjnym iOS,
oprogramowanie udźwiękawiające i powiększające zachowuje
się tak samo, a w urządzeniach,
gdzie jest zainstalowany system operacyjny Android, może
być z tym różnie, a wręcz może
nie być możliwości instalacji
takiego oprogramowania.
Musimy wiedzieć, że dla
języka polskiego w przypadku
iOS mamy do wyboru tylko
jeden głos - żeński, a w przypadku systemu Android można
wybierać z kilku głosów – męski,
żeński i syntetyczny.
Powinniśmy jednak także
wiedzieć, że dla systemu iOS
jest znacznie więcej oprogramowania dedykowanego osobom
niepełnosprawnym. Możemy
na przykład zainstalować aplikacje wykrywające źródło światła,
kolory, nominały banknotów,
wspomagające nawigację,
potrafiące rozpoznać produkty
spożywcze, emulujące lupę elektroniczną itd. W przypadku systemu Android część wymienionych tu funkcji jest realizowana,
ale na chwilę obecną na niższym
poziomie, niż w przypadku systemu Apple.
Ze względu na to, iż wśród
samych głuchoniewidomych
istnieje duże zróżnicowanie pod
względem uszkodzenia wzroku
i słuchu, różne też może być
podejście do używania urządzeń z systemem operacyjnym
iOS i Android. Dlatego też
należy przy zakupie kierować
się przede wszystkim możliwościami, jakie daje dane urządzenie, a także tym, jakie mamy
potrzeby. Powinniśmy wiedzieć,
że nie ma jednego, dobrego
rozwiązania dla wszystkich. To,
co dla jednych jest bardzo przy-
datne, dla innych może nie mieć
wcale znaczenia. Przed dokonaniem zakupu warto poświęcić
czas na testy i sprawdzanie
różnych rozwiązań.
Wydaje się, że urządzenie
iPhone, które prócz dobrej
jakości programu odczytu
ekranu, zawiera oprogramowanie powiększające jego zawartość i współpracuje z wieloma
monitorami brajlowskimi,
jest dobrym i jednoznacznym
wyborem dla osób głuchoniewidomych, które są niewidome
i jednocześnie słabosłyszące
lub całkowicie głuche albo też
jednocześnie słabowidzące
i słabosłyszące. Pamiętać przy
tym należy, że synteza mowy
dla języka polskiego nie jest
doskonała i mamy do wyboru
jedynie głos żeński.
W przypadku osób jednocześnie słabowidzących i głuchych
wybór jest nieco trudniejszy,
gdyż oprogramowanie powiększające zawartość ekranu
w systemie Android jest dość
dobrej jakości, a urządzenia
są tańsze oraz jest ich duży
wybór.
Osoby pamiętające czasy pierwszych telewizorów i odbiorników dziś z powodzeniem używają nie tylko telefonów, ale
i komputerów
W niniejszym krótkim artykule
zasygnalizowałem tylko możliwości, które mamy do wyboru.
W ogóle nie piszę o tym,
co daje nam, jako osobom z niepełnosprawnością smartphone
w kwestii rozrywki i pracy,
a także wyrównania szans społecznych w stosunku do osób
pełnosprawnych. Dodam tylko,
że fragmenty artykułu podyktowałem mojemu iPhone’owi,
który przerobił je na tekst.:)
fot. shutterstock, Nuance, Europeiskt Teckensprakcenter
Na zakończenie
23
Michał Kasperczak
Screenreadery
wczoraj i dziś
Intensywna ekspansja i rozwój systemu Windows sprawiły,
że producenci czytników ekranu musieli poradzić sobie
z trudnym zadaniem, jak udostępnić osobie niewidomej
graficzne środowisko pracy, tak by była ona możliwie łatwa
i efektywna.
Hal 95. Początki pracy
niewidomych w systemie
Windows
Pierwszym, znanym w Polsce, screenreaderem, który
pracował z Windows 95, był
Hal firmy Dolphin Computer Access. Trzeba przyznać,
że w latach dziewięćdziesiątych
i na początku XXI w. był to bardzo popularny program. Prawidłowo współpracował z wtedy
ciągle jeszcze używanym syn-
tezatorem Apollo, pozwalał
na ustawianie wymowy różnych
rodzajów komunikatów, posiadał łatwy sposób odczytywania podstawowych elementów
tekstu (znak, słowo, linia itp.)
i bardzo dobrze współistniał
z podstawowymi aplikacjami
systemowymi oraz pakietem
MS-Office, w szczególności zaś
z MS-Word. Działał do pewnego
stopnia, tak jak NVDA. Umożliwiał lekką i szybką pracę, ale
tylko z tymi aplikacjami, które
dobrze udawało się obsłużyć
w standardowy sposób, tj. przy
pomocy strzałek i klawisza
TAB. Główną jego bolączką
była słaba możliwość obsługi
aplikacji z nietypowymi kontrolkami. Potem zaopatrzony został
co prawda w swego rodzaju tryb
wirtualnego kursora myszki, ale
nie był on niestety ani intuicyjny, ani wydajny. Hal oczywiście jeszcze się rozwinął, zyskał
lepszy wirtualny kursor, obsługę
Internetu, programowy syntezator mowy Apollo, istniejący pod
nazwą Orpheus, pliki map (konfiguracji) dla określonych aplikacji, ale to już było niestety zbyt
późno i zbyt mało, w stosunku
do konkurencyjnych rozwiązań.
NR 1 (22) 2014
24
Użytkownicy Ms-Office 2010 i 2013 mogą legalnie używać
specjalnej wersji Window-Eyes, w 95% działającej tak samo, jak
jego płatna kopia
Outspoken. Można „klikać
myszką”
Około 1998 r. na polskim rynku
pojawił się Outspoken – screenreader holenderskiej firmy
Alva, spolszczony i sprzedawany
u nas przez poznańską firmę
Harpo, dzięki której na kilka
lat zadomowił się na naszym
rynku. W odróżnieniu od Hala,
miał polski interfejs, obsługiwał monitory brajlowskie (tylko
w droższej wersji)i można go
było zakupić po niższej cenie
dla uczniów i studentów. Jedyną
ciekawą jego cechą była na tamten czas dobra obsługa kursora
myszki, swoją ideą zbliżona
do Window-Eyes, dzięki czemu
obsłużyć można było wcześniej
niedostępne programy. Niestety
na tym dobrodziejstwa Outspokena się kończyły. Przez długi
czas nie istniała w zasadzie
żadna możliwość zapisywania
konfiguracji dla poszczególnych
programów, a sposobów odczytywania pożądanych informacji
z ekranu też nie było zbyt dużo.
Do tego dodajmy problemy
Outspokena w pracy z syntezatorami sprzętowymi: Apollo
i Kubuś.
JAWS i Window-Eyes
w Polsce
Rok 1999 to w polskiej tyfloinformatyce przełomowy moment.
Wówczas zaistniał program
„Komputer dla Homera”, obsługiwany przez PFRON, a co za
tym idzie, znacznie większa
grupa osób mogła sobie pozwolić na zakup screenreaderów,
zaś firmy je sprzedające w trosce o klienta, zaczęły je spolszczać i tym samym bardziej
zabiegać o klienta. Na polskim
rynku zagościły już na dobre
dwa czytniki ekranu: JAWS
i Window-Eyes. Odtąd to one
determinować będą sposób
pracy niewidomego użytkownika z komputerem. Przez mniej
więcej 10 lat będą na świecie
bezkonkurencyjne, stanowiąc
synonim jakości dobrego screenreadera. Już wówczas swoimi
możliwościami przewyższały
i Hala, i Outspokena. Pozwa-
lały na emulację windowsowej
myszki, dobrą parametryzację
mowy, wyświetlanie komunikatów na monitorach brajlowskich, śledzenie wybranych
obszarów ekranu oraz tworzenie
konfiguracji, adekwatnych dla
rozmaitych aplikacji użytkowych. Zaopatrzone były w tzw.
wirtualny tryb przeglądania,
w którym stronę internetową
przeglądać można było, tak jak
dokument w przysłowiowym
Wordzie. Moim zdaniem właśnie
to zaważyło na popularności
programów JFW i WE na świecie
i w naszym kraju. Nie bez racji
Window-Eyes uważany był za
program łatwiejszy w obsłudze, niż JAWS, po instalacji
lepiej dostrojony do wymagań
przeciętnego użytkownika,
wykrywający więcej syntezatorów i urządzeń brajlowskich,
a do tego, co niezmiernie ważne,
występujący szybko w polskiej
wersji językowej i zawierający
szczegółowy polski podręcznik do jego obsługi i chwalone
wsparcie techniczne. JAWS –
to w wielu krajach najpopularniejszy czytnik ekranu, niestety
w konfiguracji był i w sumie
nadal jest od Window-Eyes bardziej skomplikowany, toteż jego
ustawienie zajmowało nowym
użytkownikom więcej czasu.
A niestety JAWS na początku nie
był po polsku, a potem spolszczenia pojawiały się średnio
po pół roku od publikacji wersji
oryginalnej. Cóż z tego, że polski dystrybutor, do momentu
wypuszczenia polskiej lokalizacji, kazał używać starszej wersji,
kiedy od dawna każdy chciał
używać i sprawdzać nowości we
25
właśnie zakupionym JAWS’ie.
Zapoznawanie się z nimi nie
było też łatwe z uwagi na częstą
niepełną polską dokumentację
do JAWS, choć z wersji na wersję, było z tym coraz lepiej.
Twórcy screenreaderów mogli
pozwolić sobie na wprowadzanie ciekawych nowości, choćby
z uwagi na to, że średnio co 3-4
lata pojawiał się nowy system
operacyjny i pakiet biurowy MS-Office firmy Microsoft. Tak było
aż do roku 2007, kiedy to zaprezentowany został Windows
Vista i MS Office 2007.
Pierwsze problemy
Nowo wprowadzone przez
giganta z Redmont interfejsy
użytkownika sprawiły osobom
korzystającym z czytników
ekranu i ich twórcom nie mało
kłopotów. O ile Windows Vista
ogólnie nie został dobrze przyjęty, o tyle Windows 7 zyskał
znaczną popularność i relatywnie szybko był dobrze obsługiwany przez czołowe czytniki
ekranu. Pojawiać się jednak
zaczęły kolejne problemy, a mianowicie ekspansja przeglądarki
Mozilla Firefox oraz zmiana
przyzwyczajeń użytkowników,
która dokonała się na skutek
wzrostu popularności ekranów
dotykowych, aplikacji mobilnych
i internetowych, działających
w oparciu o przeglądarkę. JAWS
jeszcze całkiem nieźle się broni,
o czym w jednym z artykułów
pisze w dalszej części tego
numeru czasopisma, Kamil
Żak. Natomiast Window-Eyes
ma znaczne kłopoty z efektywną obsługą dynamicznych
stron internetowych pisanych
GW Micro połączyła się z firmą Ai Squared, producentem programu powiększająco-czytającego ZoomText
w HTML5, Do tego wprowadzony
w wersji 7 tego Screenreadera,
mechanizm dodatków, z jednej strony w znaczący sposób
przyczynił się do usprawnienia
pracy, z drugiej jednak strony,
wpłynął na znaczny spadek
stabilności działania tego czytnika. Powyższe nie jest tylko
moją opinią, a refleksjami kilku
zaawansowanych użytkowników
WE, życzących mu jak najlepiej,
choćby Michała Dziwisza, który
w jednym z tekstów pochyla się
nad tym programem. W reszcie
powstaje pytanie, czy rzeczy-
wiście trzeba płacić za screenreader, gdyż pojawiło się nowe
rozwiązanie, bardzo ciekawe,
a w dodatku darmowe.
NVDA. Darmowy
screenreader, prawie tak
dobry, jak płatne programy
odczytu ekranu
W 2008 r. dwóch Australijczyków: James Teh i Michael
Curran, postanowiło stworzyć
Screenreader, nie dosyć, że darmowy, to jeszcze o otwartym
kodzie źródłowym. Program
otrzymał nazwę NVDA (Non
NR 1 (22) 2014
26
Nie mała grupa użytkowników wskazuje na spore niedogodności pracy na Macu, podnosząc przede wszystkim na uciążliwy
sposób nawigacji, jaki zaproponowali twórcy VoiceOver
Visual Desktop Access) i z uwagi
na wysokie ceny oraz niezbyt
przyjazny sposób autoryzacji
pozostałych czytników ekranu,
szybko zyskał znaczną sympatię niewidomych użytkowników, pomimo faktu, że jeszcze
wówczas nie był stabilny i miał
wiele ograniczeń. NVDA dzięki
dotacjom od różnych instytucji i osób prywatnych, oraz
ścisłej współpracy z Mozillą,
Adobe, w i w jakiejś mierze też
Microsoft, efektywnie udźwiękawia programy Mozilla Firefox
i Mozilla Thunderbird, nadąża za
rozwojem internetowych aplikacji działających w przeglądarce,
takich jak Facebook, niektóre
aplikacje Google, coraz też lepiej
działa z ms Office i aplikacjami
pisanymi w Javie. Dzięki sugestiom użytkowników program
staje się coraz bardziej stabilny,
a dzięki pisanym do niego
dodatkom, coraz bardziej
funkcjonalny.
Próba podsumowania.
Co dalej?
Trudno jednoznacznie prognozować dalszy rozwój czytników
ekranu, ale można pokusić się
o kilka stwierdzeń.
Po pierwsze, komputer nie
jest już konieczny do wielu
zastosowań użytkowych,
a czasem też profesjonalnych. Mobilne systemy operacyjne: IOS i Android, sprawiły,
że możemy na naszych telefonach i tabletach, przeglądać
Internet, komunikować się
z innymi, a nawet edytować teksty. I wszystko w cenie jednego
urządzenia oraz czytnika ekranu
VoiceOver albo TalkBack, zawartego w danym systemie operacyjnym. Pomóc nam jeszcze
może klawiatura na BlueTooth
oraz dodatkowy Powerbank.
Po drugie, wzrastać będzie
rola darmowego screenreadera
NVDA. Program ten zakorzenił
się już na dobre w świadomości
użytkowników oraz producentów
monitorów brajlowskich. Prawidłowo współpracuje z istotnymi
aplikacjami, w tym tymi, pisanymi w HTML5, daje coraz więcej
możliwości konfiguracyjnych,
przy jednocześnie stosunkowo
prostym interfejsie, do tego
pozwala na przygotowywanie
wtyczek, za pomocą powszechnie wykorzystywanego języka
programowania Python. Twórcy
NVDA, zdają sobie oczywiście
sprawę z jego niedogodności
i deklarują rozwiązanie najbardziej palących spraw, takich
jak: optymalizacja działania
screenreadera przy obciążonym procesorze i zmieniających
się elementach ekranu, lepsza
praca z MS Word (przeglądanie
dokumentów w trybie nawigacyjnym). Co zrobi główny konkurent NVDA, czyli JAWS? Trudno
powiedzieć. Sądzę, że jeszcze
przez kilka lat jego pozycja,
choć będzie tracić na znaczeniu,
będzie i tak dosyć wysoka. Tak
czy inaczej JFW posiada zaawansowane możliwości (współpraca
z MS-Office, bardzo rozbudowana obsługa wyświetlania
w brajlu, język skryptowy), które
mogą się przydać pewnej grupie
użytkowników.
Po trzecie, na znaczeniu
zyskuje w ogóle uniwersalne
projektowanie. Wszystko zaczęło
się od urządzeń Apple, które
w systemie mają zaimplementowany screenreader i program
powiększający VoiceOver oraz
wielojęzyczne syntezatory
mowy. Za nim, z lepszym lub
gorszym skutkiem, podążyły
inne systemy mobilne. A w komputerach? Tu znowu Apple było
27
fot. Shutterstock.com, Microsoft, GW Micro, iMore, Gil C.
pierwsze, rozszerzając możliwości wprowadzonego przedtem
VoiceOver, o obsługę gładzikiem,
natywną obsługę w zasadzie
wszystkich monitorów brajlowskich na świecie, wbudowane
w system TTS i tablice brajlowskie dla różnych języków oraz
inne opcje personalizacji. W systemie Windows na razie dzieje
się mało, choć i tak więcej niż
kiedyś. Narrator, czyli niby-screenreader wbudowany w system
Windows, w najnowszej wersji
okienek, oznaczonej cyfrą 8,
z aplikacjami Metro (Modern UI)
działa nie najgorzej, ale to stanowczo za mało, by efektywnie
obsługiwać komputer.
Po czwarte, nie wiemy tak
naprawdę, co przyniesie nam
umowa zawarta pomiędzy firmą
Microsoft a GW Micro, w wyniku
której użytkownicy Ms-Office
2010 i 2013, mogą legalnie
używać specjalnej wersji Window-Eyes, w 95% działającej
tak samo, jak jego płatna kopia.
Co więcej, GW Micro połączyła
się teraz z firmą Ai Squared,
producentem programu powiększająco-czytającego ZoomText.
Wbudowany w system Windows Narrator – niby-screenreader
od Microsoftu dość dobrze radzi sobie ze środowiskiem Modern UI
Co to wszystko znaczy dla
dostępności, zawartej w nowo
projektowanym systemie Windows 9? Nie wiemy. Czyżby Window-Eyes był w nim możliwy
do instalacji za darmo, a może
będzie od razu wbudowany,
niczym dawny niefunkcjonalny
Narrator. Sporo się mówi o pracach nad w końcu efektywnymi
sposobami przeglądania Internetu przy pomocy WE, ale zapowiadano to już w poprzednich
wersjach tego screenreadera.
Po piąte, chyba nie sprawdziły się początkowo entuzja-
styczne opinie użytkowników
komputerów Apple z VoiceOver, a co za tym idzie odwrót
niewidomych użytkowników
od rozwiązań windowsowych.
Komputery i system z Cupertino
na wiele pozwalają i wśród części niewidomych użytkowników
tyflotechnologii zostały bardzo
ciepło przyjęty. Nie mała ich
grupa wskazuje jednak na spore
niedogodności pracy na Macu,
podnosząc przede wszystkim
na uciążliwy sposób nawigacji, jaki zaproponowali twórcy
VoiceOver. Mam tu na myśli
wchodzenie w interakcję
z poszczególnymi elementami
interfejsu użytkownika. Sporo
do życzenia pozostawia też
zaawansowana obsługa brajla
oraz personalizacja aplikacji.
Na zakończenie
NVDA nadąża za rozwojem internetowych aplikacji działających
w przeglądarce, takich jak Facebook
Tyle wstępu, zarysu stanu
obecnego i prognoz. W publikowanych w tym numerze artykułach przyglądamy się JAWS’owi,
Window-Eyes, NVDA, tak by
czytelnik zyskał pełniejszy obraz
dostępnych na rynku rozwiązań.
NR 1 (22) 2014
28
Patryk Faliszewski
Syntezatory
mowy.
Ich rozwój i stan obecny
Prace nad sposobami zamiany tekstu na mowę rozpoczęły
się już mniej więcej w latach trzydziestych ubiegłego wieku,
a może nawet (do zastosowań militarnych) trochę wcześniej.
Duże zasługi w tej kwestii miało opracowanie efektu „Voice
coder”, dziś wykorzystywanego z powodzeniem pod nazwą
„Vocoder” w muzyce.
wadą była niewątpliwie cena,
która nawet dla obywateli tzw.
Zachodu nie należała do najniższych. Sprzętowe silniki syntezy
mowy nadal mają rzesze swoich
zwolenników, zarówno w Polsce,
jak i na świecie.
Wielkie, toporne mechanicznie sterowane maszyny nie były
jednak przygotowywane z myślą
o osobach z niepełnosprawnością narządu wzroku. Wieści
o rozwoju tej technologii ucichły
gdzieś do lat 80-tych, kiedy
to na angielskim rynku pojawiły
się wielkie pudełka z dobrze
niektórym znanym portem
RS-232 (COM), takie jak ACCENT
SA, Artic 215, Speak Out, Echo
W Polsce największym powodzeniem cieszyły się dwa
sprzętowe syntezatory: Apollo
(w wersji I oraz II), a następnie
stosunkowo tani syntezator
SMP (syntezator mowy polskiej),
opracowany przez Konrada
Łukaszewicza. Zanim jednak
te dwie, niewielkich rozmiarów
skrzyneczki zdążyły zawojować
nasz rynek, czasy systemu DOS
przyniosły nam jeszcze jedną
audapter czy nieco później
Apollo.
Syntezatory te były zamkniętymi rozwiązaniami tworzonymi
z myślą o osobach niewidomych
i różniły się między sobą praktycznie wszystkim, od gamy
obsługiwanych screenreaderów i dostępnych sterowników, po możliwości w kwestii
rozszerzalności kości pamięci
czy wyboru języka. Ich główną
Czego używali Polacy?
29
ciekawą syntezę, połączoną
z programem odczytu ekranu.
Był to Readboard, później zwany
Speakiem.
Jego silnik, oparty na fonemach Jana Grębeckiego, był
zawsze programowy, aby móc
z niego korzystać należało podłączyć do komputera specjalne
urządzenie, tzw. Covoxa, który
był de facto cyfrowo-analogowym przetwornikiem dźwięku –
swego rodzaju kartą muzyczną.
Syntezatory Apollo obsługiwane były przez program Hal,
jak również Syntech Wojciecha
Cagary, który udźwiękawiał programy QR-Text oraz FoltynCommander. Istniała także specjalna
wersja ReadBoard’a, współpracująca z Apollem. Syntezatory
SMP oraz Readboard obsługiwane były przez DOS-owe czytniki ekranu: SCR autorstwa E.C.E
obsługiwał SMP, a Readboard
obsługiwał syntezę o tej samej
nazwie, jak również pozwalał
na pracę z wyżej wymienionym
QR-Textem i FoltynCommanderem. Sterownik obsługi SMP
bądź Kajetka, w którym później
umieszczono moduł syntezy
SMP do dziś jest dostępny
w programie Window-Eyes. Nie
zapominajmy jeszcze o Kubusiu,
produkowanym i sprzedawanym przez poznańską firmę
Harpo. Ten syntezator powstał
na bazie projektów tworzonych
w PAN i nigdy nie zdobył masowej popularności, a w tamtym
czasie mówił po polsku bardzo
wyraźnie i z dobrą intonacją.
Produkowany był mniej więcej
do końca lat 90-tych, a potem
jeszcze przez kilka lat gościł
w polskich urządzeniach lektorskich o nazwie Auto-Lektor.
Z Kubusiem współpracowały
programy Hal oraz Syntech.
Windowsa też trzeba
udźwiękowić. Zachód ma
swoje VIA Voice, my SynTalka
i ReadBoarda.
Mniej więcej pod koniec lat
90-tych, między Windows 95
a 98 stopniowo zaczęły pojawiać się syntezy, które jako
wyjście wykorzystywały kartę
dźwiękową. W międzyczasie
na Zachodzie pojawiają się
syntezatory w formie urządzeń
peryferyjnych na PCI, jak DECtalk czy Trippletalk, znany być
może z notatników Braille Lite.
Firma Neurosoft zajmująca
się bardzo wszechstronnie
informatyką i dostarczaniem różnego typu rozwiązań
od obsługi bibliotek po moduły
sygnalizacji świetlnej, napisała
w latach 90-tych prosty, niepozorny moduł syntezy SynTalk,
którego późniejsze wersje uzyskają zgodność z wbudowanym
w Windows interfejsem SAPI 4
(Speech Application Programming Interface v 4.0)
Mniej więcej równolegle Altix
wydaje RBWIN - ReadBoard
for Windows - dobrze znany
z DOS’a syntezator, również
w wersji SAPI 4.
Odnotuję jeszcze, że w produktach firmy Dolphin, takich
jak Hal dla Windows, zagościł
programowy Orpheus – bardzo
szybko działający, programowy
odpowiednik znanego już wcześniej sprzętowego syntezatora
Apollo.
Cechy wspólne syntezatorów
tworzonych w tym czasie – nie-
Duże zasługi w kwestii syntezy mowy miało opracowanie efektu "Voice coder", dziś z powodzeniem wykorzystywanego pod nazwą "Vocoder" w muzyce
NR 1 (22) 2014
30
dla syntezatorów Ivona –
dzieje się „w dżejmi bębenkowej ucha”.
• wysoka szybkość odpowiedzi –
bardzo krótki czas, po jakim
od naciśnięcia klawisza usłyszymy wypowiadany przez
syntezę tekst.
Syntezatory te nadal mogą
poszczycić się ogromną rzeszą
użytkowników, pomimo problemów, jakie im sprawiają.
Syntezator może jednak
ładnie mówić. Nadchodzi
RealSpeak i w Polsce Agata
Czasy systemu DOS przyniosły ciekawą syntezę, połączoną
z programem odczytu ekranu o nazwie Readboard, później
zwanym Speakiem
zależnie od tego, jaką metodą
były opracowywane to przede
wszystkim:
• szybkie działanie – regulacja
szybkości tego typu syntezatorów wahała się średnio
od około 50 do 500 słów
na minutę,
• monotonia – syntezatory tego
typu używały jednego tonu,
bądź prostego, sztucznego
mechanizmu intonacji dla
charakterystycznych części
zdania jak zapytanie czy
wykrzyknienie,
• wysoka zrozumiałość dla
doświadczonych uszu – o ile
syntezatory takie używały
niskiej prędkości próbkowania (11025 Hz w syntezatorze ReadBoard) lub wyższej
(22050 Hz SynTalk czy 16000
Hz w nieco później stwo-
rzonym syntezatorze spiker
autorstwa IVO Software)
zasada ich działania powodowała czasem hiperpoprawną
artykulację wszystkich fonemów. Kluczem do sukcesu
było zatem osłuchanie się
z daną syntezą i określenie
wygodnej szybkości. Niejednokrotnie syntezatory takie
charakteryzowały się także
brakiem słowników dostarczanych na starcie. W skrócie
znaczy to mniej więcej tyle,
że tekst „Jaws - J A W S” nie
był czytany jako „Dżołs”,
a „Microsoft” nie będzie
„Majkrosoftem”. W dzisiejszych czasach dochodzi
na tym polu do skrajności
i oto np. wszystko, co dotąd
działo się w „jamie bębenkowej ucha” dziś – przynajmniej
Około 2001 roku powstały
na podwalinach firmy Lernout
& Hauspie (później ScanSoft)
projekt ukazał światu serię głosów Realspeak Telecom. Od roku
2003 dołączane były one
do cieszącego się wówczas złą
sławą czytnika ekranu z funkcją
powiększenia – Dual.
Głos pracował w standardzie SAPI 4 i pomimo całej serii
błędów programistycznych
cechował się wyraźną intonacją,
brakiem regulacji wysokości
i dość wolną szybkością odpowiedzi na wciskane klawisze
i wydawane przez screenreader
polecenia.
Plusem tego silnika syntezy była wysoka zrozumiałość
pomimo tylko 8000 Hz próbkowania. Popularna Agata,
bo o niej mowa, ewoluowała
następnie do wersji 8 kHz i 11
kHz, pracujących pod kontrolą
zawartego w Windowsie ME
i XP interfejsu SAPI 5. Obydwie te wersje były dołączane
do ówczesnych instalatorów
czytnika ekranu Window-Eyes
w polskiej lokalizacji języko-
31
Pod koniec lat 90-tych, między Windows 95 a 98 stopniowo zaczęły pojawiać się syntezy, które
jako wyjście wykorzystywały kartę dźwiękową
wej już pod nazwą „Scansoft
Agata”.
Oczywiście RealSpeak to cała
seria głosów - nie jedynie polska
Agata.Za wyjątkiem paru głosów - na przykład: Jane (Angielski UK) i Jennifer (angielski US),
wszystkie zostały opublikowane
około 2003 roku w jakości Full
– 22 kHz i z obsługą interfejsu
SAPI 5.
Wersje Full całego pakietu
RealSpeak były i są bardzo
popularne, gdyż powszechnie
dołączano je do niemal każdej
wersji wszystkich komercyjnych
czytników ekranu.
Syntezator Ivona
Niewiele później – około roku
2005 firma IVO software po bardzo dobrym, ale nie bardzo
skutecznie wypromowanym,
syntezatorze Spiker rozpoczyna
sprzedaż Jacka - syntezatora,
który rozbrzmiewał zarówno
w filmikach, gdzie zamawia
pizzę, plikach MP3, gdzie podaje
atuty powszechnie znanej
w Internecie „Twojej Starej”,
jak i na niejednym komputerze
osoby niewidomej.
Syntezator parametrami
mowy był porównywalny
z Agatą firmy Scansoft, choć
używał próbkowania 16 kHz,
co w standardzie SAPI 5 z czytnikiem JAWS powodowało
problemy.
Dziś IVONA to nie tylko głos
Jacek, a jeszcze 4 inne polskie
głosy oraz kilkadziesiąt wariantów w innych językach. Ceny
głosów spadły z 600 złotych za
pakiet rehabilitacyjny, do kilkudziesięciu złotych za szybki,
dosyć responsywny głos wysokiej jakości 22 kHz. Obniżkę
tę dało się jednak zauważyć
jedynie wczytując się w materiały prasowe producenta – była
bowiem wprowadzona bez
informacyjnego szału czy agresywnej reklamy. Na tę ofertę
szybko – bo już po paru miesiącach od wprowadzenia tanich,
dobrych syntezatorów IVONA
odpowiedziała firma E.C.E, która
obniżyła cenę programowej
wersji SMP z 530 do 99 zł.
Krok ten jednak pociągnął
za sobą brak dalszego rozwoju
programowego SMP, w przeciwieństwie do syntezatorów
IVONA, które nadal (może nie
tak prężnie), się rozwijają.
Głosy Loquendo
2007 rok przynosi prace nad
polskimi głosami, mającymi
zrewolucjonizować postrzeganie syntezowanego dźwięku.
NR 1 (22) 2014
32
na ludzko brzmiące głosy. Z żadnym tego typu głosem sztuka
ta nie udała się w systemie
Windows.
Mam Window-Eyes, JAWS-a,
NVDA. Czy naprawdę muszę
instalować syntezy SAPI?
Dziś IVONA to nie tylko głos Jacek, a jeszcze 4 inne polskie
głosy oraz kilkadziesiąt wariantów w innych językach
Dokonuje tego włoska firma
Loquendo, znana już od paru lat
na Zachodzie.
Głosy Loquendo obsługują
specyficzne, oparte jakby
na XML’u tagi sterujące, reprezentujące emocje takie jak
smutek, radość czy wręcz płacz.
Niestety większość czytników
ekranu filtruje znaki takie jak
<” >”\\, więc używanie tych
tagów w praktyce nie odniosło
sukcesu.
Głosy Loquendo używały częstotliwości próbkowania 44100
Hz i kodeka Speeks, który tak
naprawdę gwarantuje 32000 Hz.
Mam MAC OSX. Co dla mnie?
Do wersji systemu MAC OSX
Snow Leopard polscy użytkownicy borykali się z podstawo-
wym problemem jakim jest brak
zaimplementowanej na starcie,
polskojęzycznej syntezy. Jak
wiemy, API syntezatorów Apple
nie jest otwarte, więc tylko
licencjonowane syntezatory
mogą pracować pod kontrolą
systemu z Cuppertino.
O ile posiadacze nowszych
wersji systemu mają do dyspozycji głosy Nuance Vocalizer
bądź Vocalizer Expressive, alternatywą dla Amerykańskiego
Alexa był Infovox czyli znana
z Windowsa Ania firmy Acapela, a więc kolejny, tym razem
kosztujący 99 euro głos, prezentujący emocje ludzkie. W obliczu czytania polskich tekstów
angielską syntezą, warto było
go kupić, tym bardziej, że działa
wyjątkowo responsywnie jak
Dzisiejszy trend wskazuje
na dołączanie syntezatorów
do każdego screenreadera
natywnie. I tak:
• do NVDA na starcie dołączany
jest darmowy i otwarty
syntezator Espeak. Możemy
jednak dokupić sobie dostęp
do głosów Vocalizer Expressive, a wcześniej starej dobrej
serii Vocalizer TTS 5.5.
NVDA ze względu na swój
otwarty kod źródłowy daje
ogromne możliwości tworzenia własnych syntezatorów,
bądź portowania znanych
z Linuxa czy standardu SAPI
silników, o ile mamy dostęp
do komunikacyjnego API
syntezatora.
Otwiera to też furtkę do tworzenia sterowników do syntezatorów sprzętowych. Warunkiem jest przedarcie się przez
meandry nie do końca estetycznie napisanej i niekiedy
rozrzuconej dokumentacji
deweloperskiej.
• Window-Eyes wyposaża się
w Microsoft Speech Platform
- głos polski Paulina, Espeak’a oraz w płatnej wersji
w SMP (wersję modułu używaną w SMP SAPI).
Głosy Vocalizer też
są dostępne, jednak tylko
dwa w dwóch różnych językach są zawarte w cenie
pakietu WE, a każdy
33
następny wymaga dopłaty.
Window-Eyes for Office nie
jest dostarczany z biblioteką
SMP.
• Jaws wyposaża ludzi w darmowy dostęp do Vocalizer
TTS, a od najnowszej wersji
także Vocalizer Expressive
oraz syntezy Realspeak Solo
Direct. Dla języków zachodnich do dyspozycji mamy
Eloquence.
Sapi 4 a SAPI 5
Główną różnicą między tymi
standardami jest zestaw
komend, czyli tzw. tagów sterujących syntezatorem. SAPI 5
ma ściśle ustalony zakres tagu
<volume level=> 0 do 100. Dodanie do tego tagu parametru ABS
ustawia go na tę bezwzględną
wartość, np. 7. Gdy parametr
ABS nie zostanie określony, war-
tość zwiększana jest o podaną
liczbę.
Standard SAPI 4 natomiast
zaleca, by odpowiadający za
to samo tag: \vol=cyfra mieścił
się w granicach od 1 do 100. Nie
przeszkadza to jednak programistom ustawiać jego maksymalny zakres na maksymalną
16-bitową wartość INT, to jest
65535 licząc od zera.
Tag szybkości w SAPI 5 przyjmuje wartości identyczne jak
wysokość - od -10 do 10. W SAPI
4 jest to albo od 0 do 100,
albo od 1 do 100, albo liczba
słów na minutę – np. od 40
do 700. Najczęściej występują
trzy szkoły – 0 do 100, liczba
7-bitowa – 0 do 127 lub orientacyjna liczba słów na minutę.
Co się tyczy wysokości,
to SAPI 4 rekomenduje używanie 0 - 100. Praktyka pokazuje
jednak, że może to być również
1 do 9, 1 do 100, 0 do 100 czy
częstotliwość środkowa, nie
uwzględniająca algorytmu intonacji podana w Hz, np. 70 do 600.
Krótkie porady i uwagi
dotyczące standardów SAPI
Na koniec, postaram się odpowiedzieć na kilka pytań i rozterek dotyczących syntezy,
z jakimi bardzo często spotykałem się ze strony użytkowników.
1. Mam stare głosy IVONA czy
RealSpeak, dedykowane dla
starszych wersji Window-Eyes, pod JAWS-em działają
mi dziwnie.
Jest to spowodowane faktem,
że JAWS jako domyślnej prędkości próbkowania używa
22 kHz. Gdy syntezator
używa np. 11 kHz, jego audio
zostanie przepróbkowane
Do wersji systemu MAC OSX Snow Leopard, polscy użytkownicy borykali się z podstawowym
problemem, jakim jest brak zaimplementowanej na starcie polskojęzycznej syntezy
NR 1 (22) 2014
34
ReadBoard zadziała? Jakoś go
nie widzę?
Niestety. Z uwagi na prężnie
rozwijający się rynek naturalnie mówiących syntezatorów
dostarczanych z czytnikiem
ekranu (ang. direct), deweloperzy JAWS nie robią i nie
zrobią nic w kierunku przywrócenia obsługi standardu
SAPI 4 w JAWS 64-bit, uznając tym samym tę technologię za przestarzałą.
3. Dlaczego, mając 64-bitowy
system, nie widzę Espeaka
w Panelu sterowania?
Aplet Panelu sterowania
„Tekst na mowę”: %windir%\
syswow64\speech.cpl zmienia głos tylko dla aplikacji
64-bitowych, pracujących
w 64-bitowym środowisku.
Jedynym polskim głosem,
obsługującym tę metodę
ustawienia jest IVONA.
Alternatywnie możemy spróbować zmienić silnik syntezy
SAPI 5 dla aplikacji uruchamianych 32-bitowo. W tym
celu szukamy pliku
C:\Windows\System32\
Speech\SpeechUX\sapi.cpl.
Nie umiem dokładnie określić, co przesądza o powodzeniu bądź porażce tego
ustawienia, lecz na paru
komputerach spotkałem się
z sytuacją, gdzie nie odnosi
ono efektu, nawet w aplikacjach 32-bitowych.
Na zakończenie
W niniejszym tekście starałem
się przedstawić zarówno historyczne, jak i obecnie używane
syntezatory mowy polskiej oraz
ich krótką charakterystykę.
Oczywiście, omówione zostały
tu syntezatory, które miały znaczący wkład w rozwój rodzimej
tyfloinformatyki. Tak naprawdę
konstrukcji generujących polską
mowę było znacznie, znacznie
więcej. Obecne możliwości
pozwalają tak naprawdę każdemu, kto posiada zdolności
programistyczne, umiejętności
pracy z małymi fragmentami
ludzkiej mowy oraz do tego
anielską cierpliwość, stworzyć
własny głos syntetyczny. Ciężko
także stwierdzić, gdzie zagna
nas technologiczny postęp.
Wszystko wskazuje na to,
że obecnie prym wiodą głosy
maksymalnie zbliżone do ludzkiego. Jednakże, szczególnie
wśród bardziej doświadczonych
użytkowników, istnieje nadal
sentyment do cyfrowych kosmitów, czyli brzmiących bardzo
mechanicznie syntez. Miejmy
nadzieję, że w tej materii nigdy
nie stracimy wyboru, a każdy
będzie mógł pracować z taką
syntezą, jaka będzie dla niego
najwygodniejsza.
fot. Shutterstock.com, IBM, Anake Seenadee, IVONA Software, Apple
sztucznie do 22 kHz, powodując niemiłe dla ucha kliki
czy przydźwięki. Aby zmienić
jakość dźwięku odtwarzanego przez syntezę, należy
znaleźć jej CLSID w rejestrze.
Identyfikatorów należy szukać w:
My Computer\HKEY_LOCAL_
MACHINE\SOFTWARE\
Microsoft\Speech\Voices\
Tokens.
CLSID zawarte w nawiasach
klamrowych należy obwarować w pliku SAPI5x.ini,
znajdującym się w katalogu
plików programu JAWS,
nawiasami kwadratowymi.
Następnie sekwencja definiująca szybkość próbkowania
output =cyfra od 4 do 38.
Przykładowy wpis dla syntezatora używającego 16 kHz,
16 bit Mono:
[{5E90E67A-D7B6-4c80-B0699E932625F489}]
Output=18
2. Mam Jaws 11 lub wyżej
na systemie 64-bitowym. Czy
mój ulubiony SynTalk bądź
35
Michał Molek
Michał Molek
Window-Eyes.
– kilka słów o historii
i działaniu programu
Zostałem poproszony o napisanie tekstu
o Window-Eyes. Jako zaawansowany
użytkownik tego programu, zdaję sobie sprawę,
że jego kompleksowe omówienie nie zmieści
się w tym artykule. Zatem zapraszam na krótki
przegląd tych cech programu, które uważam
za najważniejsze w codziennym korzystaniu
z komputera.
Co to jest Window-Eyes?
Window-Eyes jest zaawansowanym oprogramowaniem dla Windows, służącym do czytania
zawartości ekranu przez niewidzącego użytkownika. Jego producent to amerykańska firma GW
Micro, która od 1990 roku wprowadza na rynek
technologie wspierające osoby niepełnosprawne.
Window-Eyes wszedł do sprzedaży, początkowo w wersji angielskiej, w roku 1995. Stał się
on następcą programu Vocal-Eyes dla systemu
DOS. Pod koniec lat dziewięćdziesiątych ubiegłego
stulecia firma E.C.E. wprowadziła go na polski
rynek.
Obecnie Window-Eyes jest dostępny po: angielsku, arabsku, belgijsku, brytyjsku, czesku, francusku, hebrajsku, hiszpańsku, holendersku, koreańsku, niemiecku, norwesku, polsku, szwedzku,
turecku i włosku. Zapewne polskiego użytkownika bardziej niż mnogość języków może mocno
ucieszyć fakt, że spolszczenie Window-Eyes jest
przygotowywane z dużą starannością. Poszczególne polskie wersje produktu trafiają do sprzedaży niedługo po ukazaniu się wersji angielskiej,
a prace nad tłumaczeniem prowadzone są już
od testowych (tzw. beta) wersji. Ponadto opracowano dodatek „Poprawki Polskiej Wymowy”,
który eliminuje wiele błędów syntezatorów mowy
i umożliwia czytanie liczb słowami.
Udostępnienie osobie z dysfunkcją wzroku
systemu operacyjnego Windows to bardzo zło-
NR 1 (22) 2014
36
Programiści większość czasu swojej pracy
poświęcają na starania, aby pisane przez nich
czytniki ekranu były kompatybilne z najnowszymi wersjami systemów operacyjnych i najpopularniejszych programów użytkowych
żony proces. Należy pozyskać informację z ekranu,
a następnie przekazać ją użytkownikowi w możliwie najbardziej przystępnej formie. Window-Eyes
monitoruje więc pracę komputera na kilka różnych
sposobów. Przede wszystkim śledzi różne zdarzenia w systemie, które zachodzą na skutek aktywności zarówno użytkownika, jak i samego oprogramowania. Dzięki temu mogą być wypowiadane
klawisze wciskane na klawiaturze, informacje
spod kursora myszki, a uaktywnianie się okien
i zmiana punktu uwagi może być sygnalizowana
użytkownikowi. W następnej kolejności można
pozyskać informacje o typie, nazwie i danych
pola dla poszczególnych kontrolek. Okazuje się,
że to nie jest wystarczające w przypadku aplikacji o niestandardowych lub źle wykonanych
interfejsach.
Programiści GW Micro zaimplementowali
w Window-Eyes mechanizm udający dodatkową
kartę graficzną. Niestety to rozwiązanie wymaga
instalacji sterowników video przed jego użyciem,
co wiąże się z koniecznością posiadania uprawnień do takiej instalacji w systemie. Jednak dzięki
dodatkowym sterownikom grafiki, Window-Eyes
może określić miejsce na ekranie, w którym dany
tekst lub ikona są wyświetlane. Daje to możliwość
czytania ekranu przy pomocy wskaźnika myszy,
ograniczanie odczytywanych informacji do danego
obszaru oraz etykietowanie nieopisanych grafik.
Informacje odczytane z ekranu Window-Eyes przekazuje użytkownikowi przy pomocy
mowy syntetycznej i tekstu na monitorze brajlowskim. Istnieje szereg mechanizmów, które
służą do monitorowania pracy komputera przy
pomocy omawianego czytnika ekranu. Najlepszym odzwierciedleniem możliwości Window-Eyes
jest kolekcja gorących klawiszy. Jeśli potrzeba
coś przeczytać, to najprawdopodobniej można
to będzie zrobić przy pomocy jednego lub kilku
gorących klawiszy. Zapoznanie się z ich listą może
być dobrym sposobem na poznanie możliwości
tego programu.
Czytnik ekranu Window-Eyes nie starzeje się
i stale jest rozwijany. Większość funkcji programu
od początku została zaprojektowana i zaimplementowana w taki sposób, że w dzisiejszych
czasach sprawdza się i działa tak samo dobrze,
jak dawniej. W przypadku, gdy zmiany w nowych
wersjach systemu operacyjnego i innego oprogramowania użytkowego nie pozwalają na prawidłowe działanie starszych wersji Window-Eyes,
wówczas firma GW Micro w miarę możliwości
uzupełnia te braki. Producent na bieżąco implementuje wsparcie dla nowych wersji systemu operacyjnego Windows oraz pakietu biurowego MS
Office. Window-Eyes z powodzeniem obsługuje
systemy 64-bitowe, a także nowoczesne interfejsy
użytkownika, takie jak tzw. wstążki czy metro.
Ponadto wprowadzono mechanizmy dostępności
dla UIA, Javy i Qt. Dzięki temu możliwe stało się
m.in. rozpoczęcie wsparcia przez Window-Eyes
programów Writer i Calc z pakietów biurowych
LibreOffice i OpenOffice oraz innych programów
opartych na wymienionych technologiach.
Kolejnym aspektem rozwoju omawianego
czytnika ekranu jest unowocześnianie obsługi
oraz interfejsu użytkownika samego Window-Eyes. Ustawienia programu użytkownik może
modyfikować w przejrzystym panelu kontrolnym.
W starszych wersjach wszystkie ustawienia były
ukryte w elementach paska menu. Pewien czas
temu dokonano przebudowy tego interfejsu
i obecnie główne okno Window-Eyes składa się
z kontrolki widoku drzewa, która grupuje kategorie ustawień i obszaru roboczego do wprowadzania zmian. Ponadto rozbudowano tzw. globalne ustawienia. Dzięki czemu znacznie wzrosła
efektywność modyfikowania ustawień, które
37
są aktywne w wielu zbiorach jednocześnie, bez
ryzyka przypadkowego dokonania niepożądanych
zmian. Jedną z najbardziej znaczących nowości
ostatnich lat stało się wprowadzenie w Window-Eyes mechanizmu dodatków, które udostępniają
nieograniczone możliwości poszerzania się funkcjonalności tego czytnika ekranu.
Następnym ważnym narzędziem jest wbudowany w Window-Eyes moduł pomocy zdalnej.
Z uwagi na swój charakter prawdopodobnie jest
to funkcja dość rzadko używana, lecz trudna
do przecenienia w potrzebie.
Moje wrażenia
Po raz pierwszy z Window-Eyes zetknąłem się
jako początkujący użytkownik systemu operacyjnego Windows. Od samego początku przypadł
mi do gustu jego przejrzysty interfejs. W MS Dos
używałem oprogramowania polskiej produkcji
o nazwie SCR. Istnieje wiele różnic w obsłudze
interfejsów tych dwóch technologii asystujących,
wynikających ze specyfiki systemów operacyjnych, pod którymi działają. Różnią się one również
stopniem zaawansowania. Mimo to z dużym zapałem odkrywałem kolejne analogie w idei działania
tych narzędzi.
Window-Eyes oferuje szeroką gamę mechanizmów, które ułatwiają bezwzrokową obsługę
komputera. Są one w stanie zaspokoić potrzeby
podczas pracy biurowej, a także przy bardziej
wyspecjalizowanych zadaniach np. obsłudze
środowisk programistycznych lub programów multimedialnych. Użytkownik ma do dyspozycji takie
przydatne mechanizmy jak:
• ponad 330 łatwo konfigurowalnych, gorących klawiszy (w tym m.in. do obsługi: trybu
przeglądania, pakietu MS Office i monitora
brajlowskiego);
• 46 klawiszy akcji;
• 76 okien użytkownika (w tym 26
hiperaktywnych);
• ergonomiczną emulację wskaźnika myszy oraz
dodatkowy wirtualny kursor Window-Eyes;
• słowniki: znaków, wyjątków, obrazków, etykiet
klawiszy, a nawet kolorów;
• zbiory ustawień, które można skojarzyć
z danym programem użytkowym lub ładować
dynamicznie (np. przy użyciu okien hiperaktywnych lub klawiszy akcji), a także profile użytkownika dla przechowywania całych kolekcji
zbiorów ustawień.
Ponadto istnieje bardzo duża liczba ustawień,
które określają:
• sposób odczytu tekstu i poszczególnych
znaków (w tym interpunkcji) oraz atrybutów
czcionki;
• parametry mowy oraz kolejność i szczegółowość (tzw. gadatliwość) podczas odczytu
poszczególnych informacji;
• wiele innych zaawansowanych parametrów
działania programu, które trudno omówić
w kilku słowach.
Window-Eyes jest najtańszym czytnikiem
ekranu w klasie komercyjnych produktów tego
typu. Na takiej właśnie strategii firma GW-Micro
oparła sukces swojego produktu. Klient otrzymuje
w rozsądnej cenie pełne wsparcie techniczne,
dostosowane do wymagań danej wersji językowej
na lokalnym rynku. Window-Eyes jest najtańszym
rozwiązaniem, które dostarcza profesjonalne
tablice dla polskiego tzw. brajla komputerowego.
Program posiada blisko 30 sterowników dla
syntezatorów mowy i wspiera prawie 70 typów
monitorów brajlowskich. W systemach 64-bito-
Window-Eyes występuje już w 20 wersjach
językowych
NR 1 (22) 2014
38
wych są obsługiwane syntezatory mowy zarówno
32-bitowe, jak i 64-bitowe. Zatem jest kompatybilny ze znacznym procentem syntezatorów dla
języka polskiego. Ponadto wspiera bezpośrednie
sterowanie dla takich programowych syntezatorów jak: SMP, eSpeak, RealSpeak, czy Vocalizer
i Vocalizer Expressive. W przypadku linijek brajlowskich z zasady nie istnieją problemy, nie tylko
z wyświetlaniem na nich tekstów, ale również
działaniem klawiszy sterujących, umieszczonych
na obudowach tych urządzeń. Zatem w szczególności można zwykle bez problemów wykorzystać
wszystkie zalety klawiatur brajlowskich, które
często są integralną częścią mobilnych monitorów
brajlowskich.
Window-Eyes wyróżnia się możliwością
dokonywania elastycznej konfiguracji ustawień
w przyjaznym interfejsie użytkownika. Nawet tak
zaawansowane mechanizmy, jakimi są hiperaktywne okna użytkownika, nie wymagają pisania
żadnych skryptów ani dodatkowych aplikacji,
a ustawień wszystkich potrzebnych parametrów
można dokonać w standardowych kontrolkach.
Począwszy od wersji 7.0 omawiany czytnik
ekranu wspiera dodatki (początkowo zwane
skryptami). Olbrzymie możliwości tego narzędzia
wynikają z faktu, że dodatki Window-Eyes mogą
być pisane w dowolnym języku programowania, wspierającym standard COM, który pozwala
na bezpośrednią komunikację tych aplikacji z czytnikiem ekranu.
Licencjonowanie
Window-Eyes posiada bardzo wygodną formę
licencjonowania. Obecnie po zakupie jednej
licencji programu otrzymuje się 5 kluczy aktywacyjnych, które można zarówno pobierać na lokalny
komputer, jak i zwracać na serwer. Poza tym,
z początkiem roku 2014 dzięki współpracy GW
Micro i Microsoft została udostępniona wszystkim
użytkownikom MS Office 2010 lub nowszego bezpłatna wersja czytnika ekranu w ramach oferty
„Window-Eyes For Office”.
Window-Eyes a system Windows
Jedną z najważniejszych zalet Window-Eyes jest
bardzo dobrze zaprojektowana ergonomia działania tego programu. Ingerencja czytnika ekranu
w pracę z aplikacją użytkową jest ograniczona
do minimum. Użytkownik w sposób naturalny
obsługuje aktywny program, a Window-Eyes śledzi pracę komputera i w dyskretny sposób stara
się zrekompensować brak wzrokowej kontroli
nad wykonywanym zadaniem. W praktyce bardzo
rzadko pojawia się konieczność otwierania i uaktywniania któregoś z okien programu Window-Eyes. Komunikacja z czytnikiem ekranu odbywa
się przede wszystkim w oparciu o tzw. gorące
klawisze. Dzięki dobrze przygotowanym układom
klawiatury, nauka skrótów klawiaturowych jest
bardzo łatwa.
Gorące klawisze Window-Eyes służą m.in.
do emulacji działania myszki przy pomocy klawiatury. Aby dobrze zobrazować ruch wskaźnika
w przestrzeni ekranu, w domyślnym układzie
klawiatury skróty klawiaturowe do obsługi myszy
zdefiniowano na tzw. klawiaturze numerycznej.
Rozwiązanie to jest bardzo pozytywnie odbierane
przez wielu użytkowników.
Praca zdalna i środowisko sieciowe
Screenreader w zamyśle ma umożliwić niewidomemu użytkownikowi odbiór informacji
graficznych, np. tych, na które natrafia kursor
myszy
Wspominając o zaletach omawianego czytnika
ekranu, warto wymienić również funkcje zaawansowane, które mogą przydać się podczas wykonywania pracy na odległość lub w szkolnych
i firmowych pracowniach komputerowych. Pierwszą z nich jest wbudowane wsparcie dla pulpitu
zdalnego, drugą – możliwość instalacji w środowisku sieciowym, gdzie Window-Eyes umieszczony
39
Udostępnienie osobie z dysfunkcją wzroku systemu operacyjnego Windows to bardzo złożony proces
na maszynie klienta korzysta z ustawień przechowywanych na serwerze.
Problemy
fot. Shutterstock.com, Apple, Jobin
Mimo że Window-Eyes to bardzo zaawansowane
oprogramowanie, to jednak wciąż istnieją problemy, których nie rozwiązuje. Producenci czytników ekranu mierzą się z nieustającym wyzwaniem
pogoni za rozwojem technologii. Programiści
większość czasu swojej pracy poświęcają na starania, aby pisane przez nich czytniki ekranu były
kompatybilne z najnowszymi wersjami systemów
operacyjnych i najpopularniejszych programów
użytkowych. Niestety nie starcza już czasu, aby
opracować wyspecjalizowane narzędzia, np.
do pracy z zapisem matematycznym, z użyciem
takich rozwiązań jak MathML.
i nowości, zawartych w upgrade’ach na przestrzeni kilkunastu ostatnich lat, wzbudziło moje
zainteresowanie i już kilkukrotnie zmotywowało
do podjęcia starań, aby zaktualizować wersję
programu.
Pomimo dużych możliwości Window-Eyes
są sytuacje, w których lepiej sprawdzają się inne
rozwiązania. Przykładowo, gdy zaistnieje konieczność uzyskania podstawowej kontroli nad systemem, ale bez konieczności instalacji dodatkowej
technologii asystującej lub wymaganych przez nią
sterowników, to dobrze sprawdza się w tej sytuacji użycie czytnika ekranu NVDA.
Podsumowanie
Dla mnie osobiście program Window-Eyes to optymalna oferta wśród obecnie dostępnych na rynku
czytników ekranu. Spełnia on dużą liczbę wymagań zaawansowanego użytkownika komputera
wobec technologii asystującej dla osób z dysfunkcją wzroku. Choć nie jest to narzędzie darmowe,
to jednak najtańsze w swojej klasie. Wiele zmian
NR 1 (22) 2014
40
Michał Dziwisz
Quo vadis,
Window-Eyes?
W niniejszym numerze Tyfloświata, Michał Molek opisuje program odczytu ekranu WindowEyes, autorstwa amerykańskiej firmy GW Micro. Sam opis, przedstawiony przez mojego
szanownego kolegę po piórze, jest dobrą charakterystyką tego narzędzia, jednakże autor
niestety nie zwrócił uwagi na kilka istotnych elementów, o których powiedzieć trzeba, a które
być może ze względu na wieloletnią pracę Michała z Window-Eyes zwyczajnie mu umknęły,
bądź też mają dla niego marginalne znaczenie.
Chciałbym na samym wstępie wyjaśnić jedną,
bardzo istotną rzecz. Z Window-Eyes pracowałem
od mniej więcej 2001 do 2012 roku. Wiele razy
broniłem tego czytnika ekranu przed różnymi,
niegdyś w moim mniemaniu krzywdzącymi opiniami na jego temat. Obecnie, mimo posiadania
zainstalowanego na komputerze pakietu Office,
coraz rzadziej mam ochotę na wciśnięcie kombinacji prawego ALT ‘a i litery w, która, tu informacja
dla niewtajemniczonych, jest gorącym klawiszem,
uruchamiającym domyślnie zainstalowaną kopię
Window-Eyes.
Na początek łyżka miodu
Mimo faktu, że od jakiegoś czasu z tym screenreaderem mi zwyczajnie nie po drodze, nie
mogę odmówić projektantom z GW Micro bardzo przemyślanej decyzji, jeśli chodzi o to, co we
wstępnej konfiguracji WE włączyć, co wyłączyć,
a co za tym idzie, z jakim zestawem startowym
spotka się komputerowy nowicjusz lub ktoś, kto
dopiero zainstalował Window-Eyes po np. reinstalacji systemu operacyjnego. Konfiguracja ta jest
moim zdaniem bardzo przemyślana i nie zmusza
nas, aby spędzić kilkanaście lub kilkadziesiąt
41
minut na poprawianiu i dostrajaniu WE do swoich
potrzeb. O ile w przypadku NVDA proces ten jest
również stosunkowo prosty, ale raczej ze względu
na ubogość parametrów tego darmowego czytnika, o tyle pewnie każdy, kto przesiadał się kiedykolwiek z WE na Jawsa przypomni sobie te chwile,
w których ten ostatni czytał znacznie więcej, niż
moglibyśmy sobie życzyć. W efekcie tego, całą
energię pierwszego kontaktu musieliśmy poświęcić nie na poznanie możliwości czytnika, a na to,
aby odnaleźć w gąszczu ustawień to, dzięki czemu
JAWS będzie czytał to, co nam niezbędne.
Kolejnym, bezsprzecznym atutem Window-Eyes
jest emulacja wskaźnika myszki. Fakt, że korzystamy z niej za pomocą klawiatury numerycznej
sprawia, że w jednym czasie mamy dostęp niejako
do 2 kursorów. Są nimi systemowy wskaźnik,
tzw. focus, oraz emulacja tego komputerowego
gryzonia, pozwalająca na radzenie sobie z aplikacjami, które nie są dla nas dostępne z poziomu
klawiatury.
Internet, czyli schody się zaczęły
Czasy, w których komercyjne czytniki ekranu
zaskakiwały nas innowacjami, pomagającymi
niewidomym radzić sobie z komputerową rzeczywistością, mamy, zdaje się, niestety za sobą.
Obecnie, szczególnie w dobie Windows 8, główną
rolą wszystkich, bez wyjątku screenreaderów, jest
nadążenie za technologicznym postępem, a właściwie rewolucją, jaką zafundował nam Microsoft.
Rewolucja to jednak nie tylko nowoczesne kafelki
na ekranie startowym, aplikacje metro czy też
kolejne skróty, pozwalające na pracę z komputerem bez użycia myszy. Rewolucja to również
sposób, w jaki z naszych elektronicznych urządzeń
korzystamy już aktywnie od kilku lat. Window-Eyes swoje pierwsze kroki stawiał w czasach,
kiedy Internet, a właściwie światowa pajęczyna
www, była zbiorem statycznych stron, zwykle
wykonanych w technologii HTML. W momencie,
gdy na początku XXI wieku część webmasterów
zachłystnęła się technologią FLASH, WE, jako
pierwszy, pozwalał na obsługę stron napisanych
z wykorzystaniem tych multimedialnych środków.
Obsługa to być może za duże słowo, bowiem
FLASH nie był nigdy wzorem dostępności, wspar-
Bezsprzecznym atutem Window-Eyes jest emulacja wskaźnika myszki, z której korzystamy
za pomocą klawiatury numerycznej
cie jego więc w dużej mierze polegało na możliwości interakcji użytkownika z wszystkimi,
zamieszczonymi w danej prezentacji guzikami,
w większości pozbawionymi opisów lub też z opisami w zupełnie innym miejscu. Ciężko mówić
tu o wygodzie korzystania, niemniej jednak, była
to jakaś możliwość, dzięki której niewidomy coś
mógł na takiej stronie zrobić. To były czasy, w których WE wyznaczał standardy. Jak jest obecnie?
Na całe szczęście czasy wszędobylskiego FLASHA
mamy już dawno za sobą, teraz króluje HTML 5,
ARIA i Javascript. Jako, że nie chciałbym w tym
momencie zanudzić czytelników opisywaniem
technicznych zawiłości użytych powyżej zaklęć,
nadmienię tylko, że są to nowoczesne środki,
dzięki którym autorzy stron budują współczesne,
dynamiczne witryny WWW, czyli takie, na których
nieustannie coś się dzieje, np. odliczany jest czas
do zakończenia sesji w naszym banku, wyświetla
się informacja, że ktoś właśnie chce z nami porozmawiać na portalu społecznościowym, czy, wreszcie na kilkadziesiąt sekund przed zakończeniem
aukcji internetowej otrzymujemy powiadomienie,
że nasza wymarzona, zabytkowa kolekcja winyli
z lat 70 może przejść nam koło nosa, bo ktoś
właśnie przebił naszą ofertę! Od tego, w jaki sposób program odczytu ekranu radzić sobie będzie
z dynamiczną zawartością stron internetowych,
zależeć będzie nasza efektywność w pracy, życie
towarzyskie (a co, jeśli w tym okienku czatowym
odezwała się jakaś bardzo interesująca osoba?),
NR 1 (22) 2014
42
Obecnie, szczególnie w dobie Windows 8, główną rolą wszystkich, bez wyjątku screenreaderów, jest
nadążenie za technologicznym postępem, a właściwie rewolucją, jaką zafundował nam Microsoft
czy wreszcie realizacja części naszych pasji czy
to wirtualnych, czy jak najbardziej realnych.
Niestety, Window-Eyes z pracą z dynamicznymi
stronami radzi sobie bardzo słabo. O ile w przeglądarce Internet Explorer można mówić o względnie
komfortowym przeglądaniu stron statycznych,
co w większości przypadków z Firefoxem wygląda
jeszcze gorzej, o tyle treści dynamiczne często po prostu nie są uwzględniane. By nie być
gołosłownym, spróbowałem przed momentem
odczytać czas, jaki pozostał do wygaśnięcia sesji
po zalogowaniu się do mojego banku. WE ani
w przeglądarce Microsoftu, ani też w Firefoxie
nie był w stanie udzielić mi takiej informacji. Dla
kontrastu, darmowe NVDA zarówno w jednej, jak
i drugiej przeglądarce poradziło sobie świetnie.
Mechanizm odczytywania stron przez WE,
tzw. tryb przeglądania, nazywany dawniej trybem MSAA to coś, nad czym projektanci tego
czytnika ekranu powinni popracować już dawno.
Wirtualny, statyczny bufor, w którym znajdują się
elementy zebrane przez WE dzięki analizie kodu
strony, to z pewnością nie coś, co pozwoli na komfortową nawigację po współczesnych stronach
www. Częściowym remedium na tego typu kłopoty jest skrypt autorstwa polskiego dystrybutora
Window-Eyes firmy E.C.E, o nazwie ShowHiddenDivs. Skrypt ten, a właściwie dodatek, bo tak
obecnie nazywane są rozszerzenia funkcjonalne
WE, w części przypadków będzie w stanie zaprezentować nam więcej informacji. Niestety, nie
ma róży bez kolców. Kolcami w tym przypadku
są sytuacje, w których to, projektant danej strony
internetowej z rozmysłem ukrył pewne elementy,
bowiem powinny się pojawiać tylko w określonych
przypadkach. Skrypt w takiej sytuacji zachowa
się więc jak słoń w składzie porcelany, prezentując wszelkie komunikaty bez względu na to, czy
43
mają, czy nie mają one w danej sytuacji sensu.
Przykład? Proszę. Może zdarzyć się tak, że czekać nas będzie wypełnienie formularza, który
generuje dynamiczne podpowiedzi, jeśli wprowadzona w konkretne pole wartość jest błędna,
np. zbyt krótkie hasło. Przy włączonym dodatku
ShowHiddenDivs o tym, że hasło jest zbyt krótkie będziemy informowani zawsze, nawet, jeśli
posiada ono prawidłową długość.
Dodatek jest dobry na wszystko?
Od wersji 7, program odczytu ekranu firmy GW
Micro posiada możliwość uruchamiania tzw.
dodatków, wcześniej nazywanych skryptami.
Początki tego mechanizmu były niezbyt fortunne,
bowiem gdy sięgam pamięcią, przypominają mi
się sytuacje, w których anglojęzyczne dodatki
potrafiły wyrzucać błąd na starcie polskiej wersji
WE. Rozwiązanie to przeszło już jednak choroby
wieku dziecięcego i twórcy zdają się mu bardzo
ufać. Ufają do tego stopnia, że już od pewnego
czasu zaobserwować można bardzo niepokojącą
moim zdaniem, rzecz. Jeśli jakiejś funkcji Window-Eyes nie posiada, to zamiast implementować ją do rdzenia, twórcy produkują odpowiedni
dodatek, który realizuje określone zadanie.
Dodatki, to jak sama nazwa wskazuje coś ekstra,
co może usprawnić czy uprzyjemnić nam pracę
z danym programem. Niepokojące jest także i to,
że na starcie otrzymujemy całą masę dodatków,
które ładując się do pamięci operacyjnej spowalniają pracę programu odczytu ekranu. Dodatkowo,
niepokoić może koncepcja, jaką opracowali programiści firmy GW Micro. Otóż, dodatek dla Window-Eyes może być napisany… w czymkolwiek.
To niezwykle elastyczne podejście może odbić się
jednak przysłowiową czkawką na responsywności
czytnika. Języków programowania, czyli zbiorów
rozkazów wydawanych komputerowi w celu wykonania danej operacji jest wiele. Mamy do czynienia z językami tzw. niskiego, jak i wysokiego
poziomu. Języki niskopoziomowe są przeważnie
niezwykle szybkie, ale wymagają od programisty
znacznie większej dyscypliny pracy, zwracania
Window-Eyes z pracą z dynamicznymi stronami radzi sobie bardzo słabo
NR 1 (22) 2014
44
W momencie, gdy na początku XXI wieku część webmasterów zachłystnęła się technologią FLASH,
Window-Eyes, jako pierwszy, pozwalał na podstawwą obsługę stron napisanych z wykorzystaniem
tego multimedialnego środka
uwagi na szczegóły, pominięcie których może
nieść za sobą opłakane skutki. Języki wysokiego
poziomu starają się, przynajmniej w części, myśleć
za programistę, pozwalając mu skupić się na rozwiązaniu konkretnego problemu. Oczywiście,
ze względu na to, że sztuczna inteligencja jeszcze długo nie dorówna żywej, programy pisane
w wysokopoziomowych językach są przeważnie
bardziej zasobożerne, czy też mniej odporne
na różnego rodzaju wyjątki, czyli nietypowe
sytuacje. Window-Eyes, musząc współpracować
z takim miszmaszem, może więc zachowywać
się niestabilnie i tak niekiedy się dzieje. Bywa też
tak, że jedne skrypty zależą od innych skryptów,
które w momencie pisania jeszcze innych skryptów działały inaczej, a obecnie działają w pewien
określony sposób. Wszystko to powoduje, że nigdy
do końca nie wiemy, co może nieść za sobą instalacja danego dodatku. Niewątpliwym plusem,
w porównaniu do choćby JAWSa czy NVDA, jest
jedno, centralne miejsce, w którym zgromadzone
są wszystkie dodatki, jakie zostały stworzone
na przestrzeni lat dla Window-Eyes. Przeglądając
to centralne repozytorium dostępne pod adresem:
https://www.GW Micro.com/App_Central/ istnieje
spore prawdopodobieństwo, że znajdziemy dodatek, z którego będziemy chcieli skorzystać i który
pomoże nam w codziennej pracy.
Window-Eyes For Office
Z początkiem 2014 roku światem tyfloinformatyki wstrząsnęła z pewnością informacja o udo-
45
stępnieniu programu odczytu ekranu firmy GW
Micro wszystkim legalnym posiadaczom pakietów Microsoft Office w wersjach 2010 i wyższych, z wyłączeniem edycji Starter. Z pewnością
to dobry ruch ze strony twórców. Powiedzmy
sobie szczerze, Window-Eyes nie jest wart swojej ceny, oscylującej w granicach 3000zł. Moja
powyższa teza dotyczy także zresztą i JAWSa,
na zakup którego mało kto byłby sobie w stanie
pozwolić, gdyby nie publiczne dotacje ze środków
PFRON. Dzięki takiemu posunięciu GW Micro jest
w stanie zaoferować swój produkt znacznie szerszemu gronu odbiorców, pozwalając tym samym
na znacznie lepsze zapoznanie się z możliwościami WE niż w wersji demonstracyjnej. Oczywiście wersja, jaką dostajemy do pakietu Office,
nie jest pozbawiona kilku ograniczeń, za najpoważniejsze osobiście uważam brak wbudowanych
syntezatorów Vocalizer. Synteza MS Speech Platform (Paulina) powiedzmy sobie szczerze, to produkt, który nie nadaje się do codziennej pracy,
osobiście zirytował mnie jeszcze w trakcie instalacji WE For Office. Całą sytuację ratuje darmowy
Espeak, który działa dobrze i jeśli komuś nie
przeszkadza jego mechaniczna wymowa, będzie
doskonałym towarzyszem pracy z WE. Window-Eyes dla pakietu Office ma również jeszcze jeden
błąd, przez który niekiedy nie jest wykrywana
obecność pakietu biurowego Microsoftu mimo
jego instalacji. W takim przypadku WE melduje
się jako wersja demonstracyjna, a najskuteczniejszym sposobem na rozwiązanie tego kłopotu jest
uruchomienie którejś z aplikacji Office, np. Worda
i restart WE.
Zastanawia jednak, co GW Micro realnie
zyskuje na takiej współpracy z gigantem z Redmond? Szczegóły biznesowe całego przedsięwzięcia okryte są, jak to zawsze w takich sytuacjach
bywa, głęboką tajemnicą. Spróbujmy jednak
zastanowić się, dokąd zmierza Window-Eyes?
Teraźniejszość i przyszłość
W chwili obecnej Window-Eyes na współpracy
z Office zyskać może i zyskuje, znacznie większy
nacisk na prawidłową współpracę z pakietem
biurowym Microsoftu. W centrali dodatków znaleźć możemy moduły, rozszerzające możliwości
WE, sam program posiada również część z tych
dodatków na starcie. Praca w takich aplikacjach
jak Word, Excel czy PowerPoint nie jest problematyczna, użytkownik otrzymuje narzędzie, dające
elastyczne możliwości konfiguracji i pracy nad
dokumentami. Wydawać by się mogło, że dzięki
współpracy z Microsoftem twórcy WE będą mieć
obecnie znacznie więcej czasu na dopieszczenie swojego produktu. Niestety, efekty tego nie
są widoczne. W prawdzie mówi się o Window-Eyes w wersji 9, który ma przynieść kolejne
rewolucje, łącznie z przebudowanym od zera
trybem przeglądania, jednak nie mogę oprzeć się
wrażeniu, że takie rewelacje słyszałem już przy
Window-Eyes 8, a okazały się tylko pustymi obietnicami. Prawda jest taka, że obecnie lwią część
pracy z komputerem stanowi surfowanie w pajęczynie WWW i korzystanie z różnego rodzaju
aplikacji mobilnych, WE natomiast zdecydowanie
odstaje w tej materii od swojej zarówno płatnej,
jak i darmowej konkurencji.
A co by było, gdyby WE zastąpiło Narratora
w kolejnej wersji okienek?
Takie plotki również krążą po świecie, a ile w nich
prawdy, ciężko stwierdzić. Załóżmy jednak, hipotetycznie, że tak się stanie i Microsoft zaimplementuje Window-Eyes w kolejnej wersji Windows.
Gdyby tak się stało, odbyłoby się to z pewnością
z ogromną korzyścią dla użytkowników. Narrator
mimo tego, że w Windows 8 nieco się rozwinął,
NR 1 (22) 2014
46
Czy warto kupić Window-Eyes?
Odpowiem zdecydowanie. Nie, nie warto. Nie
warto wydawać pieniędzy na czytnik, który
w Internecie tak odstaje od konkurencji. Nie warto
wydawać pieniędzy na coś, co możemy mieć za
darmo, kosztem kilku wyrzeczeń, dla większości
użytkowników po prostu mało istotnych. Natomiast z pewnością tym, co warto, jest, jeśli posiadamy pakiet Office w wersji 2010 lub wyższej udać
się na stronę: http://www.windoweyesforoffice.
com/, pobrać i za darmo zainstalować najnowszą wersję WE i po prostu ją sprawdzić. Program
mimo tego, że w pewnych miejscach ewidentnie
odstaje, posiada szereg ciekawych mechanizmów,
o których pisał Michał Molek. Tak szerokiego
wachlarza konfiguracji w darmowym NVDA nie
mamy i na pewno jeszcze tak szybko mieć nie
będziemy, więc z pewnością na WE nie warto
się obrażać i lepiej dać mu zwyczajnie szansę.
Osobiście, jak pisałem we wstępie do niniejszego
artykułu, mam do Window-Eyes olbrzymi sentyment. Ten program to lata moich komputerowych
początków, poznawania Internetu, testowania
wielu różnych aplikacji. Jednak, niestety, czas jest
bezlitosny i na czytniku firmy GW Micro odcisnął
on swoje piętno. Miejmy nadzieję, że dzięki współpracy z Microsoftem WE ponownie będzie najlepszym, a tym razem już darmowym czytnikiem
ekranu, czego z całego serca wszystkim zaangażowanym w ten projekt życzę.
fot. Shutterstock.com, Microsoft
nadal jest topornym i dość prymitywnym programem odczytu ekranu. WE przy nim jawi się jako
naprawdę zaawansowany produkt. Zaawansowany, ale jednak odstający od konkurencji, więc
byłoby to także z korzyścią dla GW Micro, bowiem
bliska współpraca z inżynierami i projektantami
Windows pozwoliłaby im nadgonić a nawet znacznie wyprzedzić konkurencję. Kto bowiem może
wiedzieć, jak najlepiej zaimplementować mechanizmy dostępnościowe w systemie, jeśli nie jego
twórcy? Oczyma wyobraźni widzę już Windows
9 i czytnik zintegrowany z nim tak, jak VoiceOver
z systemem OS X i szczerze mówiąc, życzę tego
programowi Window-Eyes, jak i wszystkim pracownikom GW Micro, zaangażowanym w jego
rozwój. Istnieje oczywiście również możliwość,
że współpraca GW Micro z MS tak szybko, jak się
rozpoczęła tak i szybko się skończy, albo po prostu utrzyma dotychczasowy poziom.
47
Michał Dziwisz
NVDA
kontra reszta świata
Minęły już bezpowrotnie czasy, w których wydatki widzącego
i niewidomego na zakup sprzętu komputerowego dzieliła
przepaść, dla wielu nie do przeskoczenia. Kilka czy
kilkanaście lat temu koszt podstawowej, komputerowej
wyprawki dla użytkownika, niebędącego w stanie korzystać
ze wzroku we współpracy z komputerem, oscylował
w granicach 10 – 12 tysięcy złotych. Na szczęście kilka lat
temu sytuacja ta uległa diametralnej zmianie.
Stało się to dzięki dwom
Australijczykom, Jamesowi
Tehowi oraz Michaelowi Curranowi, twórcom darmowego
czytnika ekranu dla systemu
Windows o nazwie NVDA. Program pobrać można ze strony:
http://www.nvda-project.
org, a fakt, że jest to produkt
o otwartym kodzie źródłowym
sprawia, że nie tylko korzystać,
ale i rozwijać go może absolutnie
każdy, kto rzecz jasna dysponuje
odpowiednimi umiejętnościami.
W niniejszym artykule nie chciałbym jednak opisywać samych
funkcji NVDA, bo zostało to już
zrobione w niejednym artykule
czy audycji. Pragnę za to zastanowić się nad różnicami między
programem NVDA a obecnymi
na naszym rynku od wielu lat
komercyjnymi programami
odczytu ekranu oraz spróbować
odpowiedzieć na pytanie, czy
programy takie jak JAWS czy
Window-Eyes są nam jeszcze
potrzebne do szczęścia.
Rozmiar ma znaczenie
Tym, ciut dwuznacznym, tytułem chciałbym zwrócić uwagę
czytelników na rozmiary pakietów instalacyjnych NVDA oraz
jego komercyjnej konkurencji.
NVDA to program, którego
instalator liczy zaledwie kilkanaście megabajtów danych. W tym
instalatorze zawarty jest już
wielojęzyczny syntezator mowy
Espeak oraz komplet plików,
niezbędnych do prawidłowej
pracy NVDA. Konkurencja przez
wiele lat rozwoju zdążyła zdecydowanie bardziej utyć, rekordzistą jest tu JAWS, którego
pakiet instalacyjny to ponad
200 megabajtów danych! Nie
pozostaje to bez wpływu również na prędkość instalacji oraz
proces uruchomienia samego
czytnika. NVDA uruchamia się
błyskawicznie, Window-Eyes czy
JAWS potrzebują dłuższej chwili
na zastanowienie się i rozruch.
NR 1 (22) 2014
48
Strona projektu NVDA
Responsywność i stabilność
pracy na starym i nowym
sprzęcie
Jeśli chodzi o wygodę używania
NVDA na współczesnych lub
liczących kilka lat komputerach
nie mam zastrzeżeń. Program
działa szybko i płynnie, a dzięki
wbudowanemu Espeakowi
można nawet często odnieść
wrażenie, że pracuje zdecydowanie żwawiej od konkurencji.
Niestety, o ile prędkość mowy
oraz ogólna responsywność
faktycznie jest zadowalająca,
o tyle ze stabilnością potrafi być
znacznie gorzej. Sami autorzy
mają tego świadomość i planują
w przeciągu kilku wersji dokonać
stosownych poprawek. NVDA
jest znacznie bardziej podatny
na zawieszenia niż np. JAWS.
Dzieje się tak dlatego, że program za wszelką cenę chce informować użytkownika o wszelkich
zmianach zachodzących na ekranie nawet, jeśli użytkownik
w chwili obecnej nie będzie nimi
zainteresowany. Dla przykładu,
gdy zostawimy w oknie przeglądarki stronę, której elementy
odświeżane są w czasie rzeczywistym, a sami przejdziemy
do innej aplikacji, np. edytora
tekstu celem redagowania
jakiegoś dokumentu, odczujemy
wyraźne spowolnienie reakcji
NVDA. Będzie się tak działo,
bowiem program w dalszym
ciągu będzie otrzymywał informacje od przeglądarki o odświeżających się elementach i spróbuje nas o tym poinformować.
Odrębną sytuacją jest komfort
pracy z NVDA na bardzo starych
komputerach czy nawet niektórych netbookach. W swojej pracy
nie rzadko mam jeszcze do czynienia z komputerami liczącymi
10 czy 12 lat. W takich sytuacjach
praca z NVDA jest istną męczarnią i zdecydowanie nie polecam
jej nikomu, kto ceni swoje nerwy.
Niestety, NVDA napisany jest
w języku wysokiego poziomu,
jakim jest Python, który mimo
bardzo dużych możliwości nie
należy do szybkich.
NVDA w Internecie
Komercyjnym czytnikom
ekranu, takim jak JAWS czy WE,
od zawsze bardziej po drodze
było z systemową przeglądarką Microsoftu, czyli Internet
Explorerem. W czasach, kiedy
złośliwi żartowali, że produkt
ten służy do przeglądania
Internetu z naszego komputera
i na odwrót słusznie można było
narzekać na ten stan rzeczy.
Od kilku wersji Internet Explorer
jest jednak coraz lepszym produktem, tak więc fakt wspierania tego programu przez płatne
49
rozwiązania nie jest już niczym
złym. JAWS i WE oczywiście
współpracują również z Firefoxem, autorstwa fundacji Mozilla,
nie da się jednak oprzeć wrażeniu, że współpraca ta bywa
gorsza, niż z rozwiązaniem systemowym. NVDA dzięki intensywnej współpracy z Mozillą
poszła inną drogą i zdecydowanie lepiej radzi sobie z obsługą
Firefoxa, niż Internet Explorera.
Nie oznacza to bynajmniej,
że w systemowej przeglądarce
NVDA nie radzi sobie zupełnie,
zdecydowanie wygodniej jednak korzysta się z tego czytnika
ekranu w duecie z Ognistym
Lisem. Wszyscy chętni i lubiący
nowe wyzwania mogą także
przekonać się jak też NVDA radzi
sobie we współpracy w duecie
z Google Chrome, która z wersji
na wersję staje się coraz ciekawszą alternatywą.
W przypadku programów
pocztowych, które są również
bardzo często używanymi przez
niewidomych internetowymi
narzędziami, NVDA i pozostałe czytniki ekranu obierają
w zasadzie jedyną, w obecnych
czasach słuszną dla nas drogę,
skupiają się mianowicie na kliencie pocztowym Thunderbird.
Screenreadery komercyjne, jak
i NVDA starają się oczywiście
wspierać rozwiązania wbudowane w system operacyjny,
jednak, szczególnie w Windows
8, nie są to programy wygodne,
a już z pewnością nie należą
do konfigurowalnych i pozwalających na dostrojenie swoich
parametrów do naszych preferencji. Skoro już jesteśmy
przy Thunderbirdzie to warto
nadmienić, że NVDA to czytnik
najbardziej nadążający za kolejnymi wersjami tego programu
i radzący sobie z nim najlepiej
spośród wiodącej screenreaderowej trójki. Window-Eyes czy
JAWS radzą sobie też stosunkowo dobrze z rozbudowanym,
płatnym, wchodzącym w skład
pakietu Microsoft Office MS
Outlookiem, jednak w codziennej pracy ciężko polecić tę aplikację niewidomemu użytkownikowi, no chyba, że jest
to podyktowane koniecznością
pracy w większej grupie w środowisku MS Exchange.
Office, czyli słabsza strona
NVDA
Niestety, mimo tego, iż dwójka
Australijczyków z fundacji
NV Access dokłada wszelkich
starań, aby NVDA był produktem coraz lepszym, nie można
pominąć miejsc, w których zwyczajnie wypada gorzej od swojej
konkurencji. Przykładem jest
tu z pewnością pakiet Office
i funkcje, w jakie przez wiele lat
swojego istnienia obrosły JAWS
i Window-Eyes. Jako kilka podstawowych wymienię tu choćby
możliwość wyświetlenia listy
błędów ortograficznych, przypisów, komentarzy, zakładek czy
tabel oraz możliwość nawigowania po dokumentach MS Word,
tak jak po stronach internetowych, przeskakując stosownymi
klawiszami szybkiej nawigacji
po odnośnikach, nagłówkach,
grafikach czy cytatach. Jeśli
ktoś z szanownych czytelników
uważa, że marudzę, to posłużę
się przykładem sprzed kilku miesięcy. W ramach swoich zawodowych obowiązków, musiałem
kilka miesięcy temu ogołocić
pewien dokument z wszelkich
graficznych ozdobników i mimo,
że jestem wielkim zwolennikiem
NVDA musiałem przeprosić
się z Jawsem, jego mechanizm
szybkiej nawigacji diametralnie
usprawnił moją pracę.
Do niedawna problemem był
też całkowity brak parametryzacji NVDA. Te same ustawienia,
korzystne dla jednego programu
NVDA zapewnia użytkownikom darmowe wsparcie systemu
Windows
NR 1 (22) 2014
50
Zdecydowanie nie polecam pracy z NVDA na starszych
komputerach
były fatalne w swoich skutkach dla pracy z inną aplikacją.
Na szczęście, w najnowszych
wersjach tego darmowego
czytnika możliwe jest już zdefiniowanie profili dla konkretnych
aplikacji, wcześniej mogliśmy
także skorzystać z płatnego
dodatku VTurbo. Oczywiście nie
oznacza to, że NVDA nie nadaje
się do pracy w pakiecie biurowym Microsoftu. O jego przydatności w duecie z tym narzędziem zaświadczyć może choćby
fakt, że niniejszy artykuł piszę
właśnie współpracując z NVDA.
Wskazane powyżej mankamenty
mają jedynie zasygnalizować
pewne niedogodności, na jakie
możemy być narażeni wybierając to otwarte rozwiązanie.
Wielojęzyczność
Jest to niewątpliwy plus NVDA.
Możliwe jest wybranie zarówno
konkretnego języka interfejsu,
jak i syntezy, co czyni ten
program bardzo uniwersalnym
narzędziem. Jeśli zdecydujemy
się na stworzenie kopii przenośnej NVDA, a przyjdzie nam
pracować np. na niemieckim
Windowsie, od razu po uruchomieniu czytnika odezwie się
do nas stosowny wariant mowy
Espeaka. Do samej syntezy,
jaką jest wspomniany wyżej
Espeak, można mieć oczywiście
zastrzeżenia, nie da się jednak
ukryć, że ten zupełnie darmowy
produkt pozwala na stosunkowo
wygodną pracę ludzi posługujących się kilkudziesięcioma
językami i dialektami.
Przenośność i otwartość
NVDA to produkt, który w bardzo prosty sposób możemy
uruchomić na dowolnym komputerze z systemem Windows.
Nie wymaga instalacji, może
być włączony z pamięci USB lub
nawet płyty CD/DVD. Pozwala
to w wielu przypadkach na skorzystanie z NVDA w miejscach,
gdzie zainstalowanie innych
programów odczytu ekranu
jest niemożliwe lub też niemile
widziane. Pamiętajmy, że komercyjne narzędzia stosują technikę
tzw. przechwytywania obrazu,
która niegdyś w znacznym
stopniu, a i teraz niejednokrotnie potrafi być problematyczna
dla części kart graficznych lub
dla ich nietypowych konfiguracji. NVDA nie stosuje tego
typu mechanizmów, wyciągając
większość informacji bezpośrednio z systemu, bądź też komunikując się z wybraną aplikacją,
toteż instalacja tego programu
na komputerze, który do nas nie
należy jest z pewnością mniej
ryzykowna i nie będzie pociągać za sobą żadnych negatywnych konsekwencji. Kolejna
rzecz to otwartość NVDA. Jako,
że kod tej aplikacji dostępny
jest dla każdego i zupełnie za
darmo, możliwe jest, o ile ktoś
miałby na to ochotę, stworzenie swojego własnego czytnika
ekranu w oparciu o istniejące
już rozwiązania. Otwartość daje
również możliwość tworzenia
różnego rodzaju dodatków,
ingerujących znacznie głębiej
w strukturę programu niż to,
co oferuje konkurencja. Window-Eyes ma swoje aplikacje,
które możemy pisać w dowolnym języku, wykorzystując
udostępnione metody. JAWS ma
swój własny język skryptowy,
również pozwalający na wiele.
W przypadku NVDA wszystko
pisane jest w Pythonie, twórcy
pozwolili jednak na znacznie
więcej niż pisanie dodatków
rozszerzających współpracę
programu z różnymi aplikacjami czy też zwiększające jego
funkcjonalność. Każdy, kto chce,
może również napisać sterow-
51
nik do dowolnego syntezatora
czy też monitora brajlowskiego,
który nie jest jeszcze wspierany
przez NVDA, i udostępnić takie
wsparcie innym. Jeśli nawet
sterownik ten nie zostanie oficjalnie umieszczony w kolejnych
dystrybucjach NVDA, nic nie stoi
na przeszkodzie, aby podzielić
się nim w Internecie na własnej
stronie WWW czy też w kilku
repozytoriach z dodatkami
do tego czytnika ekranu, np:
http://addons.nvda-project.org/
index.en.html - oficjalnej stronie
z dodatkami, prowadzonej przez
autorów NVDA,
http://jeff.vrnw.org/NVDA.
htm - repozytorium dodatków, prowadzonym przez Jeffa
Rutkowskiego,
http://stormdragon.us/nvda/
- kolejnym repozytorium, tym
razem prowadzonym przez
StormDragona.
Praca terminalowa i zdalna
Z mojej zawodowej perspektywy to największa bolączka
NVDA. Niestety, program ten,
w odróżnieniu od konkurencji,
nie posiada żadnego wsparcia dla protokołów takich jak
Microsoft RDP i Citrix. Na chwilę
obecną nie ma również planów zaimplementowania opcji,
pozwalającej na połączenie się
z komputerem innego użytkownika celem świadczenia
tzw. pomocy zdalnej. Jedynym
rozwiązaniem, z jakiego mogą
skorzystać użytkownicy NVDA,
jest program TeamViewer ze stosownym dodatkiem. Minusem
takiego duetu jest jego prawidłowe działanie jedynie w systemach operacyjnych od Windows
Vista w górę, użytkownicy wciąż
popularnego Windowsa XP
muszą obejść się smakiem.
Kursor Myszki
Wielu osobom, zaczynającym
swoją przygodę z NVDA, bardzo doskwiera mechanizm, za
pomocą którego rozwiązana jest
tu interakcja ze wskaźnikiem
myszy. Najogólniej mówiąc,
każdy element interfejsu programu jest pewnym obiektem,
do którego należy dotrzeć.
Wszystkie obiekty utrzymane
są w drzewiastej strukturze,
korzeniem której jest pulpit,
kolejnymi odgałęzieniami okna
poszczególnych aplikacji, rozgałęziające się w jeszcze mniejsze
elementy. W tym całym galimatiasie poruszamy się, za pomocą
kombinacji klawisza NVDA
z cyframi z klawiatury numerycznej. Początkowo to wszystko nie
jest łatwe i właśnie wskaźnik
myszy to element, który najbar-
dziej odstrasza początkujących
użytkowników. JAWS czy WE
rozwiązały ten problem znacznie
lepiej, bowiem to, co widzimy
za pomocą Jaws Cursora czy
Window-Eyesowej myszki
jest mniej / więcej wizualnym
odzwierciedleniem zawartości okna lub wycinka ekranu,
na którym właśnie pracujemy.
Okazuje się jednak, że czasem
takie rozwiązanie jest zawodne.
Wracamy tu znowu do technologii przechwytywania obrazu,
dzięki której komercyjne czytniki są w stanie przekazać nam
właśnie taki obraz naszego
komputerowego środowiska
pracy. Niekiedy zdarza się tak,
że sterownik w trakcie wielogodzinnej sesji ulegnie uszkodzeniu, a co za tym idzie, wskaźnik
myszki nie odczyta nam wiele.
Problemy zaczynają się również
w przypadku systemu Windows
8, który nie wspiera już opisywanej tu techniki modelowania
NVDA, dzięki współpracy z Fundacją Mozilla, świetnie radzi
sobie z przeglądarką Firefox
NR 1 (22) 2014
obrazu. W takim przypadku
bardzo często umiejętne korzystanie z NVDA może dać nam
lepsze wyniki, niemniej jednak
w przypadku szukania jakiegoś
bardzo precyzyjnego, niewielkich
rozmiarów elementu graficznego,
rozwiązania komercyjne okażą
się z pewnością lepsze.
Parametryzacja
NVDA dysponuje coraz to większą liczbą opcji, jednak mimo
całej sympatii dla tego darmowego programu, w żadnej mierze
nie mogę ich porównać z tym,
co oferują panele konfiguracyjne
Window-Eyes czy JAWS. Jeśli
jakiś użytkownik przyzwyczaił
się przez lata, że komunikaty,
które są mu odczytywane wypowiadane są w taki, a nie inny
sposób, że może wybrać sobie
bardzo konkretnie, jakie informacje o danym elemencie są anonsowane, w momencie przesiadki
na NVDA bardzo się rozczaruje.
Program ten dysponuje kompletem parametrów, pozwalającym
na przygotowanie go do współ-
pracy z nami w podstawowej formie, trudno jednak doszukać się
np. poleceń nakazujących odczytywanie typu kontrolki przed lub
po jej nazwie, albo też konkretnego atrybutu przypisanego
do elementu HTML, co może być
istotne w pewnych przypadkach,
choć wcale nie jestem pewien
czy w bardzo wielu.
Czy zatem komercyjne
czytniki mają jeszcze rację
bytu?
Z pewnością tak. Programy takie
jak JAWS czy Window-Eyes nie
znikną z naszego rynku z dnia
na dzień, bowiem w dalszym
ciągu jest na nie zapotrzebowanie. Możliwość precyzyjnej
parametryzacji, praca zdalna czy
wreszcie lepsza współpraca z MS
Office to atuty, jakie z pewnością dostrzegą osoby pracujące
zawodowo. Na całe szczęście
nie oznacza to, że każdy z niewidomych skazany jest na zakup
czytnika za kilka tysięcy złotych,
a następnie dodatkowe opłaty
mniej / więcej co 2 lata, pozwala-
NVDA radzi sobie zaskakująco dobrze nie tylko z Firefoxem, ale
również klientem pocztowym Thunderbird
jące na jego aktualizację. Osobiście każdemu niewidomemu,
który zastanawia się, czy kupować komercyjny program, bądź
też czy go aktualizować, polecam
gorąco zapoznanie się z możliwościami, jakie daje darmowy
i na bieżąco rozwijany program
NVDA. Jeśli okaże się, że jednak
nie spełnia on naszych oczekiwań, warto wtedy pomyśleć nad
zakupem płatnego rozwiązania. Takie podejście do sprawy
z pewnością będzie z korzyścią dla środków naszych, jak
i publicznych, z których pochodzi
większość wkładu w zakupy tego
typu licencji.
NVDA to naprawdę dobre
i przydatne narzędzie, które
swoje braki wynagradza szybkością działania, jak i coraz
prężniej rozwijającą się bazą
dodatków, które dostarczają
naprawdę ciekawych funkcji,
jakich próżno szukać w pozostałych rozwiązaniach. Za przykład niech posłuży tu dodatek,
dzięki któremu możliwe jest
dyktowanie za pomocą naszego
własnego głosu, czy bardzo
szybkie narzędzie pozwalające
na tłumaczenie niewielkich porcji tekstu niezwykle przydatne
np. w grach. NVDA to projekt,
który jeszcze kilka lat temu
był traktowany jako narzędzie
awaryjne w momencie problemów z naszym podstawowym
czytnikiem ekranu. Dziś, przynajmniej u mnie, NVDA jest podstawowym czytnikiem ekranu,
który wykorzystuję na co dzień
w swojej pracy. Zachęcam raz
jeszcze do dania szansy tej darmowej aplikacji, bo z pewnością
jest tego wart.
fot. Shutterstock.com, FIRR, tomdavies, Mozilla
52
53
Paweł Masarczyk
Blackberry
wreszcie z czytnikiem ekranu
Był czas, gdy urządzenia Blackberry posiadały możliwość udźwiękowienia za pomocą płatnego
programu Oratio, stworzonego w porozumieniu firm Code Factory oraz HumanWare. Dla nas nie
miało to jednak większego znaczenia, gdyż nie istniał polski syntezator, działający z tym programem.
Nie inaczej było w nowszej wersji systemu, w które rozwiązania dostępnościowe, co prawda,
wbudowano od razu, ale znowu nie było innych syntezatorów niż angielski, niemiecki i francuski.
Wszyscy czekali na nową wersję Blackberry OS,
która pojawiła się wiosną 2013 r. i miała stanowić
długo oczekiwany przełom w ergonomii operowania systemem i jego zbliżeniem do innych podobnych - Androida i iOS, nie tracąc przy tym tego,
co dla Blackberry istotne. I niestety znowu nic.
Żadnych opcji dostępności. W tej sytuacji wszyscy
raczej spisali Blackberry na straty pod tym kątem.
Okazało się, że niesłusznie.
Nowy screenreader
Dosyć niespodziewanie, w aktualizacji BB OS
do wersji 10.2, pojawił się wbudowany screenreader z większą liczbą języków syntezy.
Pierwsze testy przeprowadziła załoga rosyjskiego serwisu informacyjnego, dotyczącego
technologii wspomagających osoby z dysfunkcją
wzroku – Tiflocomp. Jedynym urządzeniem, jakie,
póki co, posiada system w wersji 10.2, a co za tym
idzie, oferuje program odczytu ekranu – jest dotykowy model Z30. Wkrótce mają do niego dołączyć
wyposażone w klawiaturę qwerty, Blackberry Q5
oraz Q10.
Program odczytu ekranu aktywować można
na dwa sposoby: w ustawieniach telefonu lub
poprzez trzykrotne naciśnięcie przycisku zasilania. Tę drugą metodę musimy uaktywnić ręcznie
w ustawieniach dostępu.
NR 1 (22) 2014
54
daty i godziny (szybkie puknięcia w dół, a następnie górę ekranu). Obecny jest także, znany z urządzeń Apple, gest podwójnego stuknięcia dwoma
palcami i ma on takie samo zastosowanie. W OS
Blackberry mamy także do czynienia z gestami
lokalnymi – specyficznymi dla poszczególnych
aplikacji, np. kalendarza, telefonu czy huba.
Tymczasowe ustawienia mowy
Strona recenzenta udźwiękowienia Blackberry
Bardzo ważną nowością w odświeżonej,
od wersji 9 OS Blackberry wersji screenreadera,
jest wsparcie dla większej ilości języków - w tym
dla polskiego. Głosy, jakie znajdziemy w najnowszych Blackberry, to Vocalizery - w przypadku
języka rosyjskiego jest to Milena i w nagranej
przez Tiflocomp krótkiej prezentacji była to wersja
compact. My więc możemy spodziewać się Zosi
lub Ewy.
Język, aktywację potrójnym naciśnięciem oraz
inne opcje możemy modyfikować w ustawieniach
screenreadera, które prezentują się dość skromnie: znajdziemy w nich oprócz tego: szczegółowość oznajmiania, echo wpisywanego tekstu oraz
parametry głosu takie jak: prędkość, głośność czy
wysokość.
Nawigacja
Nawigacja po interfejsie systemu operacyjnego
nie różni się zbytnio od tego stosowanego w iOS
czy Androidzie: linearne przemieszczanie się
pomiędzy elementami ekranu osiągniemy poprzez
przesuwanie palcem w lewo/prawo, aktywację
elementu poprzez podwójne stuknięcie. Istnieją
też gesty, które pozostają niezmienione mimo
włączenia screenreadera. Są to przesunięcia
z rogów ekranu aktywujące ustawienia lub imitujące pewne sprzętowe przyciski, nieobecne
w dotykowych modelach Blackberry.
Firma Thorstena Heinsa zastosowała hybrydę
rozwiązań znanych z Androida oraz iOS, jeśli chodzi o pewne gesty. Znajdziemy tu zarówno kreślenie kształtów – np. przerwanie czytania to ruch
palcem w dół, a następnie w lewo, jak i te same
gesty wykonywane dwoma palcami. Do kolejnych
udziwnień należą gesty odczytu paska stanu czy
Kreatywność Blackberry poszła o krok dalej:
nowością, niespotykaną dotąd w żadnym tego
typu rozwiązaniu, jest tryb szybkich ustawień,
pozwalający na zmianę najczęściej używanych
parametrów czytnika: prędkość, głośność, wysokość, literowanie fonetyczne, echo itp.
Aktywujemy go, wykonując coś w rodzaju
gestu z dołu w prawo i w górę, tudzież stuknięciem u dołu, a następnie po prawej stronie
ekranu. Uruchamiany jest wtedy specjalny tryb,
w którym mamy 3 sekundy na wydanie komendy,
później zostaje on zamknięty, a fakt ten odnotowany poprzez wibrację. Tu znów do akcji wchodzi
kolejna porcja gestów, służących do wyboru opcji
z ich poziomej listy oraz regulacji poszczególnych
parametrów.
Na koniec
Screenreaderowi Blackberry brakuje jeszcze wiele
w stosunku do spopularyzowanej już konkurencji.
Nie znajdziemy np. wsparcia dla brajla. Dostępność aplikacji trzecich pozostawia także wiele
do życzenia. Pavel Ondra, niewidomy znajomy
Screenreaderowi BlackBerry wiele jeszcze
brakuje, nie świadczy m.in. wsparcia dla
monitorów brajlowskich
fot. Dionisvera, FIRR, Blackboard1965, Blackberry
55
z Czech, który również miał okazję testować Z30,
napisał mi, że część gestów screenreadera kłóci
się z gestami systemowymi oraz że nie wszystkie
aplikacje są dostępne. Twitter i Facebook przynajmniej na pierwszy ogląd są obsługiwalne, ale
np. Foursquare już nie. Do tego bardzo ciężko
używa się dotykowej klawiatury pod screenreaderem Blackberry. Jeżeli, wbrew przewidywaniom
wielu, Blackberry utrzyma się na rynku, sporo
wody może upłynąć nim wytworzy się świadomość developerów, iż ich aplikacje muszą zostać
dostosowane pod kątem dostępności na jeszcze
jednej platformie. Cieszy fakt, iż prezentacja
screenreadera, zamieszczona w serwisie Youtube
przez portal Blackberryos.com, prócz innych, mało
istotnych faktów, takich jak to, że screenreader
po pierwszym uruchomieniu wyświetla udźwiękowione już okno z pytaniem „Czy na pewno
chcesz włączyć screenreader?” oraz, iż kulturalnie
żegna się z nami, mówiąc nie mniej, nie więcej,
a po prostu „Do widzenia”, pokazuje program
odczytu ekranu w akcji na przykładzie wbudowanej przeglądarki internetowej, która zdaje się
być dostępna. W recenzji nie znalazłem też żadnej
wzmianki o gestach zaawansowanej edycji tekstu.
Na koniec chciałbym wyjaśnić, że prezentowany tutaj tekst jest wolnym tłumaczeniem recenzji z języka rosyjskiego. Recenzja ta wprowadziła
parę nowych, anglojęzycznych terminów, których
polskiego tłumaczenia nie poznamy, dopóki ktoś
nie kupi Blackberry: sam screenreader ma zlokalizowaną nazwę i po naszemu nazywać się może
„program odczytu ekranu”. Element, który jest
obecnie podświetlony to „Point of regard” (czyżby
punkt uwagi?), a tryb, w którym możemy wejść
w interakcję z elementem, by wykonywać na nim
jemu właściwe gesty to „discovery mode” (tryb
odkrywania bądź eksploracji).
Źródło: http://www.tiflocomp.ru/devices/
blackberry/bbsr10.2.php
Krótka demonstracja screenreadera w akcji:
http://www.youtube.com/watch?v=rbk6ItO-_HML
NR 1 (22) 2014
Zobacz nas
w Internecie
www.tyfloswiat.pl
W portalu:
• informacje o producentach i dystrybutorach,
• testy i opinie o produktach,
• informacje prawne,
• baza szkoleń dostosowanych do potrzeb osób z dysfunkcją wzroku,
• wydarzenia, konferencje, imprezy
... i wiele wiele innych informacji!
Projekt współfinansowany ze środków Państwowego Funduszu Rehabilitacji Osób
Niepełnosprawnych.

Podobne dokumenty