Przetwarzanie danych

Transkrypt

Przetwarzanie danych
O przetwarzaniu danych
R. Robert Gajewski
omklnx.il.pw.edu.pl/~rgajewski
www.il.pw.edu.pl/~rg
[email protected]
Technologia i technika
Technologia to naukowo uzasadniony sposób
posługiwania się środkami technicznymi.
Na miano technologii zasługuje tylko taki sposób,
który jest oparty na naukowych podstawach z
uwzględnieniem praktycznych aspektów.
Technologia oznacza sposób korzystania ze
środków technicznych, technika oznacza same
środki.
2•13
© 2004, R. Robert Gajewski
Elementy i zadania technologii
Podstawowe elementy technologii:
!
!
środki techniczne
wiedza, na temat posługiwania się środkami
technicznymi
Zadanie technologii to
!
!
!
3•13
służenie człowiekowi w organizowaniu i
realizowaniu określonych prac
za pomocą danego sprzętu
w warunkach najpełniejszego wykorzystania jego
możliwości.
© 2004, R. Robert Gajewski
Technologia informatyczna
Technologia Informatyczna (TI) Information Technology (IT) to naukowo
uzasadniony sposób posługiwania się środkami
informatycznymi do
!
!
!
!
!
zbierania,
przechowywania,
przetwarzania,
przesyłania,
udostępniania informacji.
Do środków informatycznych zalicza się:
!
!
4•13
urządzenia komputerowe z wejściem i wyjściem
sprzęt telekomunikacyjny.
© 2004, R. Robert Gajewski
Warstwy TI
W TI wyróżniamy następujące warstwy:
!
!
!
sprzęt informatyczny
struktury danych
procedury przetwarzania danych
Warstwa sprzętowa opisuje urządzenia
informatyczne w aspekcie ich użyteczności w
procesach informacyjnych nie obejmując
problemów budowy i konserwacji.
Warstwa danych obejmuje problemy
operowania danymi.
Warstwa proceduralna określa warunki
posługiwania się techniką informacyjną.
5•13
© 2004, R. Robert Gajewski
Zakres TI
Środki techniczne
6•13
Technologie
informatyczne
Sprzęt komputerowy
Technologie
przetwarzania danych
Masowe pamięci
zewnętrzna
Bazy danych
Środki transmisji +
komputery
Sieci komputerowe
Środki multimedialne
Technologie
multimedialne
© 2004, R. Robert Gajewski
Funkcje i zadania TI
Podstawowe funkcje i zadania TI:
!
!
!
!
!
ułatwienie organizowania i realizacji procesów
informacyjnych
przyspieszenie zbierania, przetwarzania, udostępniania
i przesyłania danych (informacji, wiedzy...)
zwiększenie wydajności tych procesów
Odciążenie człowieka w zakresie wykonywania
rutynowych prac
wspomaganie procesów zarządzania
przedsiębiorstwami
TI rozwijają się wraz z doskonaleniem się
wszystkich trzech warstw.
7•13
© 2004, R. Robert Gajewski
Zmiany w TI
Zgodnie z powszechną oceną:
!
!
najszybciej zmienia się sprzęt
najwolniej zakres i sposób jego wykorzystania.
Najpoważniejsza barierą rozwoju TI staje się
postawa człowieka (użytkownika i informatyka) w
zakresie poszukiwania nowych sposobów i
kierunków zastosowań sprzętu informatycznego.
Cóż... Osoby na stanowiskach kierowniczych
często nie rozumieją i nie doceniają TI.
8•13
© 2004, R. Robert Gajewski
Przetwarzanie danych
Przetwarzanie danych (PD) to przekształcanie
treści i formy danych metodą systematycznie
przeprowadzanych operacji w celu uzyskania z
góry zaplanowanych wyników.
Korzystając z pojęcia komunikatu możemy
interpretować ten proces jako
!
!
przekształcenie danych początkowych (wejściowych)
dostarczanych przez zbiór komunikatów
w dane wyjściowe (wynikowe).
Dane wejściowe nie ulegają ani zniszczeniu ani
zużyciu, co sprawia, że proces przetwarzania
danych prowadzi do zwiększenia ich ilości.
9•13
© 2004, R. Robert Gajewski
Ustalanie terminologii
Różne znaczenia terminu przetwarzanie danych:
!
!
!
w szerokim sensie PD to wszelkie prace wykonywane z
wykorzystaniem komputera
w węższym sensie PD to przetwarzanie danych
masowych
PD to także zastosowanie komputerów w obliczeniach
ekonomicznych, gospodarczych, statystycznych i
społecznych.
W języku potocznym dane i informacje
traktowane są jako synonimy.
Przetwarzanie danych i przetwarzanie informacji
traktowane są także równoznacznie.
10•13
© 2004, R. Robert Gajewski
Struktura procesu PD
Faza wstępna przygotowanie procesu
przetwarzania danych
Faza zbierania danych
Faza przygotowania do przetwarzania
komputerowego
Faza przetwarzania zasadniczego
Faza końcowa
11•13
© 2004, R. Robert Gajewski
Faza wstępna
Ustalenie potrzeb informacyjnych użytkownika potrzebne wyniki wyjściowe
Ustalenie niezbędnych danych wejściowych potrzebnych
w celu uzyskania wyników
Wykonanie prac przygotowawczych - oprogramowanie,
dokumentacja
Aspekty przygotowania danych:
!
!
!
!
!
12•13
Infologiczny - rodzaj, zakres...
Metodologiczny - metody, źródła, narzędzia...
Techniczny - środki zbierania danych...
Organizacyjny - dobór personelu, harmonogram prac...
Przestrzenny - organizacja PD w aspekcie przestrzennym
© 2004, R. Robert Gajewski
Faza zbierania danych
Zbieranie danych wejściowych
!
!
!
koncentracja na badanych obiektach
stosowanie się do instrukcji
czasochłonność - operacje wykonuje człowiek
Analiza jakości - ręczna kontrola kompletności i
poprawności danych
!
!
wykrycie błędów w dokumentach źródłowych
ustalenie rodzaju, rozkładu oraz źródła błędów
Wstępne przygotowanie danych do dalszego
przetwarzania, np. symbolizacja
!
!
zmniejszenie liczby znaków - ilości informacji
skrócenie czasu przenoszenia na nośnik
Kompleksowe zbieranie dokumentów źródłowych
13•13
!
zapewnienie przejrzystości materiału
© 2004, R. Robert Gajewski
Faza przygotowania...
Zapisanie danych wejściowych na nośniku
elektronicznym, który można dowolnie
przemieszczać niezależnie od urządzeń
niezbędnych do odczytania zawartych w nim
danych
!
!
!
!
!
14•13
maszynowe sprawdzenie poprawności danych oraz ich
ewentualna korekta
ustalenie pomocniczych danych pochodnych
przeprowadzenie automatycznej symbolizacji danych
typu np. tekstowego
uporządkowanie - czytaj posortowanie - zbioru danych
wejściowych, tak, aby dalsze procesy mogły
przebiegać sprawniej
kompresja danych, tak by zajmowały one mniej
miejsca
© 2004, R. Robert Gajewski
Metody automatyzacji
15•13
BCR – (Bar Code Recognition) automatyczne
rozpoznawanie kodów kreskowych
OMR – (Optical Mark Recognition) –
automatyczne rozpoznawanie znaków umownych
(kreski, krzyżyki, kółka itp.) w zależności od
miejsca na formularzu
OCR – (Optical Character Recognition) –
automatyczne rozpoznawanie pisma
maszynowego i znaków pisanych ręcznie poprzez
porównywanie ze wzorcami
ICR – (Intelligent Character Recognition) –
automatyczne rozpoznawanie pisma z
wykorzystaniem metod sztucznej inteligencji, na
przykład sieci neuronowych.
© 2004, R. Robert Gajewski
Dwie ostatnie fazy...
Faza przetwarzania zasadniczego
!
!
!
wykonanie takich operacji na danych wejściowych,
które doprowadzą do uzyskania danych wynikowych
zredagowanie wyników
udostępnienie ich użytkownikowi
Faza końcowa
!
!
16•13
wykonanie operacji związanych z zakończeniem
procesu przetwarzania danych, takich jak np.
przekazanie końcowych wyników do archiwum
wykonanie uzupełniających prac obliczeniowych
zgodnie z dodatkowymi wymaganiami użytkownika
bądź zleceniodawcy.
© 2004, R. Robert Gajewski
Technologie przetwarzania
Przetwarzanie
Przetwarzanie
Przetwarzanie
Przetwarzanie
Przetwarzanie
17•13
wsadowe
transakcyjne (interakcyjne)
scentralizowane
rozproszone
współbieżne
© 2004, R. Robert Gajewski
Przetwarzanie wsadowe
Wymaga przygotowania wsadu, czyli
skompletowania pełnego zbioru danych
wejściowych
Proces przetwarzania nie wymaga i najczęściej
nie dopuszcza jakiegokolwiek sterowania
(ingerencji) z zewnątrz
Opracowanie każdego rekordu odbywa się
zgodnie z tym samym algorytmem
18•13
© 2004, R. Robert Gajewski
Przetwarzanie wsadowe +/Zalety
!
!
względnie krótki czas realizacji przetwarzania
liniowa zależność czasu przetwarzania od ilości
informacji - możliwość przewidzenia czasu
przetwarzania
Wady
!
!
!
19•13
konieczność skompletowania pełnego wsadu
niemożność ingerencji w proces przetwarzania np. w
sytuacji wykrytych błędów
wydłużenie czasu oczekiwania na wyniki
© 2004, R. Robert Gajewski
Przetwarzanie transakcyjne
Przetwarzanie transakcyjne (interakcyjne) opiera się na pojęciu transakcji –
transakcja to zestaw danych, najczęściej rekord,
wymagający niezwłocznego przetworzenia
Cechy transakcji
!
!
!
!
20•13
transakcja wykonuje się w całości albo wcale
skutki wykonania transakcji nie naruszają systemu
transakcje są niezależne wobec siebie
zrealizowanie transakcji pozostawia trwały ślad w bazie
danych
© 2004, R. Robert Gajewski
Cechy...
Podstawowe cechy przetwarzania
transakcyjnego:
!
!
!
!
duża liczba współbieżnych użytkowników
duża wielkość baz danych mierzona w GigaBajtach
predefiniowane standardowe funkcje do obsługi
transakcji
duża liczba wykonywanych transakcji
Wady to:
!
!
!
21•13
niezbędna duża moc obliczeniowa systemu,
wrażliwość na awarie,
rozproszenie geograficzne
© 2004, R. Robert Gajewski
Przetwarzanie scentralizowane
Przetwarzanie scentralizowane - skupienie sił
i środków w jednym miejscu - centrum
przetwarzania danych - PROBLEM ZUS’u
!
!
!
22•13
prostsza organizacja pracy
ułatwiony sposób zarządzania zasobami
konieczność zgromadzenia danych i dużych mocy
obliczeniowych w jednym miejscu
© 2004, R. Robert Gajewski
Przetwarzanie rozproszone
Przetwarzanie rozproszone - rozśrodkowanie
sił i środków oraz dekoncentracja procesów
przetwarzania danych
!
!
!
!
23•13
wykorzystanie zasobów dostępnych w różnych węzłach
sieci - architektura klient-serwer
możliwość pracy w pobliżu źródła danych
kłopoty ze spójnością danych i wyników
konieczność koordynacji pracy i dodatkowe trudności
organizacyjne
© 2004, R. Robert Gajewski
Przetwarzanie współbieżne
Procesy współbieżne:
!
Proces P1 jest współbieżny z procesem P2, jeżeli jeden
z nich rozpoczyna się przed zakończeniem drugiego
System współbieżny to system, w którym
realizowane są procesy współbieżne.
Warunki pracy współbieżnej:
!
!
Istnieje więcej niż jeden moduł wykonawczy
W przypadku jednego modułu wykonawczego możliwy
jest podział czasu
Wyróżnia się dwa podstawowe rodzaje systemów
współbieżnych:
!
!
24•13
Wzajemnie niezależne
Współzawodniczące (wykorzystujące wspólne
zasoby)
© 2004, R. Robert Gajewski