BLOK 1

Transkrypt

BLOK 1
Mgr inż. Marcin Solka – [email protected]
BLOK 1
Wprowadzenie do przedmiotu, omówienie budowy sieci Internet i zasady działania
WWW. Wyszukiwanie informacji w Internecie. HTML. Strony statyczne i dynamiczne.
Cel przedmiotu
Celem przedmiotu jest przedstawienie sposobów udostępniania informacji w
Internecie, podstaw tworzenia stron WWW (statycznych i dynamicznych) oraz innych
pokrewnych zagadnień.
W dzisiejszych czasach informatyzacja obejmuje każdą dziedzinę życia, od wielkich
firm, gdzie działy IT są jednymi z potężniejszych, poprzez średniej wielkości firmy gdzie
komputer jest ważnym narzędziem pracy, aż po gospodarstwa domowe gdzie komputer coraz
częściej przestaje być tylko narzędziem zabawy a staje się również narzędziem pracy. W
dzisiejszych czasach coraz trudniej jest sobie wyobrazić firmę bez komputera, bez programu
księgującego, fakturującego, bez tworzenia i drukowania rozmaitych dokumentów,
wykorzystywania baz danych czy Internetu.
Kolejnym naturalnym krokiem jest wykorzystanie Internetu w codziennej pracy.
Komuś, kto raz spróbuje, trudno jest wyobrazić sobie życie bez poczty elektronicznej, która
prawie natychmiast dociera do adresata, bez nieprzebranych ilości informacji na praktycznie
każdy temat.
Duże firmy już kilka lat temu uświadomiły sobie, że strona WWW w Internecie, na
której można obejrzeć asortyment firmy, a nawet zamówić wybrane produkty jest
doskonałym uzupełnieniem normalnej sieci handlowej. Niektóre firmy poszły o krok dalej i
swoje produkty oferują tylko tą drogą. Coraz więcej średnich i małych przedsiębiorców
zauważa, że posiadanie dziś witryny firmowej, stało się nie tyle dodatkiem, co wymogiem
rynku. Na stronach instytucji rządowych coraz częściej oprócz informacji można wypełnić
rozmaite wnioski (o paszport, dowód osobisty, itp.), na stronach instytucji edukacyjnych
można się dowiedzieć o warunkach przyjęć, o wynikach egzaminów. Wreszcie nie brakuje
stron prywatnych tworzonych przez użytkowników Internetu, stron o rodzinie, hobby, religii,
fascynacjach, kraju, praktycznie na każdy temat znajdziemy coś w Internecie.
Liczba użytkowników Internetu rośnie w szybkim tempie, poprawia się jakość i
szybkość połączeń, tworzone są nowe standardy udostępniania informacji. Pierwsze strony
WWW były zwykłym tekstem z hiperłączmi, nie zawierały żadnej grafiki. Dzisiejsze strony
są kolorowe, aktywne, z obrazkami, dźwiękiem, cały czas powstają nowe technologie. W
ciągu najbliższych kilku lat Internet upowszechni się, stanie się takim standardem jak dziś
telefon czy telewizor. Już dziś przez Internet można załatwić większość spraw, zamówić
jedzenie, płacić rachunki, pracować, skończyć szkołę, itp.
Niestety stwarza to niebezpieczeństwo postępującej alienacji społeczeństwa. Już teraz
wiele osób traci kontakt z ludźmi, nie potrafi z nimi rozmawiać twarzą w twarz, tylko za
pośrednictwem sieci. Wielkim powodzeniem cieszą się w Internecie wszelkie komunikatory,
czaty, serwisy randkowe, które takim osobom potrafią zastąpić bezpośredni kontakt z innym
człowiekiem.
Inne zagrożenia związane z Internetem to wirusy, konie trojańskie, hakerzy, dialery,
różnego rodzaju naciągacze. W wielu krajach świata, m.in. w Polsce są specjalne komórki
Policji, stworzone do zwalczania przestępczości internetowej.
Internet stwarza nam wielkie możliwości, umożliwia błyskawiczny kontakt z ludźmi z
całego świata, daje dostęp do przeogromnych ilości informacji, ale z tego wszystkiego
powinniśmy korzystać z umiarem i ze świadomością czyhających niebezpieczeństw.
Zakres materiału
Podczas 25h trwania tego przedmiotu słuchacze poznają m.in.:
• Budowę sieci Internet i zasadę działania WWW. Efektywne wyszukiwanie informacji
w Internecie. HTML. Strony statyczne i dynamiczne.
• Programy do tworzenia stron w języku HTML (graficzne i tekstowe). Zasadę
tworzenia projektu witryny WWW
• Podstawy języka HTML, struktura dokumentu HTML, budowa statycznej strony
WWW. Szablony stron WWW. Czcionki, bloki, odsyłacze, wykazy, grafika i
multimedia, tabele, ramki, formularze. Umieszczanie na stronie plików w różnym
formacie
• Arkusze styli (CSS).. JavaScript - wzbogacanie strony o skrypty wykonywane po
stronie klienta. Dodawanie animacji Flash
• PHP, ASP i CGI jako skrypty wykonywane po stronie serwera. Budowa
dynamicznych stron WWW w technologii PHP
• Serwery WWW, charakterystyka, instalacja, konfiguracja, bezpieczeństwo
• FTP – umieszczanie stron na serwerze
W/w bloki programowe powinny zostać zrealizowane w ciągu 23h. Ostatnie 2h przewidziane
są na końcowe zaliczenie na którym trzeba będzie wykonać kompletną witrynę WWW opartą
na wybranym szablonie, wykorzystującą większość elementów poznanych na zajęciach.
Omówienie budowy sieci Internet i zasady działania WWW
Internet to globalna sieć komputerowa oparta na protokole komunikacyjnym TCP/IP
(ang. Transfer Control Protocol/Internet Protocol). Jest największa sieć komputerowa na
świecie, złożona z wielu tysięcy mniejszych sieci, łączy komputery na wszystkich
kontynentach. Internet powstał w USA z uruchomionej 1969 sieci ARPANET (początkowo
przeznaczonej do celów militarnych) oraz z utworzonej 1984 sieci NSFNET (pierwotnie
przeznaczonej dla ośrodków naukowych i szkolnictwa wyższego).
Informacje w Internecie są przesyłane w postaci tzw. pakietów o średniej wielkości
ok. 1500 bajtów; komputery włączone do Internetu (zw. węzłami sieci, ang. host)
są oznaczone wieloczłonowymi identyfikatorami liczbowymi (np. 140.186.81.1)
i
literowymi (np. pw.edu.pl), przy czym pierwsza część identyfikatora jest nazwą komputera, a
następne określają tzw. domeny (strefy), oznaczające instytucję, rodzaj instytucji (np. edu —
instytucja edukacyjna, gov — rządowa), ostatnia część identyfikatora zwykle oznacza
państwo (np. pl — Polska, uk — Wielka Brytania).
Internet stał się powszechnie dostępny 1990 (w Polsce 1993); liczba użytkowników
bardzo szybko rośnie (ok. 30 mln w 1996); korzystanie z Internetu wymaga uzyskania
połączenia operatorem świadczącym usługi dostępowe. Użytkownicy Internetu posługują się
na ogół komputerami osobistymi połączonymi z Internetem poprzez lokalną sieć
komputerową lub poprzez sieć telefoniczną i modem. Internet jest wykorzystywany głównie
do wyszukiwania i pozyskiwania informacji (np. z aktualnych serwisów informacyjnych,
katalogów bibliotek, tematycznych baz danych), udostępnianych przez instytucje i osoby
prywatne głównie w postaci stron hipertekstu zorganizowanych w system zwany World Wide
Web (WWW), zawierający także cyfrowe zapisy obrazów (np. fotografii), sekwencji
filmowych i dźwięku (hipermedia). Efektywne wyszukiwanie informacji umożliwiają
programy zwane przeglądarkami WWW (Netscape Nawigator, Microsoft Internet Explorer).
Często poszukiwane przez użytkowników oprogramowanie (typu freeware lub shareware),
zgromadzone w tzw. archiwach sieciowych, jest pobierane za pomocą usługi FTP (ang. File
Transfer Protocol), umożliwiającej przesyłanie poprzez Internet wszelkiego rodzaju plików.
Internet jest wykorzystywany bardzo często do przesyłania poczty elektronicznej; wymianę
informacji w grupach zainteresowań (tzw. grupy dyskusyjne) umożliwiają listy adresowe (list
wysłany do określonej grupy dyskusyjnej jest odbierany przez wszystkie osoby, które
zapisały się na jej listę adresową). Dialog pomiędzy użytkownikami Internetu umożliwia
program IRC (Internet Relay Chat), zapewniający jednoczesną łączność wielu osób. Internet
jest coraz częściej wykorzystywany do przesyłania głosu, a także obrazu rejestrowanego
przez podłączoną do komputera kamerę (funkcja wideotelefonu). Obecnie rozpowszechnia się
dokonywanie zakupów za pośrednictwem Internetu.
Powszechny dostęp do Internetu sprawia, że gromadzi się w nim znaczna ilość informacji
mało użytecznych lub mało wiarygodnych. Użytkowanie Internetu jest niekiedy utrudnione
wskutek niedostatecznie wydajnych urządzeń i technik telekomunikacyjnych.
Wyszukiwanie informacji w Internecie
Jak efektywnie poszukiwać informacji w Internecie? Wbrew pozorom nie jest to takie
proste zadanie, ponieważ liczba dostępnych stron WWW wciąż rośnie.
Na początku należy zdefiniować jakiego typu informacji poszukujemy i na tej podstawie
wybrać odpowiednie narzędzie do wyszukiwania.
Przeszukiwarki WWW (“search engines”)
Wyszukiwarki internetowe
Wyszukiwarki internetowe są uniwersalnym narzędziem, dzięki któremu możemy odszukać
każdą informację, ale przez swoją uniwersalność zbiory wynikowe mogą wynosić nawet po
kilka milionów trafień. Kluczem do efektywnego wyszukiwania za pomocą wyszukiwarki,
jest poznanie specyfikacji zadawania kryteriów wyszukiwania, stosowania znaków
specjalnych, operatorów, itp.
Funkcjonowanie wyszukiwarek można by opisać następująco: specjalny program
zwany robotem, lub pająkiem sprawdza zarejestrowane strony pod kątem występowania
określonych terminów podanych przy rejestracji strony w wyszukiwarce. Jeżeli jakiś
użytkownik wprowadzi do wyszukiwarki dane hasło, to otrzyma listę stron internetowych, na
których je znaleziono. Z tego powodu niezwykle istotne jest zarejestrowanie adresu swoich
stron internetowych w wyszukiwarkach. Wyszukiwanie jest usługą bezpłatną.
Najpopularniejsze wyszukiwarki to:
• www.google.com - wyszukiwarka Google (posiada wyszukiwarkę polskich zasobów:
www.google.pl)
• www.szukaj.onet.pl - wyszukiwarka Infoseek
• www.szukaj.interia.pl - wyszukiwarka Altavista
• www.yandex.pl - wyszukiwarka Yandex
• www.szukacz.pl - wyszukiwarka Szukacz
• www.altavista.com - wyszukiwarka Altavista
• www.chip.pl - wyszukiwarka NEToskop
Katalogi
Drugi sposób na znalezienie danego hasła oferują katalogi. Inaczej niż w przypadku
wyszukiwarek, gdzie o wprowadzaniu danych adresów i ich klasyfikacji decyduje mniej czy
bardziej inteligentne oprogramowanie, katalogi porządkowane są przez ludzi. Najczęściej
tworzy się kilkanaście kategorii głównych (np. polityka, sport, gospodarka), które dzielą się
na podkategorie (np. w przypadku gospodarki - firmy itp.), które z kolei mogą jeszcze
wielokrotnie dzielić się na podgrupy.
Popularne katalogi:
• http://katalog.wp.pl/
• http://www.hoga.pl/
• http:/www.onet.pl/
• http://www.yahoo.com/
• http://www.galaxy.com/
Metawyszukiwarki
Idea metawyszukiwarki polega na uruchomieniu operacji wyszukiwania przez kilka
zdefiniowanych przez nas lub ustawionych automatycznie serwisów wyszukujących
informacje. Uruchamiane są zarówno serwisy oparte o model wyszukiwarki jak i katalogu.
• Copernicus
http://www.onet.pl
• Search.com
http://www.search.com/
• MetaCrawler
http://www.metacrawler.com
• http://www.szukaj.com/
Portale
Portale powstały, by umożliwić użytkownikowi Internetu dostęp do wszystkich
interesujących informacji w jednym miejscu. Ogólnie rzecz biorąc pobranie jakiejkolwiek
informacji z sieci wymaga, z powodu uwarunkowanego technicznie długiego czasu
ładowania, odpowiednio długiego oczekiwania. Dlatego też strony, na których zgromadzono
sporą ilość informacji mają istotną przewagę nad innymi, wyżej wymienionymi sposobami
ich porządkowania. Każdy portal posiada wbudowaną wyszukiwarkę która pozwala, oprócz
przeszukiwania zasobów portalu, przeszukiwać także zasoby Internetu.
• http://www.onet.pl
• http://www.wp.pl
• http://www.interia.pl
• http://www.arena.pl
• http://www.ahoj.pl
• http://www.altavista.com/
Grupy dyskusyjne
Grupa dyskusyjna to miejsce gdzie można dokonać wymiany myśli i poglądów na określony
temat zgodny z nazwą grupy. Na określony serwer napływają posty uczestników grupy skąd
mogą być odczytywane przez wszystkich którzy mają na to ochotę. Czytanie listów nie musi
wiązać się z ich wysyłaniem tzn. można tylko czytać listy innych samemu nie wysyłając
swoich. Grupy dyskusyjne i ich archiwa są niewyczerpanym źródłem informacji na
praktycznie każdy temat.
•
Grupy dyskusyjne na serwerze Google
http://www.google.com/
• Grupy dyskusyjne na serwerze Topica
http://www.topica.com/
Encyklopedie internetowe
Pozwalają wyszukiwać znaczenia wyrazów, pojęć, zwrotów, itp.
• Onet - Wiem "http://wiem.onet.pl"
• Encyklopedia PWN "http://pwn.pl"
• Interia - Internautica "http://encyklopedia.interia.pl"
Katalogi biblioteczne “on-line”
Do wyszukiwania książek, czasopism, artykułów, itp., najlepsze są katalogi biblioteczne
• http://www.wsp.krakow.pl/biblio/adresy.html - zestawienie bibliotek w Polsce
• http://www.bn.org.pl/ - Biblioteka Narodowa
• http://193.59.172.222/wykaz.htm - Bazy Biblioteki Narodowej
Wyszukiwanie plików
Do wyszukiwania różnego rodzaju plików najlepsze są tzw. „źródła oprogramowania”, czyli
strony WWW z pokatalogowanymi plikami.
• Polskie Programy - http://polskie.programy.nom.pl/cgi-bin/main.cgi
• Tucows - ICM - http://tucows.icm.edu.pl/
• CHIP - http://download.chip.pl/
• PCWK – ftp - http://www.pcworld.pl/ftp/index.asp
• CNET – Shareware - http://shareware.cnet.com/
• Winsite - http://www.winsite.com/browse/
• SimtelNet i inne - kopia Cyfronet - http://www.cyf-kr.edu.pl/ftp/mirrors.html
Niewidoczny świat Internetu
Jeśli uważasz, że normalne wyszukiwarki zwracają za dużo informacji to i tak nie wiesz
wszystkiego. W rzeczywistości większość wyszukiwarek indeksuje tylko (wg. niektórych
danych) 16% zasobów dostępnych w sieci. Ale jest więcej informacji, danych, zasobów,
których wyszukiwarki nie wychwytują, a które można wykorzystać. Dzieje się tak dlatego, że
olbrzymia ilość informacji jest przechowywana w bazach danych i innych naukowych
zasobach, które są używane przez specjalistów z danej dziedziny.
Te zasoby, które są przeszukiwalne i dostępne on-line istnieją w wielkiej liczbie.
Znane są jako „invisible” (niewidoczna), „deep” (głębia), lub „hidden” (ukryta) sieć. Szacuje
się że objętościowo są one 500 razy większe niż przeszukiwalna „powierzchnia” Internetu.
Tak olbrzymia ilość danych stanowi potencjalne źródło informacji na praktycznie każdy
temat.
Można do nich dotrzeć albo poprzez bezpośrednie wpisanie adresu, albo poprzez strony które
są katalogami takich właśnie stron.
• http://www.completeplanet.com/
• http://www.mach9design.com/deep/index.html
•
•
•
http://infomine.ucr.edu/
http://www.profusion.com/
http://www.weblens.org/invisible.html
Efektywne wyszukiwanie
Aby efektywnie poszukiwać informacji w wyszukiwarkach, katalogach, portalach, grupach
dyskusyjnych należy przeczytać specyfikację wyszukiwania i sprawdzić:
• Jakie są używanie operatory logiczne (AND, OR, AND NOT, +, -, „”, itp.),
• Czy są akceptowane symbole zastępcze wieloliterowe (*) i jednoliterowe(?)
• Czy jest możliwe wyszukiwanie podciągów (części wyrazów)
• Czy rozróżniane są duże i małe litery
• Czy jest możliwy wybór języka stron wyszukiwanych
• Czy jest możliwy wybór pola (segmentu) strony: tytuł, nagłówek, odnośniki, tekst
Dopiero po poznaniu specyfikacji wyszukiwarki będziemy w stanie szybko znaleźć
interesującą nas informację. Dobrze zadane kryterium wyszukiwania powinno zwrócić nam
satysfakcjonujący wynik na pierwszej stronie (najczęściej na jednej stronie wyszukiwarki
prezentują 10-25 wyników wyszukiwania). Teoretycznie na początku powinny pojawić się
strony najbardziej odpowiadające naszym kryteriom, lecz czasem jest inaczej. Czasem na
początku pojawiają się linki sponsorowane, związane z tematem, ale niekoniecznie najlepsze.
Linki sponsorowane są zazwyczaj odpowiednio wyróżnione i zwykle nie jest ich więcej jak
dwa lub trzy.
HTML (HyperText Markup Language)
HTML to skrót od angielskiego Hyper Text Markup Language.
HTML jest językiem opisu strony, a nie wyglądu poszczególnych jej elementów.
W HTML'u zdefiniowany jest pewien określony zestaw stylów, używanych na stronach
WWW: nagłówki, akapity, listy i tabele. Dodatkowo zostały zdefiniowane również pewne
elementy formatowania znaków, jak np. pogrubienie. Każdy taki element posiada swoją
nazwę i występuje w formie czegoś, co zostało nazwane znacznikiem lub tagiem.
Znacznik HTML wskazuje, że dany element jest nagłówkiem bądź listą, ale nie określa jak
nagłówek ma być sformatowany. Autor musi się tylko martwić, który fragment ma być
nagłówkiem. Przeglądarka WWW, oprócz pobierania strony z sieci, wykonuje całą pracę
związaną z formatowaniem tekstu HTML. Przeglądarka po pobraniu pliku odczytuje
znaczniki, a następnie formatuje tekst i elementy graficzne oraz wyświetla je na ekranie.
Plik HTML zawiera następujące elementy:
• Właściwy tekst strony
• Znaczniki HTML, określające elementy strony, jej strukturę, sposoby formatowania i
hiperpołączenia do innych stron lub informacje innego rodzaju.
Większość znaczników wygląda tak:
<NazwaZnacznika> tekst </NazwaZnacznika>
Nazwa znacznika ujęta jest w nawiasy kątowe.
Każdy znacznik składa się zasadniczo z dwóch części: znacznika początkowego i końcowego
(który poprzedzony jest ukośnikiem '/').
Znacznik początkowy włącza pewien sposób formatowania, a końcowy go wyłącza. Nie
wszystkie znaczniki mają swój początek i koniec. Znaczniki nie są zależne od wielkości liter.
Jednak większość autorów pisze znaczniki dużymi literami, gdyż łatwiej je wychwycić w
tekście. Do rozpoczęcia pisania kodu HTML, nie są potrzebne żadne wyszukane narzędzia.
Wystarczy edytor tekstu i przeglądarka, aby móc sprawdzić wyniki pracy. W trakcie
przetwarzania strony przez przeglądarkę wszelkie próby formatowania dokonane ręcznie, to
znaczy dodatkowe spacje, znaki tabulacji, są ignorowane. Jedyną rzeczą wpływającą na
formatowanie strony są znaczniki HTML.
Strony statyczne i dynamiczne
Strony statyczne
Są to tradycyjne strony WWW, oparte na kodowaniu w języku HTML i CSS.
Mogą posiadać elementy graficzne, formularze, tabele, itp.
Czysty, statyczny kod HTML posiada następujące zalety:
• każda przeglądarka wyświetli go poprawnie;
• wiele urządzeń może go poprawnie wyświetlić;
• każde żądanie jest wykonywane szybko, przy użyciu niewielkich zasobów;
• HTML jest łatwy do nauczenia lub automatycznego wygenerowania;
• można szybko wprowadzić małe zmiany na pojedynczych stronach.
Oczywiście statyczny kod HTML posiada również ograniczenia:
• trudno kontrolować układ strony;
• nie skaluje się prawidłowo;
• nie jest interaktywny;
• nie radzi sobie z szybko zmieniającymi się danymi i personalizacją stron;
nie jest zbyt atrakcyjny.
Strony dynamiczne
Są to strony generowane przez skrypty internetowe (napisane w PHP, ASP czy CGI), które
najczęściej pobierają informacje z baz danych. Kodowane są w języku HTML i CSS,
zawierają elementy graficzne, aktywne formularze, wyszukiwarkę, itp.
Najbardziej użytecznymi zastosowaniami dla stron dynamicznych są:
• witryny informacyjne (zarówno do tworzenia, jak i oglądania);
• usługi dla grup (forum, tablica ogłoszeń);
• e-mail (poczta dzięki WWW, przesyłanie);
• systemy wsparcia technicznego i usług dla klientów;
• sieci reklamowe;
• aplikacje biznesowe dostępne dzięki WWW;
• książki telefoniczne;
• badania, ankiety, testy;
• wypełnianie i wysyłanie formularzy;
• personalizacja stron;
• oprogramowanie korporacyjne;
• katalogi, broszury, witryny informacyjne.
oraz każda aplikacja, która łączy serwer usługowy (baza danych, poczta, itd.) z WWW.
Korzystanie z technologii dynamicznego generowania stron WWW ma sens jedynie
wówczas, gdy oparty na nich serwis internetowy jest bardzo rozbudowany i często odwołuje
się do zmiennych danych. Strony statyczne, oparte na zwykłych znacznikach HTML, wciąż
pozostają najlepszym wyborem dla twórców niewielkich witryn domowych i korporacyjnych.
W obu przypadkach wciąż należy jednak pamiętać, że finalnie zawsze najważniejsza jest treść
- niezależnie od technik ją prezentujących.