Historia - Strona główna
Transkrypt
Historia - Strona główna
Internet strona 1 Historia Historia Internetu zaczęła się 29.9.1969 roku, kiedy to na Uniwersytecie Kalifornijskim w Los Angeles (UCLA), zainstalowano w ramach eksperymentu finansowanego przez zajmującą się koordynowaniem badań naukowych na potrzeby wojska agencją ARPA (Advanced Research Project Agency), pierwsze węzły sieci ARPANET. Pierwsza próba (uniwersytety w Los Angeles i Stanford) była raczej nieudana. Przesyłane było słowo (polecenie) „login”, przy literze „g” jeden z komputerów się zawiesił. Eksperyment miał zbadać możliwość zbudowania sieci komputerowej bez wyróżnionego punktu centralnego. Taka sieć mogłaby funkcjonować pomimo uszkodzenia pewnej jej części. Wszystkie istniejące do tej pory sieci zarządzane były przez jeden główny komputer, jego awaria pozbawiała możliwości pracy całą sieć. Sieć taka nie nadawała się do dowodzenia armią podczas wojny, gdyż taki główny węzeł sieci byłby oczywiście pierwszym celem ataku przeciwnika. Postanowiono więc wypróbować zaproponowaną kilka lat wcześniej przez RAND Corporation (instytucja związana z badaniami wojskowymi) koncepcję sieci rozproszonej. W ciągu dwóch następnych lat sieć była rozbudowywana, w pracach nad nią brała udział coraz większa liczba naukowców z różnych ośrodków. Trzeba było opracować konkretne aplikacje, umożliwiające wykorzystanie możliwości komunikacyjnych dawanych przez sieć. Jednym z pierwszych zastosowań było zdalne wykonywanie obliczeń na komputerach dużej mocy znajdujących się w innych ośrodkach. Sieć ta korzystała z protokołu TCP (Transmission Control Protocol) Wysyłane dane są rozbijane u nadawcy na pakiety, każdy pakiet zawiera identyfikator odbiorcy (adres IP) oraz kolejny numer pakietu, odbiorca składa otrzymane pakiety w całość. Pakiety mogą wędrować różnymi drogami, nie muszą docierać do odbiorcy w Internet strona 2 kolejności wysyłania. Usługę polegającą na przesyłanie wiadomości tekstowych pomiędzy komputerami wymyślił w roku 1971 Ray Tomlinson, wybrał on również znak @ do rozdzielania nazwy użytkownika od nazwy komputera. Językoznawcy za poprawne uznają formy e-mail oraz mejl. W 1973 został opracowany protokół FTP (File Transfer Protocol) służący do przesyłania plików. Agencja ARPA, która w 1972 roku zmieniła nazwę na DARPA (Defence Advanced Reseach Project Agency), zajmowała się (pośrednio, przez finansowanie) łączeniem mniejszych sieci o różnych sposobach przesyłania informacji. Rozwiązaniem były tzw. bramy sieciowe (gateway). Bramy sieciowe mogą pośredniczyć również między sieciami o różnych protokołach, obecnie są to protokoły IPv4 i IPv6. W protokole IPv4 adresy są 32 bitowe, na 32 32 bitach można zapisać 2 = 4 294 967 296 liczb, a protokole IPv6 adresy są 128 bitowe. Protokół opisujący współpracę różnych typów sieci nazwano internet (od internetworking). Powstała sieć łącząca uczelnie i ośrodki badawcze na całym świecie, w roku 1978 zmieniła ona nazwę na Internet. W 1989 roku fizyk i programista Tim Berners-Lee pracujący jako konsultant w Europejskim Centrum Badań Jądrowych (CERN) w Genewie zaproponował ogólnoświatowy projekt oparty na idei hypertekstu, nazwał go World Wide Web. Krótko potem stworzył pierwszą przeglądarkę, pierwszy serwer i pierwszą stronę WWW. http://info.cern.ch/ Ogólne zasady działania Internetu Internet to sieć ogólnoświatowa (metasieć) połączonych między sobą sieci korzystających z protokołu TCP/IP. Internet łączy używające różnych systemów operacyjnych komputery na całym świecie za pośrednictwem komputerów nazywanych ruterami (routers). Internet strona 3 Z Internetu możemy korzystać dzięki pośrednictwu dostawców usług internetowych (ISP – Internet Serwice Provider). Internet składa się z miliardów komputerów połączonych w sieci lokalne na całym świecie. Taka struktura ma wady i zalety. Zalety: • Niemożliwe jest załamanie całej sieci. • Niski koszt przyłączenia nowych użytkowników. Wada: • Przesyłane dane mogą „utknąć” na którymś z wielu węzłów, przez które przechodzą. Sposób przesyłania informacji: • Bloki informacji przesyłanych przez Internet są dzielone na wiele małych pakietów zaopatrzonych w adres odbiorcy i numer kolejny. Jeżeli odbiorca i nadawca są w tej samej sieci lokalnej, pakiet jest przesyłany bezpośrednio. W przeciwnym wypadku pakiet przechodzi przez lokalną bramę. • Pakiety danego bloku przesyłane są różnymi drogami. • Trafiająca do odbiorcy informacja jest rekonstruowana przez ponowne połączenie w całość pojedynczych pakietów na podstawie ich numeracji. • Protokół jest zbiorem konwencji określających sposób przesyłania danych między różnymi programami m. in. zasady wysyłania i odbierania pakietów danych oraz obsługę błędów. Protokół IPv4 wymaga, by każdy węzeł w sieci miał jednoznaczny i niepowtarzalny identyfikator (adres). Adres jest 32 - bitową liczbą zapisywaną jako cztery (ośmiobitowe) oddzielone kropkami liczby z zakresu 0 – 255, np. 128.114.143.4 zawierającą informacje o tym, do jakiej sieci włączony jest dany komputer oraz jego jednoznaczny adres w tej sieci. Wszystkie adresy w Internecie muszą być uzgodnione i zarejestrowane w Network Information Center (NIC) – w jednostce panującej nad porządkiem w światowej numeracji. Ponieważ nie przewidziano eksplozji liczby hostów w Internecie, Internet strona 4 przestrzeń adresowa protokołu IPv4 została wykorzystana do tego stopnia, że szybko zdano sobie sprawę z konieczności jej zastąpienia. Rozwiązaniem problemu braku wolnych adresów IP jest protokół IPv6 (nie jest on zgodny z IPv4). Rozmiar adresu w protokole IPv6 wynosi 128 bitów i umożliwia utworzenie 2 128 = 340 282 366 920 938 463 463 374 607 431 768 211 456 ∼ 3,4×10 38 adresów. Adresy IPv4 są zazwyczaj zapisywane w postaci 23.107.77.19 – cztery liczby z przedziału [0, 255] oddzielone kropkami. Adresy IPv6 są zapisywane w postaci 21DA:D3:0:2F3B:2AA:FF:FE28:9C5A – osiem liczb z przedziału [0,65535] zapisanych w układzie szesnastkowym oddzielonych dwukropkami. Ponieważ adresy IP są trudne do spamiętania, wprowadzono tzw. nazwy domenowe. Składają się one z ciągu słów rozdzielonych kropkami (może to być od 2 do 7 słów). Nazwy domenowe też mogą być trudne do spamietania: http://www.llanfairpwllgwyngyllgogerychwyrndrobwllllantysiliogog ogochuchaf.eu/ Obsługą tych nazw zajmuje się DNS (Domain Name Service) zamieniający nazwy domenowe na adresy IP. Adresy w Internecie mają postać: nazwa.com.pl pl – domena główna kraju, com – domena, do której należy komputer, nazwa – nazwa komputera unikalna w danej domenie. Zasady adresowania: • Adres musi być unikalny wewnątrz domeny głównej. • Adres nie musi być niepowtarzalny wśród wielu domen głównych (mogą istnieć serwery www.nazwa.com, www.nazwa.pl). • Adres wewnętrzny jest zależny tylko od serwera i może być powielany wewnątrz danej domeny (np. www.news.serwer.pl www.news.radio.pl). Internet strona 5 • Nazwy nie mogą zawierać innych znaków niż litery alfabetu angielskiego oraz cyfr. Nazwa nie może zawierać spacji i musi być krótsza niż 22 znaki. • W adresie nie rozróżnia się dużych i małych liter. Domeny główne dzielą się na: • Państwowe - dwuliterowe skróty od angielskiej nazwy państwa np. pl. Jest ich 240). • Podstawowe - organizacyjne. Obecnie istnieją między innymi następujące globalne domeny organizacyjne: com – organizacja komercyjna edu – instytucje naukowe i akademickie gov – organizacje rządowe int – organizacje międzynarodowe mil – instytucje wojskowe net – wszystko związane z samą siecią org – inne organizacje. Polska ma przydzieloną tylko jedną domenę pl, a jej jedynym właścicielem i zarządcą jest NASK (Naukowa i Akademicka Sieć Komputerowa – www.nask.pl). Usługi w Internecie Podstawowe usługi dostępne za pośrednictwem Internetu to: • WWW – (ang. web service) usługa polegająca na umożliwianiu użytkownikowi przeglądania dokumentów hipertekstowych sporządzonych w standardzie HTML. • Poczta elektroniczna (e-mail i grupy dyskusyjne). • FTP – protokół umożliwiający przesyłanie plików między komputerami. Internet strona 6 • Telnet – zdalne sterowanie komputerem. • Komunikatory internetowe (Gadu-Gadu, Tlen, IRC) – usługa umożliwiająca rozmowy między użytkownikami sieci „na żywo”. WWW to rozproszony system dostępu do dokumentów działający w sieci Internet. Powstał w 1991 r. w CERN (Europejskie Centrum Badań Jądrowych). WWW umożliwia dostarczanie i wyświetlanie hipertekstów tzn. dokumentów zawierających adnotacje będące łącznikami do innych dokumentów pomagających w zrozumieniu dokumentu macierzystego. Dokumenty WWW (strony) to pliki tekstowe, których zawartość jest interpretowana i udostępniana przez przeglądarki WWW. Do przeglądania WWW używany jest protokół HTTP (HyperText Transfer Protocol). Do tworzenia i łączenia dokumentów wykorzystywany jest język HTML (HyperText Markup Language). Przeglądarka – to zainstalowana na komputerze aplikacja, która jest wykorzystywana do wyświetlania stron WWW. Adresem dokumentu WWW jest tzw. URL (Uniform Resource Locator) np. http://bogdan.students.wmi.amu.edu.pl:80 lub file:///C:/strony%20html/students/public_html/index.html URL składa się z kilku części: • Pierwsza część (http, ftp, file) informuje przeglądarkę, jakiego użyć protokołu (rodzaj serwera). • Druga część identyfikuje serwer, na którym znajduje się wskazywany przez URL dokument. • Trzecia część (:80), to numer portu. Dla protokołu http numer można pominąć, domyślna wartość, to 80. • Czwarta część zawiera opcjonalną ścieżkę określającą jakiś konkretny zasób (plik). Serwer na ogół uzupełnia wpisany przez nas adres. Po adresie może jeszcze wystąpić tzw. referencja #chapter3. Zasada działania: • Adres URL wpisuje się w polu tekstowym przeglądarki. Internet strona 7 • Przeglądarka wysyła go do serwera DNS, który odsyła adres IP. • Serwery DNS są zorganizowane hierarchicznie, zapewne pierwszy odpytany serwer nie będzie znał adresu IP, będzie natomiast wiedział dokąd przekierować pytanie. Po odpytaniu kilku serwerów DNS poszukiwany adres IP dotrze do przeglądarki. • Dane trafiające do przeglądarki są zapisane w języku HTML. Przeglądarka przekłada ten język na wyświetlaną zawartość. Poczta elektroniczna. Najpopularniejsza chyba usługa w Internecie. Przyczyny tej popularności: • Niski koszt przesłania wiadomości. • Możliwość przesłania załączników. • Adresat nie musi być obecny w sieci. • Szybkość docierania wiadomości do adresata. Do wymiany poczty elektronicznej konieczne jest posiadanie skrzynki pocztowej (konta pocztowego). Adres poczty elektronicznej ma postać: nazwa_użytkownika@adres_serwera. Nazwa może składać się z kilku słów oddzielonych kropkami, a adres serwera może zawierać nazwy kilku domen np. [email protected] Spam – niechciana przez adresata wiadomość elektroniczna, rozsyłana masowo do przypadkowych odbiorców. Aby uniknąć spamu: • Nie należy publikować adresu e-mail bez potrzeby. • Przesyłając adres, można stosować opisowy format adresu użytkownik (at) domena. Za pośrednictwem listów elektronicznych przesyłane jest również złośliwe oprogramowanie (malware). Grupy dyskusyjne. Internet strona 8 Grupa dyskusyjna to zbiór wiadomości ogłaszanych przez użytkowników na serwerze grupy. Nadawca wysyła swoją wiadomość określonej grupie, gdzie wiadomość ta jest ogólnie dostępna. Wiadomości składowane są na dysku serwerów grup dyskusyjnych. Aby je odczytać, należy połączyć się z tymi serwerami za pomocą specjalnego programu - klienta tzw. czytnika grup dyskusyjnych (newsreader). Opisy polskich grup dyskusyjnych można znaleźć na serwerze http://www.usenet.info.pl/ Podstawowe grupy systemu Usenet: • comp – tematy związane z komputerami • sci - poświęcone dyskusjom naukowym • rec – wszystko, co dotyczy spędzania czasu wolnego, • soc – grupy poruszające tematy społeczne • news – tematyka z zakresu funkcjonowania systemu Usenet • talk – grupy debat na kontrowersyjne tematy • misc – cała reszta. Niektóre grupy są moderowane tzn., że wiadomości wysyłane do grupy są w niej umieszczane dopiero przez osobę zarządzającą grupą – moderatora. Wiadomości grupy dyskusyjnej łączone są w wątki. Wątek to ciąg wiadomości powiązanych ze sobą na zasadzie dołączania głosu do dyskusji na dany temat. Odpowiedź na czyjąś wiadomość można wysłać na grupę lub Internet strona 9 prywatny adres autora. Aby przeglądać wiadomości interesującej nas grupy, musimy ją subskrybować. Subskrypcją nazywa się dodanie grupy do grup monitorowanych przez program obsługi grup. Komunikatory internetowe. Komunikatory internetowe pozwalają prowadzić rozmowy na żywo, wysyłać krótkie wiadomości oraz śledzić obecność rozmówców w sieci. Do najpopularniejszych komunikatorów internetowych należą: • Gadu-Gadu • Tlen.pl • Skype • Czaty na stronach WWW. W każdym systemie istnieje wydzielony serwer, niejawny protokół i związany z nim na stałe program użytkowy. Konkurencją dla tradycyjnych komunikatorów staje się Jabber – uniwersalny protokół wymiany wiadomości między dwoma dowolnymi punktami w Internecie w czasie rzeczywistym. FTP (File Transfer Protokol) to protokół do przesyłania plików. Adres FTP ma postać: ftp://adres_serwera Niektóre przeglądarki mają wbudowane funkcje „ściągania” plików z serwerów. Natomiast aby umieścić dane na serwerze, konieczne jest użycie specjalnego programu. Przyjazne programy obsługujące protokół FTP, to FileZilla i WinSCP. Telnet. Telnet służy do zdalnego sterowania komputerem. Łączymy się z Internet strona 10 Internetem i możemy pracować w zdalny sposób na komputerze znajdującym się w innej części świata. Przeglądarki zwykle nie mają wbudowanego programu obsługi tego protokołu. Trzeba więc dysponować oddzielnym programem, np. telnet lub putty. Portale – wprowadzenie. Portal internetowy to rodzaj serwisu informacyjno-usługowego udostępniony użytkownikom przez Internet. Serwis kierowany jest do szerokiego grona odbiorców. Ma zapewnić dostęp do wielu usług internetowych z jednego adresu. Ma to zachęcić użytkowników, by ustawiali portal jako stronę startową w przeglądarce. Terminu „portal” używa się najczęściej w odniesieniu do platformy zdolnej zapewnić przez przeglądarkę łatwy dostęp do informacji w Internecie przez połączenie danych z wielu źródeł. Przykłady portali: • Yahoo! • AOL • MSN • Wirtualna Polska • Interia.pl Wortale. Idea kierowania aktualnych i pełnych informacji do szerokiego grona odbiorców nie zawsze się sprawdza. Był to jeden z powodów powstania wortali – czyli portali wyspecjalizowanych w jednej dziedzinie np. wortale filmowe, muzyczne, dotyczące gier, sprzętu RTV-AGD, udostępniające multimedia czy wyszukiwarki cenowe. Nazwa wortal (portal wertykalny, vertical portal) nie zdobyła popularności. Przykłady wortali: • filmweb.org – wortal o filmach, Internet strona 11 • youtube – umożliwiający użytkownikom dzielenie się filmami, • dailymotion – jw., • codeguru – oferuje użytkownikom artykuły i rozwiązania programistyczne, • allegro – wortal aukcyjny, • e-bay – jw., • ceneo - umożliwia znalezienie określonego produktu oraz sprawdzenie jego cen w różnych sklepach jednocześnie. Możliwości portali Portal daje zazwyczaj następujące możliwości dostępu do danych: • przeszukiwanie zasobów Internetu – wyszukiwarki przeszukujące dane zgromadzone w bazach portalu lub w dostępnych bazach przeglądarek, • obsługa poczty elektronicznej – proste programy stworzone na stronach www umożliwiające dostęp do konta pocztowego, • serwisy informacyjne – podają bieżące informacje z różnych dziedzin: aktualności z kraju i świata, prognozę pogody, notowania giełdowe, informacje kulinarne itp., • chat – pozwala na rozmowy on-line pomiędzy użytkownikami, • fora dyskusyjne – głosy w dyskusji przechowywane są w bazie danych, która ułatwia ich organizowanie (np. łączenie w wątki). By zachęcić użytkowników, portale oferują często również zarejestrowanym użytkownikom dodatkowe usługi: miejsce na własną stronę www, pobieranie plików, telewizję internetową. Budowa portali • Portal internetowy składa się z aplikacji portal i bazy danych. • Aplikacja portal ma wyświetlać informacje przechowywane w bazie danych oraz innych źródłach. • Portale zbudowane są modułowo w oparciu o technologię WebParts. Internet strona 12 • Technologia ta służy do tworzenia stron, które umożliwiają użytkownikom modyfikacje zawartości, wyglądu i zachowania strony z poziomu przeglądarki. • Baza danych portalu wykorzystywana jest również do przechowywania informacji o dokonanych przez użytkownika zmianach w sposobie wyświetlania informacji (personalizacja portali), dzięki temu po zalogowaniu się aplikacja portal jest w stanie odtworzyć (spersonalizowane) ustawienia użytkownika. Portale edukacji zdalnej Portale e-learningowe to systemy LMS wykorzystywane w procesie nauczania zdalnego przez Internet. LMS = Learning Management System (system zarządzania nauczaniem). Portale e-learningowe są aplikacjami sieci Web tzn., że są uruchomione na serwerze znajdującym się w jednostce edukacyjnej, a potencjalny uczeń, by z nich korzystać, musi posiadać komputer z dostępem do Internetu i zainstalowaną przeglądarką internetową. LMS są w większości produktami Open Source, co oznacza, że można z nich korzystać za darmo, a ich kod źródłowy jest udostępniany osobom zarządzającym platformą. Możliwości, jakie daje Open Source: • możliwość przeglądnięcia kodu (dzięki czemu można wykryć i usunąć błędy lub sprawdzić poprawność zastosowanych algorytmów), • możliwość poszerzenia funkcjonalności portalu, dostosowania go do własnych potrzeb, • możliwość szybszego i tańszego rozwoju oprogramowania, • uniezależnienie od jednego dostawcy oprogramowania. Obecnie istnieje wiele portali edukacji zdalnej i wciąż powstają nowe. Zapewniają one różne funkcjonalności i dążą do spełnienia jak najszerszych wymagań użytkowników. Popularne portale edukacji zdalnej to: • Moodle Internet strona 13 • Ilias • Caroline • Fle3 • LearnLoop • Genesha • LRN • Olat (Online Learning And Traning) Olat został napisany i jest rozwijany przez Uniwersytet w Zurychu. Olat jest darmowy, otwarty (open source) i wieloplatformowy (został napisany w wieloplatformowej Javie). Olat jest używany na Wydziale Matematyki i Informatyki UAM, jego adres internetowy to http://olat.dzienne.fmcs.amu.edu.pl:7080/dmz/. Wyszukiwanie informacji W Internecie istnieją trzy podstawowe narzędzia do wyszukiwania dokumentów i stron WWW: • Wyszukiwarki – programy pozwalające na wyszukanie potrzebnych informacji przy użyciu słów kluczowych. Materiał jest prezentowany w postaci hiperłączy do zasobów. Termin wyszukiwarka oznacza również strone internetową serwisów wyszukujących, czyli pośrednika między oprogramowaniem wyszukującym a użytkownikiem. Kilka bardziej znanych wyszukiwarek: Yahoo! 1994 http://pl.yahoo.com/, AltaVista 1995 http://www.altavista.com/ nie ma (już) wersji polskiej, Google 1996 http://www.google.pl/, Baidu 2000 http://www.baidu.com/ chińska wyszukiwarka, Szukacz 2001 http://www.szukacz.pl/ przestała działać w roku 2011, Bing 2009 (wcześniej MSN Search i Windows Live Search), www.bing.com/ nie ma wersji polskiej. Internet strona 14 • Multiwyszukiwarki – nowe narzędzia do wyszukiwania informacji w Internecie. Korzystając ze specjalnego oprogramowania, multiwyszukiwarka „zatrudnia” kilka wyszukiwarek i przeszukuje kilka katalogów tematycznych. Ponieważ multiwyszukiwarki korzystają z różnych wyszukiwarek nie jest możliwe formułowanie w nich bardziej złożonych zapytań. • http://razdwatrzy.com/, • http://www.dogpile.com/info.dogpl.t3.2/search/home , • http://www.search.com/, • http://www.all4one.com/, • http://lookahead.surfwax.com/index-2011.html. • Katalogi tematyczne – katalogi stron WWW. Podobnie jak wyszukiwarki składają się z bazy danych oraz programu wyszukującego. Różnica polega na sposobie gromadzenia informacji. Katalogi tematyczne są zarządzane przez ludzi, którzy decydują o umieszczeniu danych informacji w którejś z kategorii tematycznej. • http://hoga.pl/, • http://www.dmoz.org/ (dmoz=Directory Mozilla). Zasady formułowania zapytań: • Podawanie większej liczby słów kluczowych, które tematycznie związane są z wyszukiwanym zagadnieniem. • Stosowanie wyrażeń, czyli kilkuwyrazowych grup wyrazów ujętych w cudzysłów np. „modele samochodów”. • Poprzedzanie wyrazów lub fraz znakiem +, gdy muszą pojawić się na szukanej stronie lub - , gdy nie powinny np. +ryby -słodkowodne. Powyższą informację można znaleźć np. w wyszukiwarce Google http://www.google.pl/advanced_search. Wyszukiwanie hasła ryby lub +ryby daje około 49 500 000 wyników, wyszukiwanie hasła +ryby -słodkowodne daje około 57 600 000 wyników, wyszukiwanie hasła +ryby -ryby daje 0 wyników. • Operatory logiczne: • podatek AND rodzina, strony zawierające oba słowa równocześnie, • podatek OR rodzina, strony zawierające jeden lub drugi wyraz, • „jednorazowe opakowania” NEAR ekologiczne - strony zawierające pierwsze wyrażenie blisko drugiego, co dokładnie Internet strona 15 znaczy „blisko” zależy od wyszukiwarki, • (systemowe OR narzędziowe) AND oprogramowanie - strony zawierające wyrazy oprogramowanie oraz jedno słowo spośród systemowe, narzędziowe. Operatory szukania zaawansowanego w wyszukiwarce Google: • link: wyświetlenie listy stron zawierających linki do wskazanej strony, przykład link:www.google.com, • related: wyświetlenie listy stron „podobnych” do wskazanej, przykład related:www.google.com, • info: wyświetlenie informacji o danej stronie, • intitle: wyświetlenie stron, które szukane słowo zawierają w tytule, intitle:wyszukiwarka google, słowo wyszukiwarka musi być w tytule, słowo google gdziekolwiek, • allintitle: wszystkie podane słowa muszą być w tytule, • inurl: podane słowo musi być w adresie zamieszczonym na stronie, • allinurl: wszystkie słowa muszą być w adresach, • intext: szukane słowo musi być w tekście strony, • allintext: wszystkie szukane słowa muszą być w tekście.