Zasoby informacyjne - Technologie Informacyjne

Transkrypt

Zasoby informacyjne - Technologie Informacyjne
Zasoby informacyjne
Dotkliwie odczuwa się
nadmiar wiedzy
TMI (too much information)
przy równoczesnym
niedoborze mądrości.
Antoni Kępiński
Jesień 2015
http://pennystocks.la/internet-in-real-time/
Ocenia się, że ilość danych
wytworzonych przez człowieka w
ciągu ostatnich dwóch lat (20112013) przewyższyła ilość informacji
wyprodukowanych do tego momentu
w całej historii ludzkiej cywilizacji.
co dwa dni nasza cywilizacja wytwarza tyle danych,
ile cała ludzkość wyprodukowała od początku swoj
ego istnienia do roku 2001. Zgromadziliśmy już
3,2 zetabajtów danych (1 zetabajt to miliard
terabajtów), a objętość wszystkich zapisanych na
świecie
informacji podwaja się średnio co 18 miesięcy.
WWW.PCWORLD.PL PAŹDZIERNIK 2015
http://www.emc.com/leadership/digital-universe/2014iview/it-imperatives.htm
2020 r. - 44 zettabajtów
• Podobnie jak w przypadku fizycznego
wszechświata, wszechświat cyfrowy jest
ogromny - do 2020 roku będzie zawierał
prawie tyle bitów cyfrowych, ile jest gwiazd
we wszechświecie.
• Podwojenie wielkości co dwa lata, 2020
cyfrowy wszechświat - 44 zettabajtów,
http://www.emc.com/leadership/digital-universe/2014iview/it-imperatives.htm
Cyfrowy kosmos
http://www.emc.com/leadership/digital-universe/2014iview/it-imperatives.htm
Selekcjonować informacje
• współczesny człowiek za pośrednictwem poczty
elektronicznej, usług internetowych, telewizji, radia i
innych mediów zalewany jest potokiem
informacyjnym o wielkości ponad 100 tysięcy słów dziennie. Taki zalew informacji
może mieć negatywne skutki dla naszych umysłów.
• Konieczność przetworzenia coraz większej ilości
danych z otoczenia zaburza inne procesy poznawcze,
wpływa na umiejętność nawiązywania kontaktów,
separując społecznie atakowanych informacjami
ludzi, powoduje też osłabienie zdolności koncentracji.
GRUDZIEŃ 2014 CHIP.PL
Luka pomiędzy wolumenem informacji a
zdolnością do podejmowania decyzji
W. Abramowicz, P.J. Kalczyński, K. Węcel, Filtering the Web to Feed Data
Warehouses, Springer Verlag, Londyn 2002, za:
Zapewnienie bezpieczeństwa przez semantyczne monitorowanie cyberprzestrzeni Witold Abramowicz, Elżbieta
Bukowska, Agata Filipowska, http://www.e-mentor.edu.pl/artykul/index/numer/50/id/1017
http://www.archive.org/
150 miliardów stron
The Internet Archive – cyfrowa biblioteka
internetowych stron i innych kulturowych
wytworów w postaci cyfrowej.
Informacja – fundament komercji
w Sieci
• towarem jest informacja:
– każda (any),
– wszędzie (anywhere),
– zawsze (anytime).
• Internet zdominował sprzedaż detaliczną
informacji.
Informacja
• Informacja jest kategorią ekonomiczną, będąc - obok
ziemi, pracy i kapitału, a także kapitału ludzkiego jednym z czynników wytwórczych.
• Jest ona postrzegana jako zasób ekonomiczny,
czynnik produkcji, produkt, towar, dobro
konsumpcyjne, element infrastruktury gospodarki i
dobro publiczne. Należy ją więc traktować jako dobro
mające wartość rynkową i stanowiące w związku z
tym przedmiot rynkowego systemu wymiany.
Otwarte zasoby edukacyjne jako przejaw altruizmu w gospodarce, czyli ekonomii daru
Anetta Janowska, Anna Kania, http://www.e-mentor.edu.pl/artykul/index/numer/50/id/1017
Zasoby informacyjne Sieci
• Zarysowuje się brak równowagi między narzędziami
umożliwiającymi korzystanie z Internetu, a oferowanymi
tam zasobami informacyjnymi i usługami (rafinacja
informacji sieciowych).
• Sieciowe zasoby zazwyczaj są szczególnie cenne
ze względu na ich aktualność i możliwość szybkiego
i powszechnego do nich dostępu.
• Wiedza o tym potencjale ma kapitalne znaczenie
w obszarach społeczno-ekonomicznym oraz nauki
i edukacji.
• W odniesieniu do mediów zasoby informacyjne są
wartościowym źródłem informacji backgroundowych
i bieżących oraz kontroli poczynań konkurencji.
Wiarygodność informacji
sieciowych
• Nawet niewielka część nieprawdziwych danych
w wyróżnionym zasobie czyni jego całość mało
wiarygodną.
• Stwarza to ryzyko, często bezkrytycznego,
wykorzystywania mało wartościowego informacyjnego
potencjału Internetu.
• Mamy do czynienia z paradoksem, iż „nieograniczonemu
dostępowi do informacji towarzyszy ryzyko uzyskiwania
mniejszej wiedzy”.
• Współczesne technologie informacyjne istnieją bez
odpowiednio wykształconych ram, w postaci struktur
wartości i wzorców mających wpływ na sieciowe zasoby.
• Ramy te nie mają stosownych związków z regulacjami
prawnymi oraz instytucjonalnymi strukturami.
Wiarygodne anglojęzyczne
źródła informacji
•
•
•
•
•
•
•
•
•
Bureau of the Census — dane demograficzne i ekonomiczne
Rand Corporation — edukacja, ubóstwo, przestępczość, środowisko
naturalne i bezpieczeństwo narodowe
Pew Charitable Trusts — Internet w USA, opinia publiczna, klimat
globalny, oceany, dziennikarstwo, Hiszpański i inne
MacArthur Foundation — globalne bezpieczeństwo i stabilizacja,
humanitaryzm, problematyka społeczna
JupiterResearch — biznesowe wykorzystanie Internetu i pokrewnych
technologii
The Gallop Organization — zachowania konsumentów, problematyka
samochodowa, usługi biznesowe, edukacja, usługi finansowe, służba
zdrowia, sprzedaż i produkcja
BizMiner — marketing i finansowe profile w 16 000 biznesowych kategorii
w USA
First Research — przemysłowe profile i ekonomiczne profile państw
CIA – (http://www.cia.gov/cia/publications/factbook/) - dane o wszystkich
krajach świata, od lokalizacji po średnią długość życia.
Eliminowane są szczeble pośrednie
wędrówki informacji od twórcy
do odbiorcy
• W odniesieniu do tradycyjnych – papierowych publikacji,
z jednej strony spowalniały przepływ informacji, z drugiej
natomiast czyniły je bardziej wyważonymi, ze znacznie
mniejszym ryzykiem upowszechniania informacji
niesprawdzonych, niewiarygodnych.
• W efekcie dużego kredytu zaufania, jakim obdarzono
zasoby informacyjne online, nastąpiło redukowanie
lub wręcz wyeliminowanie pośredników na drodze
informacji od „producenta” do odbiorcy.
• Konsekwencja - problem ogromnej liczebności
i wiarygodności źródeł online - nazwany przez R.
Tadeusiewicza „smogiem informacyjnym”.
Ograniczenia „smogu”
• Korzystanie ze stron internetowych o powszechnie
akceptowanej wiarygodności, o wysokich ocenach
nadawanych przez uznane autorytety. Ich właścicielami
są zazwyczaj instytucje o dużym prestiżu. Innym
sposobem uwiarygodniania są:
– społeczna, środowiskowa akceptacja źródeł, których wyraz
stanowi liczba i częstotliwość powoływania się na te źródła
przez uznane autorytety, np. w świecie nauki,
– porównywanie informacji z różnych niezależnych źródeł
sieciowych,
– korzystanie z komercyjnych zasobów informacyjnych
oraz stron urzędów biorących udział w tworzeniu prawa
i generujących raporty na potrzeby państwa.
Wiarygodne źródła informacji w Sieci
• strony ministerstw, rządu i innych agencji
biorących udział w tworzeniu prawa i
generujących raporty na potrzeby państwa;
• komercyjne źródła informacji tematycznych (np.
D&B);
• źródła informacji eksperckiej;
• firmy zajmujące się badaniem rynku serwisy
biblioteczne;
• agencje informacyjne;
• dystrybutorzy specjalistycznych materiałów
informacyjnych (w tym biznesowych).
GIODO
• Wyszukiwanie
Funkcja "Wyszukiwanie" umożliwia wyszukiwanie zbiorów
w prowadzonym przez GIODO ogólnokrajowym rejestrze zbiorów
danych osobowych, według kryteriów podstawowych do których
należą: nazwa administratora danych, nazwa miejscowości, nazwa
zgłoszonego zbioru, numer księgi rejestrowej oraz numer
zgłoszenia.
• Wyszukiwanie zaawansowane
Funkcja "Wyszukiwanie zaawansowane" umożliwia przeszukiwanie
rejestru według kryteriów rozszerzonych, do których należą: nazwa
administratora danych, siedziba administratora (nazwa
miejscowości, nazwa ulicy, kod pocztowy, REGON, nazwa
zgłoszonego zbioru, numer księgi rejestrowej oraz numer
zgłoszenia).
Ustawy, dzienniki urzędowe
• Od 1 stycznia 2012 tylko w wersji
elektronicznej.
• Nieodpłatnie z Rządowego Centrum
Legislacji.
Wiarygodne źródła informacji
• Informacje o prawie uniijnym Eurlex.europa.eu/plindex.htm
• Informacje o zamówieniach publicznych
• Wyszukiwarka firm wpisanych do KRS –
pdi.cors.gov.pl/KRSSED
• Rejestr zlikwidowanych firm:
www.zus.pl/default.asp?p=4&id=582
Rankingi, nagrody - wiedza
o zasobach informacyjnych
• Są to na przykład witryny:
CheckPageRank, Alexa i Page Rank
Google.
• Nagrody, na przykład nagroda Pulitzera
nadawana materiałom publikowanym
online.
Handle System - inicjatywa
Wspólnoty Europejskiej
• Umożliwia wyszukiwanie aktualnych i wiarygodnych danych
dotyczących UE.
• Wykorzystywany w nim Digital Object Identifiers (DOI) jest
standardową metodą identyfikowania publikowanych cyfrowo
informacji.
• Official Publications of the European Communities (OPOEC)
zawiera 60 serwisów z 1700 tytułami. Informacje o tych zasobach
ukazują się dwa razy dziennie w specjalnym piśmie, w dwudziestu
językach Wspólnoty.
• CrossRef (www.crossref.org) – strona wskazująca linki publikacji
naukowych do cytowanych dzieł, co stanowi formę gwarancji
wiarygodności przywoływanych źródeł.
• Content Directions (CDI) – stosowne referencje, w tym adresy stron
dotyczące określonego tematu.
Otwarte zasoby – motyw sieci,
altruizm w sieci
• Zjawisko obdarowywania przypisywano głównie
społeczeństwom archaicznym, prymitywnym.
• Kultura daru praktykowana jest również współcześnie.
• Internet ze względu na swój otwarty charakter oraz
powszechność i niski koszt narzędzi ułatwiających
użytkownikom tworzenie treści, umieszczanie ich w sieci i
przesyłanie, stał się polem wymiany dóbr informacyjnych,
takich jak produkty kultury: muzyka, filmy, książki, a także
oprogramowanie i gry komputerowe oraz zasoby naukowe i
edukacyjne.
Otwarte zasoby edukacyjne jako przejaw altruizmu w gospodarce, czyli ekonomii daru
Anetta Janowska, Anna Kania, http://www.e-mentor.edu.pl/artykul/index/numer/50/id/1017
Dane otwarte, Open Data
• „Mapa drogowa otwartego rządu w Polsce"
przygotowana w lipcu 2011 roku przez Centrum
Cyfrowe Projekt: Polska.
• Dokument udostępniony zgodnie
z zasadami wolnych licencji opisuje idee otwartego
rządu, jako „nowego paradygmatu w stosunku do
koncepcji elektronicznej administracji, obowiązującej
dotychczas jako koncepcja podstawowa".
Open Data – przykłady
• Sejmometr.pl, czyli nie tylko zbiór otwartych danych
publicznych, ale też narzędzia do komunikacji z rządem,
takie jak serwis.
• MamPytanie.net.
• Mżliwość tworzenia planów podróży komunikacją
miejską (JakDojade.pl).
• Serwis pogodowy, jak dzieje się w innych krajach.
Niestety.
• Stowarzyszenie Liderów Lokalnych Grup Obywatelskich wykazało realne
trudności i problemy, jakie można napotkać podczas prób ponownego
wykorzystania informacji publicznych.
CHIPPL CZERWIEC 2013
10 ZASAD KORZYSTANIA Z „OTWARTYCH
DANYCH"
•Troska o kompletność
danych.
•Udostępnianie danych
podstawowych
•Udostępnianie danych
bieżących
•Dostęp do danych bez
dyskryminacji
•Zapewnienie dostępności
danych
•Umożliwienie
przetwarzania maszynowego
•Stosowanie
niezastrzeżonych formatów
•Udostępnianie danych bez
zbędnych licencji
•Trwałość danych
•Zapewnienie możliwości
wyszukiwania danych
CHIRPL CZERWIEC 2013
Portale Open Data
•
•
•
•
•
opendata.paris.fr
www.data.gouv.fr
www.dati.piemonte.it
www.data.overheid.nl
data.gov.uk
Komercyjne zasoby informacyjne
• Popularne archiwum treści gazet,
magazynów, aktów prawnych
i innych źródeł drukowanych
• Księgarnia internetowa
Lexis + Nexis
Dwie osobne strony internetowe:
• Lexis.com – informacje prawne
• Bezpieczne przechowywanie danych
• Dostęp do zasobów sadowych
• Nexis.com – biznes i artykuły prasowe
• Teksty od 1970 r.
Sposoby korzystania
z serwisów Lexis
•
•
•
•
Wykupienie abonamentu dla firmy
Uaktywnienie hasła przez SMS
Korzystanie z księgarni internetowej
Specjalne oferty dla studentów
LexisNexis w Polsce
• LexPolonica – największy serwis
prawniczy na rynku
• Serwis kadrowy
• podatkowy
• nieruchomości
• biznesowy
• akademicki
TeleAdreson
• Zbiór danych o niemal milionie firm
w Polsce.
• Poszukiwany podmiot można wybrać
zgodnie z katalogami kategorii aktywności
biznesowej (NACE (EKD) lub/i SIC).
• TeleAdreson umożliwia rozwinięcie owych
kategorii i wybranie tej, która obejmuje
zakres aktywności poszukiwanej firmy.
Interia.pl
• Oferuje swoją własną bazę, zasoby
TeleAdresonu, Kompassa i Katalog firm
Getin.
• Interia umożliwia wyszukiwanie danych
o firmach także według informacji
dokładniejszych (zatrudnienie, obroty, rok
założenia).
Kompass
• Globalny serwis informacyjny, informacje o 4 mln firm
z ponad 70 krajów (2012 rok).
• Przeszukiwanie setek tysięcy kluczowych produktów
i usług oraz ponad trzy miliony nazwisk osób pełniących
ważne funkcje w firmach.
• Kompass umożliwia, w ograniczonym zakresie,
bezpłatne korzystanie z następujących informacji:
produkty/usługi, nazwy firm/handlowe, przegląd
geograficzny (cały świat, regiony lub kraje), listy firm,
profile firm (niepełne profile zawierają tylko dane
kontaktowe).
• Komercyjna oferta: listy firm (z numerami telefonów
i faksów), pełne profile firm, sortowanie listy firm (kryteria
sortowania to m.in. liczba zatrudnionych osób, wielkość
obrotu/przychodu ze sprzedaży, dane finansowe).
Dun & Bradstreet
• Informacje z ponad 220 mln firm, z ponad 200
państw i 95 stref językowych (2012 rok).
• Każdego dnia wprowadza się około milion
aktualizacji – przede wszystkim i najdokładniej
z miejsca powstania firmy – z USA.
• Ponad 160-letnie doświadczenia stanowią
o profesjonalizmie oferty tej firmy.
• Ma ona także swój oddział w Polsce
(www.dnb.com.pl).
Raport –
podstawowa forma udostępnianej
przez Dun & Bradstreet informacji o firmach
• dane identyfikacyjne (nazwa, adres itp.);
• ocena wykonana przez Dun & Bradstreet, a w tym opinia o kondycji
firmy (np. „raczej słaba” zdolność finansowa);
• podstawa wydanej oceny; dane rejestrowe (forma prawna, data
założenia, NIP itp.); kierownictwo; struktura własności; działalność
według klasyfikacji branżowej; partnerzy handlowi; nieruchomości;
zatrudnienie (łącznie z ilustracją graficzną w ostatnich dziesięciu
latach);
• banki obsługujące;
• powiązania kapitałowe; dane finansowe – sprzedaż w ostatnich
latach;
• zysk/strata, sprawozdania finansowe; historia; informacje prasowe;
• użytkownicy chętnie korzystają z możliwości wybierania tylko
niektórych informacji z raportu o ocenianej firmie – koszt
uszczuplonego raportu jest wówczas odpowiednio mniejszy.
Podobne do Kompassa
i Dun & Bradstreet serwisy
• Francja
• Niemcy
• Anglia
- Delphes,
– Hoppenstedt,
– ICC.
Dialog od 1972
• Zawiera setki baz danych, takich jak
na przykład Kompass czy Dun & Bradstreet.
• Niemal 600 baz danych.
Narzędzia Dialogu
• Wzór wyszukiwarki
• Wstępna obróbka odszukanych informacji
(np. sortowanie według specyficznych kryteriów)
oraz wyboru najbardziej odpowiadającego
poszukiwaniom formatu wyświetlania danych.
• Formatem może być dowolna część danych
określonego dokumentu (np. nazwa firmy, adres,
obroty, tytuł).
• Różne formaty mają inne ceny, a zatem można
zmierzać do kompromisu między ceną,
a zakresem uzyskanej informacji.
Na wielkość opłaty za uzyskane
informacje składają się dwa elementy
• Czas, w jakim jest przeglądana określona
baza, i ilość pobranej informacji.
• Ta zasada jest uniwersalna i dotyczy
wszystkich baz.
Zasoby Dialogu
• Na wstępie wędrówki po zasobach Dialogu pomagają tzw. kartki –
przewodniki po bazach.
• Są ich trzy rodzaje, najważniejsze z nich to Bluesheets (BS) –
dotyczą one baz zbudowanych samodzielnie przez Dialog.
• BS-y są precyzyjnymi informatorami o formacie i zawartości każdej
bazy. Zawierają dokładne wytyczne o sposobie poszukiwania
informacji, opis bazy, wyróżnione w niej pola, częstotliwość
aktualizowania danych, źródła danych oraz przykład postaci rekordu
w danej bazie.
• Najważniejszą częścią BS-ów jest jednak instrukcja dotycząca
możliwości i sposobu wyszukiwania informacji.
Thomson Research - Investext
• Największa światowa baza danych zawierająca
ekspertyzy, wyniki badań firm i branż (10 milionów
dokumentów) z całego świata. 4000 nowych raportów
każdego dnia.
• Pełne teksty zawierają raporty o branżach (np. przemysł
wydawniczy w Polsce), które zostały wypracowane przez
ekspertów z 1000 uznanych banków, brokerów i firm
konsultingowych na całym świecie (2012 rok).
• Raporty te są nadzwyczaj użyteczne w badaniach
rynkowych, marketingowych, w opracowywaniu
strategicznych planów, analizie konkurencji
i finansowych prognozach.
Zakres informacji serwisu
informacyjnego Dialog
•
•
•
•
•
•
•
•
•
•
•
•
informacje o firmach na świecie – katalogi i dane finansowe
informacje o gałęziach przemysłu – trendy, oceny, badania marketingowe
i specjalistyczne wiadomości branżowe wraz z raportami
Międzynarodowe, bieżące wiadomości z agencji informacyjnych i gazet od USA
do Azji
wiadomości administracji USA, łącznie z danymi o problematyce publicznej, prawie
i innych ważnych regulacjach
patenty i znaki towarowe w skali świata
chemia, badania podstawowe, nauka i technologia
informacje ogólne: ludzie, książki, wiadomości dla konsumentów i podróżujących
informacje farmaceutyczne, medyczne i dotyczące opieki zdrowotnej
informacje o firmach europejskich (łącznie z Polską) – katalogi i dane finansowe
wiadomości lokalne ekonomiczne, polityczne i biznesowe z całej Europy, bieżąca
i archiwalna legislacja w ramach UE
raporty – pełne teksty informacji o państwach, firmach i rynkach, informacje opisujące
przemysł samochodowy i spożywczy – biznes i technika
Bezpłatne informacje
teleadresowe
• Panorama Firm (www.pf.pl),
• Polskie Książki Telefoniczne (www.pkt.pl),
• www.pf.pl, www.bazafirm.pl.
World Email Directory (WED)
M.in. informacje o miliardzie adresów
mailowych.
The European Business
Directory
• 600 000 największych firm z 30 państw
• Agriculture & livestock
Energy & raw materials
Banking & finance
Food & related products
Information Technology
Marketing, Advertising & the Media
Chemicals and pharmaceuticals
Telecommunications industry
Transport Services
Zasoby naukowe i
multiwyszukiwarki
• Google Scholar, OAIster, OpenDOAR;
Academic Index
• multiwyszukiwarki: Goshme, Trovando.
Dane o osobach
• Dostępne we wszelkiego rodzaju katalogach
typu Who is Who (np. obecny w Dialogu –
Marquis Who’s Who®).
• Social networking - SoFlow.com – miejsce
w wirtualnym świecie, które pomaga odszukiwać
osoby mające wspólne zainteresowania,
usiłujące nawiązać współpracę na płaszczyźnie
prowadzenia interesów (partnerzy, inwestorzy,
kontakty). Jest to rodzaj aukcji skrzyżowanej
z blogiem, gdzie przedmiotem są osoby.
Clickz.com
•
•
•
•
•
•
•
•
•
•
ClickZ News: informacje z ostatniej chwili, aktualne wiadomości i analizy,
ClickZ Experts: komentarze, opinie, rady,
ClickZ Stats: fakty, wyniki badań i dane dotyczące IT na świecie,
ClickZ Features: dane o firmach, branżach, analizy, trendy i przegląd
literatury przedmiotu,
Serach Engine Watch: bieżące wiadomości, analizy dotyczące problematyki
wyszukiwania informacji w Internecie,
ClickZ Resources: informacje o zasobach Sieci,
E-Mail Reference: bogate archiwum dotyczące marketingu mailowego i
bieżących doniesień w tej tematyce,
SEM Archives: zasoby dotyczące marketingu z wykorzystaniem szperaczy,
Events: komunikaty o konferencjach, seminariach organizowanych przez
clickZ i inne firmy,
ClickZ Marketing Excellence Awards: wyniki własnych rankingów
dotyczących technologii, firm związanych z IT.
Wikipedia
• Wirtualną encyklopedię powołali do życia
15 stycznia 2001 r. Jimmy Wales i Larry
Saneer.
• Obsługiwana przez 378 serwery w 2
centrach
• 17 mln artykułów – 3,5 – UK; 0,8 – PL
• 286 edycji językowych
SIERPIEŃ 2013 CHIP.PL
Wiki PL
• Trzon polskiej Wikipedii tworzy
około 2000 najaktywniejszych autorów.
• Nad działaniem portalu czuwa
168 administratorów, posiadających
szczególne uprawnienia i mogących na
przykład całkowicie usuwać cudze
artykuły.
Chip IV.2011
WWW.PCWORLD.PL MAJ 2014
Wikipedia, wiki
• Dynamicznie rozwijający się ogólnoświatowy zasób informacyjny
w postaci encyklopedii (dwanaście razy większa od Encyklopedia
Britannica, zawiera trzy miliony artykułów w 200 językach).
• Cel stworzenie największej wielojęzycznej, dostępnej dla wszystkich
encyklopedii.
• Autorem jej haseł może być każdy. Stanowi to o coraz bardziej
podkreślanej, dyskusyjnej wartości merytorycznej tego typu zasobu
informacyjnego.
• Eksperci nauk przyrodniczych stwierdzili porównywalną liczbę
błędów w encyklopedii brytyjskiej (123) i Wiki (162).
Język polski jest szóstym, po angielskim, niemieckim, japońskim, francuskim, włoskim,
językiem Wikipedii, The Wiki Principle. Among the Sudience, A Survey of New Media,
„The Economist” 2006, April 22.
Wiarygodność Wiki
• Dziennikarze Nature porównali 42
tematy/obszary Wikipedii i encyklopedii
Britannica Online
• Wiki: 4 poważne błędy + 4 drobne
nieścisłości
• Britannica: 3 nieścisłości, 4 błędy
• Błędy faktograficzne: 162 i 123
odpowiednio w Wikipedii i Encyklopedii
Internet encyclopaedias go head to head. Find More Like This
Authors: Giles, Jim, Source: Nature; 12/15/2005, Vol. 438 Issue 7070, p900-901, 2p, 2c
Wiarygodność
„bardzo ograniczonych mechanizm weryfikacji"
• Przedwojenny działacz komunistyczny, więzień
polityczny, uczestnik wojny domowej w Hiszpanii
i wreszcie patron ulicy na warszawskim
Służewcu - historia Henryka Batuty została
dokładnie opisana w listopadzie 2006 r.
• Postać wykreowana, nieistniejąca.
• Mistyfikacja pozostała niewykryta przez ponad
rok.
WikiScanner – śledzenie zmian
– narzędzie do śledzenia (dyskusyjnych)
ingerencji w treści publikowane w wikipedii
w celu promocji, kreowania wizerunku,
poprawy wizerunku
http://virgil.gr/31.html, VIII,2007
lista dziesięciu najbardziej
modyfikowanych haseł
• „George W. Bush”, „Anarchia”,
„Muhammad”, „Skład WWE”, „Globalne
ocieplenie”, „Obrzezanie”, „U.S.A”, ponownie
„Jezus”, „Rasa a inteligencja” oraz
„Chrześcijaństwo”.
Doug Gross sporządził dla CNN
flagged revisions
• Nowa funkcja Wikipedii – upoważniony woluntariusz
musi podpisać każdą zmianę wprowadzoną przez
czytelnika.
• Np. dotyczy to „wrażliwych” stron Britney Spears
czy President Obama,
August 25, 2009, Wikipedia to Limit Changes to Articles on People, By NOAM COHEN
Australia – przykład
manipulacji
• Australijski rząd to kolejna instytucja, która
poprawia informacje umieszczane
w Wikipedii na swój temat.
• System Wikipedii wykrył, że australijskie
ministerstwo obrony wprowadziło 5 tys.
zmian w hasłach encyklopedii. Częstych
zmian w Wiki dokonuje również CIA
oraz BBC.
http://www.internetstandard.pl/news/121377/100.html [1/08]
Przykłady wandalizmu
w Wikipedii
– Usuwanie fragmentów z krytycznymi
informacjami (politycy, korporacje)
– White-washing – zastępowanie
negatywnych/neutralnych ocen pozytywnymi
(szczególnie popularne wśród polityków)
– Dodawanie negatywnych informacji
konkurencji (głównie firmy)
http://virgil.gr/31.html, VIII 2007
KNOL vs Wikipedia
• Serwis Knol, skrót od knowledge, pozwoli
tworzyć strony każdemu, na dowolny temat.
Zawiera usługę komentarzy, ocen i sugestii
zmian.
• Zmiany może wprowadzić tylko autor.
• Wikipedia jest not-for-profit i bez reklam. Knol
może zamieszczać reklamy Google’a.
December 15, 2007, NYT, Wikipedia Competitor Being Tested by Google , By MIGUEL HELFT
PLATFORMY NIESKRĘPOWANEJ
WYMIANY INFORMACJI l OPINII
• W grudniu 2006 r., powstała nowa
platforma swobodnej dystrybucji informacji
ukrywanych przed społeczeństwami
różnych krajów: WikiLeaks.
• Upowszechnienie technologii
informacyjnych prowadzi do większej
transparentności władzy politycznej.
Głównym motorem tego stanu,
wyznacznikiem nowej ery w komunikacji,
Internet.
Chip maj 2011
WikiLeaks
• Opublikował materiały dotyczące sekty
scjentologów.
• Podał utrzymywaną w tajemnicy listę nazwisk
wraz z adresami członków brytyjskich partii
neofaszystowskiej.
• W czerwcu 2009 roku WikiLeaks zostało
uhonorowane przyznawaną przez brytyjskich
dziennikarzy nagrodą za opracowanie raportu w sprawie
morderstwa dokonanego przez policję tego kraju. Nagrodę odebrał
australijski programista i pisarz, a jednocześnie założyciel i twarz
WikiLeaks - lulian Assange.
Chip maj 2011
WikiLeaks, ale
• Wiceprezydent Joe Biden o Sarah Palin nazwała
J. Assange terrorystą.
• Doradca premiera Kanady Tom Flanagan, który
powiedział, że Assange'a powinno się zniszczyć
za pomocą bezzałogowego samolotu.
• Portal oraz jego główny animator znaleźli się
pod ogromną presją z wielu stron - WikiLeaks
zostało przez polityków okrzyknięte wrogiem
publicznym numer jeden.
Chip maj 2011
• Usługa ułatwiająca
rozumienie znaczeń
• Definicje z różnych
źródeł
• Ilustracja kontekstami
Wordnik
Dane statystyczne o Sieci
•
•
•
•
Netcraft. news.netcraft.com,
ranking.pl,
www.InternetWorldStats.com,
Alexa. http://www.alexa.com/.
Dane statystyczne
w Sieci
 Gemius S.A
 Megapanel (PBI/Gemius)
 Internet Standard / Sklepy 24.pl
 CBOS
GUS, UOKiK
http://www.shambles.net/worldclock/worldclock.swf
www.InternetWorldStats.com
•
Internet Usage Stats and Population Statistics
Index | World Stats | Africa Stats | America Stats | Asia Stats | Europe Stats | EU
Stats | Middle East Stats | Oceania Stats
Spanish Internet Stats | Top Internet Usage | Top Internet Penetration | Top Internet
Languages | Top Ten | DSL | Search SiteCountry Links and International Directory
Africa | North America | Asia | Central America | Europe | European Union | EU
Enlargement | Middle East | South America
South Pacific and Oceania | The Caribbean | World Population | Country List | World
Internet Users AssociationsInternet Marketing Pages
Broadband Usage | B2B Trade Exchanges | Industry Stats | Internet Usage | Internet
Divide | Internet Growth | Internet Library
iBurst | Market Reports | Market Research | Newsletter | PR Coaching | SEM | SEO |
Search Engines & Directories | Web StatsSite Resources and Services
About Us | Blog | Dictionaries | Tools | Internet Telephone Calls | Conference Calls |
Online Profits | NFL Tickets | Privacy Policy
Archives | World News | Software | e-Learning | Translation Tools | Web Services |
Time and Weather | Site Surfing GuideCountry Internet Usage and
Telecommunications Reports
Africa | America | Asia | Caribbean | Europe | EU27 | Middle East | South America |
South PacificAll About
Market Research
Megapanel PBI/gemiusAudience:
Definicje wskaźników
•
•
•
•
•
•
•
•
•
•
•
Liczba użytkowników (real users)
Liczba odsłon
Czas
Średni czas na użytkownika
Średni czas odsłony
Średni czas uruchomienia na
użytkownika
Średnia liczba odsłon na użytkownika
Średnia liczba sesji na użytkownika
Zasięg
Dopasowanie użytkowników grupy
celowej
Dopasowanie odsłon w grupie
celowej
•
•
•
•
•
•
•
•
•
•
•
Dopasowanie czasu w grupie celowej
Affinity Indeks
Udział użytkowników
Udział odsłon
Udział czasu
Współoglądalność
%Współoglądalność
Aktywne programy
Użytkownicy i Aktywne programy
Cookies Polska
Cookies zagranica
Cookies ogółem
http://www.gemius.pl/pl/badania_audience_wskazniki
Definicje analityczne
•
•
•
•
•
Użytkownicy (real users)
Odsłona
Czas
Sesja
Wizyta
http://www.gemius.pl/pl/badania_audience_wskazniki
Przykład
Agencje microstockowe
JAKIE Zdjęcia Trafiają na Stock?
• Formaty .jpg, .jpeg, .tiff (grafika rastowa)
• Rozdzielczość: Bigstockphoto (od 1,6 Mpx,
do 20 MB), Fotolia (4 Mpx, do 30 MB),
• ShutterStock - skan dowodu tożsamości
modela (potwierdzenie wieku), skan
dowodu tożsamości autora.
http://www.swiatobrazu.pl/fotograficzny-stock-czyli-jak-zarobic-na-swoich-zdjeciach-20888.html Katarzyna Gabrysz
LICENCJE
Royalty free – licencjobiorca otrzymuje prawo do wielokrotnego,
dowolnego wykorzystania własności intelektualnej po wniesieniu
jednorazowej opłaty
Sell the Rights – po zakupie dzieła przez nabywcę, autor ma
obowiązek usunąć kopie dzieła z internetu
http://www.swiatobrazu.pl/fotograficzny-stock-czyli-jak-zarobic-na-swoich-zdjeciach-20888.html
Katarzyna Gabrys
http://webhosting.pl/Darmowe.zdjecia.z.Sieci%3A.jak.je.znalezc.i.jak.z.nich.korzystac Wojciech
Zasady działania
•Dostępne licencje:
• Royality Free – użycie bez
ograniczeń
• Licencje rozszerzone:
•
•
•
•
•
Wielostanowiskowe (U-EL)
Do użytku w interncie (W-EL)
Do druku (P-EL)
Zwiększona ilość kopii (I-EL)
Sprzedaż praw autorskich (SR-EL)
• Editorial – do użytku
niekomercyjnego i
•Opłaty:
• Kredyty – waluta w agencjach
(np. 1 kredyt = 1 zdjęcie w
najmniejszym rozmiarze)
• Abonament (subskrypcja) –
limit dziennych pobrań przez
określony okres (np. 25
pobrań/dzień przez 3
miesiące)
niereklamowego,
Na podstawie: http://pl.dreamstime.com/terms.php
Agencje microstockowe
•
•
•
•
•
•
•
iStockphoto
Shutterstock
Dreamstime
BigStockPhoto
Fotolia
123RF
inne
Dreamstime
•
•
•
•
•
•
•
•
•
•
Oferta: zdjęcia, ilustracje, wideo,
Baza: ponad 30 mln obrazów
Opłaty: kredyty i abonament
Zdjęcie średniej wielkości: 6$–7$
Licencje: Royalty-free oraz licencje rozszerzone
Waluta: dolar amerykański / zł
Polski interfejs: +
Czytelność: średnia
Wyszukiwanie: zaawansowane
Dostęp na mobilne: brak
Shutterstock
•
•
•
•
•
•
•
•
•
•
Oferta: zdjęcia, ilustracje, wideo, ikony, grafika wektorowa
Baza: ponad 50 mln obrazów
Opłaty: abonament oraz zdjęcia na żądanie
Zdjęcie średniej wielkości: 10$–15$
Licencje: Royalty-free oraz licencje rozszerzone
Waluta: dolar amerykański /euro
Polski interfejs: +
Czytelność: dobra
Wyszukiwanie: rozszerzone (ale mało zaawansowane)
Dostęp na mobilne: +
Fotolia
•
•
•
•
•
•
•
•
•
•
Oferta: zdjęcia, grafika wektorowa, wideo,
Baza: ponad 37 mln obrazów
Opłaty: kredyty lub abonament
Zdjęcie średniej wielkości :2,5$–20$
Licencje: Royalty-free oraz licencje rozszerzone
Waluta: dolar amerykański / zł
Polski interfejs: +
Wyszukiwanie: mało zaawansowane
Czytelność : średnia
Dostęp na mobilne: brak
Więcej o zasobach fotograficznych
• Wowra, W., „Darmowe zdjęcia w Sieci. Jak je znaleźć? Jak z
nich korzystać”
http://webhosting.pl/Darmowe.zdjecia.z.Sieci%3A.jak.je.zn
alezc.i.jak.z.nich.korzystac
• Gabrysz, K., „Fotografia stock, czyli jak zarobić na swoich
zdjęciach”, http://www.swiatobrazu.pl/fotograficzny-stockczyli-jak-zarobic-na-swoich-zdjeciach-20888.html
• Golański, A. „Google Image Search pozwala na
wyszukiwanie uwolnionej grafiki”
http://webhosting.pl/Google.Image.Search.pozwala.na.wys
zukiwanie.uwolnionej.grafiki
iStockphoto
•
•
•
•
•
•
•
•
•
•
Oferta: zdjęcia, ilustracje, wideo, audio, grafika wektorowa,
Baza: ponad 48 mln obrazów
Opłaty: Kredyty, abonament, płatności błyskawiczne
Zdjęcie średniej wielkości : 5$–50$
Licencje: Royalty-free oraz licencje rozszerzone
Waluta: dolar amerykański
Polski interfejs: +
Czytelność: dobra
Wyszukiwanie: zaawansowane
Dostęp na mobilne: +
iStockphoto - opłaty
Ceny c.d. główna i
ekskluzywna kolekcja
Najpopularniejsze słowa
kluczowe - Shutterstock
Na podstawie prezentacji Marianny Raszkowskiej
Muzyka
Własne utwory
• Jednym z ciekawszych serwisów
umożliwiających wgrywanie i dzielenie się
włanymi utworami jest SoundCloud (www.
soundcloud.com).
• Typowo sprzedażową platformą muzyczną
jest BandCamp (www.bandcamp.com). Po
założeniu konta i zalogowaniu się w tym
serwisie artysta może wgrać swoje pliki
muzyczne (w formacie MP3, WAV lub FLAC) i
sprzedawać je online.
Muzyka
• Soundcloud.com.
• Serwis założony w 2007 roku, zrzeszający
społeczność artystów tworzących muzykę oraz ich
fanów. W 2014 roku na stronie zarejestrowanych było
już ponad 40 milionów użytkowników.
http://www.usatoday.com/story/tech/columnist/tal
kingtech/2013/07/17/whos-listening-to-soundcloud200-million/2521363/
http://www.usatoday.com/story/tech/columnist/talkingtech/2013/07/17/whoslistening-to-soundcloud-200-million/2521363/
Muzyka online
• Np. aplikacje na urządzenia mobilne (Wimp,
Spotify),
• umożliwiają legalne słuchanie utworów na
zasadzie streamingu.
• Opłata 20 złotych - dostęp do bazy albumów i
pojedynczych utworów, które można słuchać
online, jak i ściągnąć na swoje urządzenie.
Rozpoznawanie
• Midomi - baza muzycznych danych zaopatrzona w
rozbudowaną wyszukiwarkę. Użytkownik może
zanucić fragment utworu i na podstawie próbki głosu
zidentyfikować oryginalną piosenkę.
• Whosampled.com to serwis umożliwiający
rozpoznanie czy w danym utworze wykorzystane są
fragmenty z innych utworów. Po w pisaniu w
wyszukiwarkę tytułu wyświetla się fragment
kompozycji, który zawiera część innego utworu (tak
zwany sampel). NP. amerykański raper Singapore Kane w swojej
piosence Don't Take It Personal zamieścił organy z hitu Dziwny jest ten
świat Czesława Niemena.
•
http://www.whosampled.com/sample/4985/Singapore-Kane-Big-Shug-Don%27t-TakeIt-Personal-Czes%C5%82aw-Niemen-Dziwny-Jest-Ten-%C5%9Bwiat/
RapidShare
• Globalny komercyjny serwis do dzielenia się
plikami.
• Rapid=5.99€ -30 dni, transfer 150 GB
• Internauci wrzucają do niego wszystko, co tylko
da się przerobić na postać cyfrową: filmy,
muzykę, programy, gry, zdjęcia, e-booki.
• Nie ma własnej wyszukiwarki – pomocne
www.filestube.com.
• Wrzucasz na niego plik, do którego
automatycznie jest generowany link; tym linkiem
dzielisz się ze znajomymi.
PCWorld.V.2011
Hosting plików
SIERPIEŃ 2013 CHIP.PL
SIERPIEŃ 2013 CHIP.PL
Buy & sell small jobs, 15% prowizji
http://www.coffeeandpower.com
Podobne serwisy: Task Rabbit, Freelancer.com i Amazona Mechanical Turk
Medycyna
• Duża część zasobów medycznych w pełni spełnia
kryteria tego, co można określić jako „media”.
• W połowie XIX wieku lekarz Ignaz Semmelweis dzięki
prostemu zabiegowi higienicznemu – myciu rąk –
radykalnie zmniejszył liczbę umierających pacjentów
w swoim szpitalu. Korzystając z tych doświadczeń,
usiłował przeforsować obowiązek mycia rąk przez
swoich kolegów wykonujących pracę. Nie znalazł jednak
zrozumienia.
• Za marnotrawienie czasu na „nikomu niepotrzebne
mycie” wyrzucono go z pracy. Podobnie obecnie
korzystanie z potencjału komputerów i udostępnionych
przez nie zasobów często jest traktowane jako
marnotrawienie czasu.
Global Medicine Network
• Darmowy serwis medyczny.
• Ułatwienie kontaktów pomiędzy organizacjami
działającymi w dziedzinie zdrowia na całym
świecie oraz proponowanie współpracy w
takich dziedzinach jak usługi humanitarne,
darowizny, badania czy edukacji medycznej.
Doktor24.pl
• Komercyjny serwis
• Konsultacje z lekarzami, także wideo
• Uzyskanie specjalistycznej opinii w ciągu 48
godzin.
medycyna.linia.pl.
• Informacje o chorobach.
• Diagnozowanie i leczenie bez konsultacji z
lekarzem.
http://psychcentral.com/
• pacjenci mogą znaleźć sprawdzone informacje
na temat chorób psychicznych i dołączyć do
grupy wsparcia.
Medline
http://www.nlm.nih.gov/bsd/pmresources.html
• MEDLINE® contains journal citations and abstracts for
biomedical literature from around the world. PubMed®
provides free access to MEDLINE and links to full text
articles when possible.
• The following resources provide detailed information
about MEDLINE data and searching PubMed. If you
cannot find the information you seek, please contact
NLM Customer Service.
• News | Overviews | Journals | Data Structure &
Variables | Data Policies | Searching PubMed
Tools & Utilities | MEDLINE Statistics | Help &
Training Resources
MedlinePlus
• strona prowadzona przez Narodowy Instytut
Zdrowia Stanów Zjednoczonych.
• informacje o chorobach, sprawach związanych
z rekonwalescencją i pielęgnacją.
• od lipca do września 2013 r. strona
odnotowała 81 milionów wejść,
• Witryna jest podzielona na trzy działy: tematy
związane ze zdrowiem, lekarstwa i suplementy
oraz filmy wideo z przebiegu operacji, czy
nawet z ćwiczeniami dla poprawy kondycji.
(http://www.nlm.nih.go
v/medlineplus/),
Mapy, plany
•
•
•
•
•
•
Google Earth
Google Maps
Zumi (mapy Techmeksu i Imagis)
Panorama Firm
W Polsce: Navteq i TeleAtlas
Mapy, plany, zdjęcia + usługi, hybryda
map i obrazów
Problem archiwizacji informacji
• Informacje w postaci cyfrowej nanoszone są
na przeróżne nośniki (taśmy, dyski, dyskietki,
CD, DVD). Jednak wszystkie one gwarantują
stosunkowo krótki okres trwałości
przechowywanych na nich informacji.
Maksymalnie do 100 lat.
• Maleje proporcja informacji gromadzonych
na tradycyjnych nośnikach informacji –
papierowych – na korzyść zapisu cyfrowego.
Cyfrowe nośniki vs papierowe
• Papier przestał być głównym nośnikiem
informacji.
• Przykład częstotliwości korzystania
z książki telefonicznej.
• Konsekwencje:
– zagrożenie trwałości zapisów,
– większa konsumpcja energii elektrycznej.
Wzorce budowane
na podobieństwo wzorców miar
• Niezmienne w czasie, o dużej dokładności, łatwe
w odtwarzaniu i stosowaniu.
• Obejście problemu – wykorzystywanie wirtualnych
komputerów – odpowiedników ich starszych generacji,
np. Universal Virtual Komputer (UVC), na którym jest
uruchamiane oprogramowanie dekodujące dokumenty
zapisane we wcześniejszych formatach.
• Nadal pozostaje jednak nierozwiązany problem trwałości
nośników i dostępności urządzeń do ich odczytania
(już dzisiaj duża część sprzedawanych pecetów
i laptopów nie ma napędu dyskietek).
Bezpieczne formaty
• PDF/A – dla długowiecznej archiwizacji
• Teksty - ODT (OpenOffice) – otwarta
specyfika, nikt nie może w niej
manipulować
• Obrazy i zdjęcia - TIFF i PNG jw.
Wytrzymałość nośników
danych
•
•
•
•
•
•
•
•
•
Dyskietki, CD/DVD, HD, pendrive (flash) – 5–10 lat
VHS – 10–15 lat
Taśma magnetyczna, DVD-RAM – 20–30 lat
Srebrne CD, DVD do 100 lat, warunek – idealne warunki
HD – do 5–10 lat
Flash – ok. 5 lat
DVD-R – 30 lat, warunek, j.w.
Preservation Kodaka daje gwarancję do 300 lat
Uszkodzenia – zadrapania po stronie nośnika
i po stronie etykiety (niszczenie warstwy odbijającej, np.
przez klej naklejek!)
Chip IX.2007, PCWorld 3/2009, s. 104
Jakość nośników
• Kupuj markowe czyste płyty ze
złotą, odporną na korozję warstwą
odbijającą i twardą, odporną na
zadrapanie powierzchnią.
• Np. Emtec CD-R Gold (5 zł sztuka), TDK
ScratchProof DVD (8 zł)
• Najpewniej zapisywać na HD – cztery
kopie na różnych dyskach.
Groźba fizycznej utraty archiwizowanych
informacji cyfrowych
• Dzięki tabliczkom z pismem klinowym (IV
tysiąclecie p.n.e.), zapisom na papirusie
(2500 lat p.n.e.), później na papierze,
sznurach kipu (pismo węzełkowe Inków)
informacje w dużej części przetrwały setki,
nawet tysiące lat.
• Takiej gwarancji nie zapewniają nośniki
informacji z zapisami w postaci cyfrowej
Ułomność komputerowych
nośników danych
•
•
•
•
Np. dyskietki trzyipółcalowe, zanikające CD-ROM-y i doskonalone DVD.
Przykład: inicjatywa BBC z 1986 roku, której efektem było zapisanie
wartościowych danych na temat Wielkiej Brytanii, łącznie z mapami,
zapisami wideo i tekstami. Nośnikiem tych zapisów były specjalne laserowe
dyski, bazujące na, współczesnych wówczas, komputerach BBC Micro.
Nośniki te obecnie są nie do odczytania na jakimkolwiek urządzeniu.
Po dwuipółletnich bardzo kosztownych pracach ostatecznie udało się
jednak przenieść te zapisy na współczesne pecety
(WWW.domesday1986.com.)
Inny przykład: Kilkaset nośników CD z 4 milionów w zbiorach Niemieckiej
Biblioteki Narodowej nie do odczytania.
• NASA scientists found in 1999 that they were unable to read digital
data saved from a Viking space probe in 1975; the format had long
been obsolete.
December 23, 2007, SCENE STEALER, The Afterlife Is Expensive for Digital Movies, By MICHAEL CIEPLY, NYT
Analog/cyfra – koszty
archiwizacji
• Przechowywanie cyfrowych obrazów i filmów nie jest tak
trwałe jak analogowych.
• Koszt rocznego przechowywania cyfrowego filmu
$12514 vs analogowa wersja - $1059.
• Współcześnie niemal wszystkie studia filmowe („Click”
lub „Miami Vice”) używając cyfrowych zapisów,
korzystają z trwalszej (>100 lat) wersji analogowe.j
• Cyfrowy zapis jest mniej trwały od analogowego.
• Doświadczenia wskazują, że nieuruchamiany przez dwa
lata dysk twardy utraci informacje. Podobnie DVD – po
15 latach będzie czytelne tylko połowa zbiorów.
December 23, 2007, SCENE STEALER, The Afterlife Is Expensive for Digital Movies , By MICHAEL CIEPLY, NYT
Internet rejestruje wszystko,
niczego nie zapominając
Poleganie na Sieci
• Lepiej pamiętane są informacje, o których
wiemy, że ich nie ma w Sieci.
• Korzystanie z wyszukiwarki zmienia to, co
zapamiętujemy. Badani, którzy mieli
dostęp do Google'a, łatwiej zapamiętywali
miejsce przechowania informacji
niż właściwe dane.
http://www.nytimes.com/2011/07/15/health/
15memory.html?nl=todaysheadlines&emc=
tha26
Negatywne informacje
• Trudne do usunięcia. Koszt 500 – 1000
USD
• Blokada w wyszukiwarkach negatywnych
informacji – tysiące USD + kolejne tysiące
w danych o osobach: Intellius lub
PeopleFinder.
• Usunięcie oszczerczych (ktoś o firmie)
informacji – dziesiątki tysięcy USD.
http://www.nytimes.com/2011/06/11/your-mney/11wealth.html?_r=1&nl=todaysheadlines&emc=tha26&pagewanted=print
Czas życia profilu w Sieci
• Prośba o kontakt (Facebook) od osoby,
która zmarła.
• Problem narasta ze wzrostem wieku
internautów.
• Facebook umożliwia zgłoszenie śmierci
(krewny, znajomy) stosownym dowodem,
np. informacją z drukowanej gazety.
Sieciowa pamięć
• Nieprzemyślane informacje o sobie (tekst,
obrazy) pozostają na lata w Sieci bez
możliwości ich usunięcia. Sieć nie daje
drugiej szansy!
• 75% profesjonalistów HR kontroluje
kandydatów w Sieci (szperacze,
społecznościowe, foto, wideo, osobiste
strony, blogi, gry online). Efekt - 70%
kandydatów odrzucona.
Pamięć sieci
• Sieć nie zapomina
informacyjnych wybryków
młodych ludzi. Szacuje się, iż
75% specjalistów HR ocenia
kandydatów do pracy wg
informacji z Sieci – wynik: 70%
odrzuconych podań.
• Praktycznie brak jest narzędzi do
usuwania tych informacji.
Rosen J. The Web Means the End of Forgetting, [w:] New York Times, July 19, 2010. Paul Sullivan, Negative
Online Data Can Be Challenged, at a Price, [w:] New York Times, June 10, 2011.
Zmiany wartości miar czasu magazynowania
informacji w Sieci i człowieka (wg Krzywej
Ebbinghausa)
Legenda: w celu uzyskania większej czytelności wykresu miara ilości informacji (procent przechowywanych sylab) Krzywej Ebbinghausa została
podwojona. Oś X dla tej krzywej skalowana jest w dniach, dla Google’a i Onetu w latach.
Zapominanie przeszłości – jak
szybko znika przeszłość z książek
• Powoływanie się (przypisy, źródła) na “1880,”
zmniejszyło się o połowę w 1912, przez okres 32
lat.
• “1973” zmniejszyło się o połowę w 1983, tylko
10 lat później.
• Zapominamy naszą przeszłości szybciej niż
kiedykolwiek w przeszłości.
Published Online December 16 2010, Science 14 January 2011: , Vol. 331 no. 6014 pp. 176-182 , DOI: 10.1126/science.1199644 , Research Article,
Quantitative Analysis of Culture Using Millions of Digitized Books, http://www.sciencemag.org/content/331/6014/176.full
Zasoby dla HR
• 75% specjalistów HR ocenia kandydatów
do pracy wg informacji z Sieci – wynik
70% odrzuceń.
• Użytkownicy Facebooka zostawiają 25
miliardów wpisów każdego miesiąca.
NYT. July 19, 2010, The Web Means the End of Forgetting, By JEFFREY ROSEN
Edytory, przeglądarki
• Mimo że minęło niespełna dziesięć lat,
nie zawsze wyświetlają one treści w tej samej
formie jak czyniły to poprzednie wersje
oprogramowania.
• Np. dokumenty napisane kilkanaście lat temu
w edytorach polskich tekstów, takich jak np. Chi
Writer czy QL Tekst.
• Sytuacja ta zwraca uwagę na konieczność
stworzenia wzorców formatów zapisu
wszystkich form multimedialnych informacji.
Komercjalizacja rynku
informacyjnego
• W mediach dotyczy przede wszystkim informacji
biznesowych.
• Już w 2001 roku czwarta część wpływów
właścicieli stron, które uzyskiwali oni
ze sprzedaży miejsc na reklamy online,
pochodziła z wpływów za informacje.
• Eksperci szacują, że sprzedaż informacji via
Internet będzie rosła każdego roku dwukrotnie.
• Wydatki za treści online w 2002 roku osiągnęły
50 mld USD, a szacunek na 2006 rok wynosi
znacznie ponad 100 mld USD.
Podstawowe kryteria oceny
towaru w postaci informacji
• wiarygodność źródeł,
• dokładność i kompletność,
• najszybciej rozwijającymi się kategoriami
sprzedawanych informacji jest rozrywka
(cyfrowa muzyka i strony multimedialne;
jej wartość sprzedaży podwaja się
każdego roku) oraz biznes/inwestycje,
sport i gry.
Komercyjna wartość dóbr
informacyjnych – zagrożenia
• Informacja zastępuje własność gruntów, energii i surowców.
• Następuje proces kanalizowania dystrybucji wszelkich treści
i czerpania korzyści z tej operacji.
• Tylko w USA roczne wpływy z licencjonowanych technologii
przynoszą 45 mld USD, a na świecie ponad 100 mld USD.
• Dzięki wątpliwej jakości regulacji rodzą się instytucjonalni rentierzy,
którzy wyłącznie za fakt posiadania praw do oprogramowania,
patentów, gazet, książek, muzyki, filmów pobierają opłaty możliwe
do zaakceptowania tylko przez niektórych.
• W rezultacie tego pogłębiają się różnice pomiędzy krajami i grupami
społecznymi będącymi na innych etapach drogi ku społeczeństwu
informacyjnemu. Zarysowuje się między nimi przepaść, głównie
spowodowana różnicami w dostępie do cyfrowych dóbr. Zagraża
to społeczną i kulturową stagnacją.
Dane gromadzone o nas
dla personalizacji
• Dane biograficzne – jak poziom edukacji, stan
cywilny, liczba dzieci, status materialny, dom,
samochód (marka, rocznik).
• Kategorie ostatnich zakupów, rozmiar ubrań,
zainteresowania (tenis, pies, internet, diety).
• Dane przekazane z własnej woli w celu
personalizacji przekazów marketingowych
https://aboutthedata.com/
Pełna lista terminów określających płeć w
anglojęzycznej wersji Facebooka:
•Agender
Androgyne
Androgynes
Androgynous
Bigender
Cis
Cis Female
Cis Male
Cis Man
Cis Woman
Cisgender
Cisgender Female
Cisgender Male
•Cisgender Man
Cisgender Woman
Female to Male
FTM
Gender Fluid
Gender Nonconforming
Gender Questioning
Gender Variant
•Genderqueer
Intersex
Male to Female
MTF
Neither
Neutrois
Non-binary
Other
Pangender
Trans
Trans Female
Trans MaleTrans Man
Trans Person
Trans*Female
Trans*Male
Trans*Man
Trans*Person
AP
14.02.2014 21:32
•
Trans*Woman
Transexual
Transexual Female
Transexual Male
Transexual Man
Transexual Person
Transexual Woman
Transgender
Female
Transgender
Person
Transmasculine
Two-spirit
http://wiadomosci.gazeta.pl/wiadomosci/1,114871,15462856,Facebook
_zmienia_ustawienia_plci__Zamiast_dwoch_opcji.html
Korzyści z danych o nas
• Acxiom – broker informacji.
• Gromadzi dane, analizuje i sprzedaje firmom (banki,
ubezpieczyciele, producenci dóbr konsumpcyjnych).
• Klasyfikowanie klientów do socjoekonomicznych
marketingowych kategorii.
• Cel – dostosować ofertę do obecnych klientów i poszukiwać
nowych klientów.
Kto ma nasze dane? 1/2
CHIP.PL LISTOPAD 2013
Kto ma nasze
dane? 2/2
CHIP.PL LISTOPAD 2013
Wartość
informacji
ŁĄCZNA WARTOŚĆ
JEDNEJ OSOBY
(MAKSIMUM
INFORMACJI): OK. 1,65 $
CHIP.PL LISTOPAD 2013
Przemoc informacyjna w
internecie
Rodzaje przemocy w internecie
• fizyczna
– cyberwojna
– cyberterroryzm
– haktywizm z użyciem przemocy fizycznej
• przemoc psychiczna (nękanie, ośmieszanie)
• przemoc funkcjonalna
– nadzór informacyjny państwa
– cenzura w Internecie
– cyfrowe wykluczenie, B-wykluczenie
Potencjał Web 2.0 dla dochodzeń
kryminalnych
•
•
•
•
•
•
•
Dowody komunikowania się z osobami
Wskazanie motywów i personalnych relacji
Intencje i dowody premedytacji
Informacje o lokalizacji
Dowody na alibi lub brak alibi
Wskazanie na okoliczności przestępstwa
Narzędzia przestępstw i wskazanie korzyści z
przestępstw.
http://www.nytimes.com/2011/03/03/nyregion/03facebook.html?_r=1&nl=todaysheadlines&emc=tha26&pagewanted=print
http://www.criminallawlibraryblog.com/U.S._DOJ__crim_socialnetworking.pdf
Cyberbullying – sieciowa
nagonka
• Podszywanie się pod kogoś w celu
skompromitowania go
• Tworzenie opinii w publicznych miejscach
wymiany informacji online
• Tworzenie i rozsyłanie tendencyjnych maili
• Kojarzenie w szperaczach niepochlebnych
słów z nazwiskiem ofiary
Cyberbulling
• Sieciowa nagonka
• Sieć staje się ścianą szkolnej
toalety– ordynarnych haseł,
krzywdzących opinii
• Czytanie ekstremalnych opinii, krzywdzących
wypowiedzi (dotyczących wyglądu, zapachu,
seksu) nawet o sobie, nie odstrasza
czytelników – swoisty masochizm
intelektualny.
Lewin T., Teenage Insults, Scrawled on Web, Not on Walls May 5, 2010,
http://www.nytimes.com/2010/05/06/us/06formspring.html?th=&emc=th&pagewanted=print [maj 2010].
„rewers” - negatywna siła wirtualnego tłumu i
anonimowych ataków na młodego człowieka
• Cyberbulling obejmuje użycie informacji i
technologii informacyjnych takich jak portale
społecznościowe, mail, komórki, komunikatory
internetowe (IM), strony w celu wspomagania
dyskusji, powtarzania, inicjowania,
nieprzyjaznych zachowań osób lub grup z
zamiarem uczynienia komuś krzywdy.
• Jest to zjawisko, które w wielu przypadkach
doprowadza młodych ludzi do samobójczych
zachowań. Idzie tu o wzmacniającą funkcję IT:
What is Cyberbullying? http://www.slais.ubc.ca/courses/libr500/04-05wt2/www/D_Jackson/what.htm [luty 2012].
Cyberbulling?
• złośliwe i powtarzające się nagabywanie,
naprzykrzanie się, które może wywołać u ofiary
poczucie zagrożenia. Obejmuje ono zachowania
polegające na obsesyjnym śledzeniu, obserwowaniu
albo kontaktowaniu się z inną osobą wbrew jej woli,
• podszywanie się po kogoś w celu skompromitowania,
• tworzenie opinii w publicznych miejscach wymiany informacji online,
• tworzenie i rozsyłanie tendencyjnych maili ale także SMS-ów, wiadomości
w portalach społecznościowych, na komuniaktorach,
• kojarzenie w wyszukiwarkach niepochlebnych słów z nazwiskiem ofiary.
• Ekstremalne konsekwencje – samobójstwa młodych ludzi.
Wzmacniająca funkcja IT:
„rewers”: Cyberbullying –
negatywna siła wirtualnego tłumu
Cyberbullying obejmuje użycie informacji
i technologii informacyjnych takich, jak
mail, komórki, IM, strony w celu
wspomagania dyskusji, powtarzania,
inicjowania, nieprzyjaznych zachowań
osób lub grup z zamiarem uczynienia
komuś krzywdy.
• Działamy na rzecz tworzenia bezpiecznego
Internetu.
• Reagujemy na nielegalne I szkodliwe treści
internetowe skierowane przeciwko
bezpieczeństwu dzieci i młodzieży.
• Popularyzujemy bezpieczne korzystanie z
Internetu.
Jakiego rodzaju treści chciałbyś zgłosić?
• Pornografia dziecięca
Polskie prawo zabrania sprowadzania, przechowywania lub posiadania
treści pornograficznych z udziałem dziecka poniżej 15 roku życia;
rozpowszechniania i publicznego prezentowania pornografii z udziałem
małoletniego poniżej 18 roku życia.
• Twarda pornografia
Polskie prawo zabrania rozpowszechniania i publicznego prezentowania
pornografii związanej z prezentowaniem przemocy lub posługiwaniem się
zwierzęciem.
• Rasizm i ksenofobia
Polskie prawo zabrania propagowania faszystowskiego lub innego
totalitarnego ustroju oraz szerzenia nienawiści wobec jednostki czy grupy
społecznej ze względu na jej pochodzenie, kulturę, wyznanie lub ze
względu na jej bezwyznaniowość.
• Inne nielegalne treści
Treści, które chcesz zgłosić, nie dotyczą żadnej z powyższych kategorii.
Kontrola treści Sieci, cenzura
• 50 pracowników Telecommunication On
Demand sprawdza ok. 20 milionów
obrazów każdego tygodnia
• Outsourcingowa firma - Caleris – 4,5 mln
obrazów codziennie
• YouTube kontroluje materiały wskazane
przez internautów.
• Facebook – kontrola w Palo Alto
i w Dublinie.
NYT, Policing theWeb’s Lurid Precincts, July 18,2010.
Cenzura Internetu na świecie
PCWorld 4/2011
Cenzura na Twitterze
796 razy władze rządowe domagały
się w
ll połowie 2014 r. usunięcia tweetów.
Aż 60 proc. tych wniosków
pochodziło z Turcji.
SIERPIEŃ 2015 CHIP.PL
Granice obiektywizmu
• Na stronie Wikileaks opublikowano poufne,
ukradzione dane o kontach klientów banku
szwedzkiego.
• Strona ta głosi, iż umożliwia ludziom publikować
dokumenty anonimowo, z każdego państwa,
które piętnują nieetyczne zachowania władz
i korporacji
NYT, March 5, 2008, 7:14 pm, Bank Moves to Withdraw Its Suit Against Wikileaks Site, By JONATHAN D.
„Cyfrowa przepaść” przeciwstawianie
copy-right (od 300 lat) – copy-left
• Zwalnianie rozwoju nauki i rozprzestrzeniania się
wartościowych idei.
• Kto zapanuje nad oprogramowaniem, ten zapanuje
nad technosferą. Władza nad technosferą będzie zaś
tożsama z władzą nad światem.
• Sztandarowe przykłady idei copy-left: standard open
source, a w nim system operacyjny Linux, sieciowe
oprogramowanie dla serwerów Apache i tworzona
przez społeczność internautów encyklopedia – Wikipedia
oraz inicjatywa Projektu Gutenberg (bezpłatne
udostępnianie elektronicznych wersji książek).
• Celowość rewizji tego, co ma pozostać prywatne,
państwowe, a co ogólnoludzkie – jak powietrze i woda.
Własność intelektualna – wpływy
[mld USD]
100
80
60
40
20
0
1951 1960 1970 1980 1990 2003
Źródło: Athreye and Cantwell, 2005 za:
A market for ideas, A survey of patents and Technology, The Economist, October 22nd, 2005.
> ¾ patentów USA imigrantów
Niemal wszystkie patenty były w zakresie
nauki, technologii, inżynierii i matematyki –
STEM (science, technology, engineering
and math) – obszary, które powszechnie
są uznawane za najważniejsze dla
wzrostu zatrudnienia.
nytimes.com, Immigrants Are Crucial to Innovation, Study Says, by ANDREW MARTIN , June 25, 2012
Street View (Google)
Streetside (Microsoft)
• Microsoft. Pod koniec 2009 roku
projekt Streetside będący częścią
projektu Bing Maps.
• UltraCam mobile: 12 megapikselowy
aparat z sześcioma obiektywami
co 4 metry zapisuje 6 zdjęć o
wielkości 16 MB i 16-bitowej
głębi kolorów.
Chip III.2011
GPS
•
•
•
•
Global Positioning System
Światowy system określania położenia
Baza: 24 satelity
Dokładność do 10 m.
AGPS
• Ustalanie pozycji wspomagane BTSami –
stacjami bazowymi GSM (anten)
operatorów komórkowych
• Dokładniej i szybciej
kwiecień 2012 www.pcworld.pl
Inne formy źródeł
informacyjnych Sieci
Media społecznościowe –
dziennikarze 1/2
• Według badan Multi Communications 85%
dziennikarzy korzysta z mediów
społecznościowych.
• Sięgają do tego kanału zbierania informacji
także w pracy zawodowej (77%).
• Nastąpił znaczący wzrost zaufania do mediów
społecznościowych jako źródła informacji.
• W dalszym ciągu treści znajdowane w mediach
społecznościowych są dla dziennikarzy bardziej
atrakcyjne niż wiarygodne.
Raport: Dzienni karze i Social Media 2012, Warszawa 2012
Raport: Dzienni karze i Social Media 2012, Warszawa 2012
Media społecznościowe –
dziennikarze 2/2
• Rośnie zaufanie do blogów, Twittera,
spada do Wiki i FB
• Źródło opinii, mniej
faktów – danych liczb.
Raport: Dzienni karze i Social Media 2012, Warszawa 2012
Raport: Dzienni karze i Social Media 2012, Warszawa 2012
DarkNet – sieć Tor
(The Onion Router)
Darknet
– ciemna strona sieci
• nieuregulowane, nie do końca zbadane,
• nie do końca bezpieczne miejsce, szczególnie
dla zwykłych użytkowników.
• Strefa zdemilitaryzowana wykorzystywana do
przeprowadzania nielegalnych interesów oraz
przesyłania treści, których dystrybuowanie jest
zabronione i karane w każdym normalnym
kraju.
element tzw. ukrytej sieci
(deep web)
• Czyli zasobów WWW, które z uwagi
• na specyficzną budowę i konfigurację
• stron nie są indeksowane przez zwykłe
wyszukiwarki
• Anonimizowany ruch, szyfrowanie danych,
nietypowe protokoły komunikacyjne i domeny
• Dostęp ograniczony
• Zamiast wyszukiwarek - katalogi
„Zasoby” dark netu
• Strony dla sprzedających skradzione karty
płatnicze, broń, narkotyki, złośliwe
oprogramowanie, dane osobowe,
pornografia.
• Fora dla cyberprzestępców i platformy
hazardowe – wszystko, co jest zabronione w
„normalnym” internecie.
• Generalnie wygląda to, jak jedno wielkie
bagno.
WWW.PCWORLD.PL LISTOPAD 2013
Oferta Dark Webu 1/2
• narkotyki – ok. 3000 rodzajów substancji
psychotropowych i środków odurzających (portale Hidden
Eden, Dat Good, Freedom Hosting, Silk Road - serwis został zlikwidowany w 2013 r.
przez FBI, cztery tygodnie po zlikwidowaniu Silk Road powstał Silkroad 2.0 ),
•
•
•
•
kradzioną lub podrabianą elektronikę,
broń (giełdy Black Market Reloaded, Armory),
materiały rozszczepialne,
podróbki luksusowych produktów (np. markowych
perfum, zegarków)
• fałszywe dokumenty (prawa jazdy, paszporty,
dokumenty identyfikujące tożsamość, dokumenty
potwierdzające zdobyte umiejętności),
Oferta Dark Weba 2/2
• skradzione karty kredytowe (forum HackBB - największe w
sieci, zniknęło z sieci w 2013 r.),
• skradzione dzieła sztuki,
• uzyskane nielegalnie zawartości kont e-mailowych, a także
portali internetowych,
• filmy i fotografie z dziecięcą pornografią (strona Hard Candy),
• materiały dla seksualnych zboczeńców i fetyszystów,
• przestępcze instrukcje ( np. jak zbudować bombę, wyhodować
grzyby halucynogenne, wytwarzać narkotyki),
• bardzo silne leki przeciwbólowe, środki na potencję,
antydepresanty (legalnie przepisywane tylko na receptę),
• kompromitujące zdjęcia i nagrania wykonane ukrytą kamerą
E. Bendyk, Podziemny Internet. Ciemna Sieć, „Polityka”, 2013, nr 47 (2934), s.24-26; Julia Chmielecka, Po ciemnej stronie
Internetu, „Gazeta Wyborcza”,; http://wyborcza.pl/duzyformat/1,130283,13318724,Po_ciemnej_stronie_internetu.html,
30.01.2013; E. Bendyk, Podziemny Internet, Op. cit., s.24-26; J. Chmielecka, Po ciemnej stronie Internetu, Op. cit.
Inne treści/usługi DarkNetu
• Informacje jak konstruować bomby,
• polecające płatnych zabójców,
• oferujące dziecięcą pornografię (serwis Freedom Hosting –
największy z dziecięcą pornografią, umożliwiający
przechowywanie i wymianę plików, został zlikwidowany przez
FBI w sierpniu 2013 r.),
• wynajmujące hakerów,
• publikujące wycieki danych, które umożliwiają identyfikację
innych osób,
• oferujące szkolenia z technik szpiegowskich,
• handlujące bitcoinami (wirtualna waluta)
•
E. Bendyk, Podziemny Internet, Op. cit., s.24-26; B. Świderski, Najciemniejszy zakątek Internetu naprawdę istnieje. Ukryta sieć TOR: „lewe” papiery,
pedofilia, przekręty i narkotyki, http://natemat.pl/32267,najciemniejszy-zakatek-internetu-naprawde-istnieje-ukryta-siec-tor-lewe-papiery-pedofiliaprzekrety-i-narkotyki
Walka z Dark - Operation Onymous
• The investigation, was aimed chiefly at sellers, and
deactivated upward of 50 such websites, including
Silk Road 2.0 and Blue Sky, as well as Mr. Quid’s
Forum and Cannabis Road Markets, according to
Europol, the European Union’s law enforcement
agency.
• Raids took place across Europe, including France,
Germany, Spain, Britain and Ireland. Mr. Bharara’s
office cited the cooperation of those countries, as
well as Bulgaria, the Czech Republic, Finland,
Hungary, Latvia, Lithuania, Luxembourg, the
Netherlands, Romania, Sweden and Switzerland.
http://www.nytimes.com/2014/11/08/world/europe/dark-market-websites-operationonymous.html?emc=edit_th_20141108&nl=todaysheadlines&nlid=4706125&_r=0
Anonimowość - pozytywy
• Onionland jest idealny dla złoczyńców, jednocześnie
czyni to miejsce bastionem osób walczących o
wolność słowa.
• Z Tora korzystały
• również media (prowadzona przez magazyn „New
Yorker” skrzynka Strongbox, do ktorej można
• przesyłać poufne informacje dla dziennikarzy, oparta
jest na Tor Hidden Services).
• Nieoficjalnie mówi się też, że z anonimizujących
rozwiązań opartych na Torze korzystają niektóre
• amerykańskie instytucje rządowe.
WWW.PCWORLD.PL LISTOPAD 2013
Przydatne linki
• www.torproject.org – strona główna projektu
Tor
• freenetproject.org – strona projektu Freenet
• www.i2p2.de – strona projektu Invisible
• Internet
WWW.PCWORLD.PL LISTOPAD 2013
Anonimizowanie działań w
internecie
• Trasowanie cebulowe (onion routing – stąd
nazwa projektu: Tor – The Onion Router).
• W sieciach korzystających z tego rozwiązania
stosowana jest pseudodomena najwyższego
poziomu .onion.
Narzędzia TORa
• Zestaw oprogramowania – czyli np.
zmodyfikowana wersja Firefoksa, znana jako
Tor Browser Bundle (w jej skład wchodzi
odpowiednio skonfigurowany Firefox, którego
można uruchomić bez instalowania
jakiegokolwiek oprogramowania w systemie).
WWW.PCWORLD.PL LISTOPAD 2013
Nie tylko TOR – Freenet
• Sieć przesyłania informacji, zaprojektowana z myślą
o maksymalnym bezpieczeństwie
• Użytkowników i rozwijana na zasadach open source.
Opiera się na zasobach (przestrzeni dyskowej i
łączach) udostępnianych przez użytkowników.
Transfer danych (domyślnie szyfrowany) odbywa się
za pośrednictwem sieci pośrednich „węzłów”, a
użytkownik odbierający
• dane (lub próbujący podsłuchać transmisję) nie może stwierdzić, czy
osoba, od której je odbiera, jest ich źródłem, czy tylko jednym z
pośredników.
WWW.PCWORLD.PL LISTOPAD 2013
Invisible Internet Project (I2P)
• Wikipedia: jest to peer-to-peer z komutacją
pakietów, szyfrowaniem transmisji oraz w
pełni rozproszoną organizacją, która powstała
10 lat temu jako modyfikacja Freenetu.
• Nie ma tu oczywiście centralnego węzła sieci, przesyłane dane
są szyfrowane przez każdy z węzłów pośredniczących w
transmisji, co znacznie utrudnia ustalenie prawdziwych
adresów IP węzła źródłowego i docelowego. Co ważne –
transmisja odbywa się przez jednokierunkowe tunele o
krótkim czasie życia, co dodatkowo utrudnia monitorowanie
transmisji.
WWW.PCWORLD.PL LISTOPAD 2013
Rafinacja informacji
Informacyjne źródło
zasobów sieciowych
– biały wywiad 2.0,
analiza sentymentów
wymagających działania informacji przybywa
szybciej, niż jesteśmy w stanie na nie
reagować
doszliśmy do granic możliwości naszej percepcji i
teraz to my stanowimy wąskie gardło
światowej Sieci...
Big Data vs. Better Data:
Marketing Beyond Hunting
& Gathering
Dana Hayes Jr. | Media
Planning | October 9,
2013. ClickZ.
Big data – baza rafinacji
• Big Data to zasoby w
postaci cyfrowej,
których istotną część
tworzą wszelkie
informacje dostępne w
internecie:
•
•
posty, blogi, strony, fora, profesjonalne wydawnictwa (dzienniki,
periodyki, książki i inne podobne wydawnictwa, np. – 235 terabajtów
danych zebranych w US Library of Congress do IV.2011).
Zbiór 100 milionów wiadomości agencyjnych z całego świata, który
obejmuje pół wieku ludzkiej cywilizacji, cyfrowa biblioteka 4%
wszystkich książek wydrukowanych w okresie sześciu wieków, zasoby
branżowe, np. Służba zdrowia.
Big Data – trzy V
• Volume (ilość): wielkie dane rozpoczynają się od
zbiorów petabajtowych,
• Variety (różnorodność): odnosi się do wielu różnych
typów danych i plików, dla których tradycyjne
relacyjne bazy danych są źle dostosowane, np.: pliki
dźwiękowe i wideo, dokumenty, dane geolokacyjne,
logowania sieciowe, linki tekstowe,
• Velocity: szybkość aktualizacji i używania danych
niezbędna, by kreować wartość.
Piotr Płoszajski, Big Data: nowe źródło przewag i wzrostu firm. E-mentor nr 3 (50) / 2013
Big data - źródła
• Big data są także tworzone przez
urządzenia komórki (5 mld w 2010 r.),
komputery, cyfrowe kamery, aparaty
fotograficzne, czytniki RFID, samochody,
domy, inteligentne mierniki np. poboru
energii elektrycznej i GPSy.
BD w Europie Zach.
• Technologie i usługi BD 2013-1014: z 2,3 do
2,9 mld. USD. 6,8 w 2018
http://www.emarketer.com/Article/Big-Datas-Potential-Western-Europe-Isnt-BigIts-Massive/1011270/2
Inteligentne liczniki prądu –
Smart Meter
Źródło informacji o prywatnych
zachowaniach użytkowników prądu:
– Posiłki
– Sen
– Toaleta
– Pranie
– Typ TV (skok poboru mocy)
Rafinacja informacji
• Jest peryskopem pomiędzy dwoma
poziomami informacji: poziomu bazowego
i poziomu wyniku rafinacji.
• Umożliwia dostrzeganie informacji z
otoczenia/poziomu bazowych informacji
(czyste informacje z WWW) tych, które są
na poziomie informacji będących wynikiem
rafinacji.
Rafinacja – ilościowy opis zjawisk
• Rafinacja pozwala uzyskać liczby opisujące
wartości wybranych wymiarów przestrzeni
badanego przedmiotu rafinacji.
• Np. liczby pozytywnych (jeden wymiar) i
negatywnych (drugi wymiar) opinii na temat
wybranej osoby, zdarzenia, firmy.
• Wartości wymiarów pozwalają monitorować
przedmiot rafinacji, określać jego bieżący stan
oraz szacować jego przyszłe zmiany.
Inne określenie rafinacji:
Data management platform (DMP)
• Platforma do zarządzania danymi (DMP) lub
ujednolicone zarządzanie danymi (UDMP).
• Scentralizowany system komputerowy do zbierania,
integracji i zarządzania dużymi zasobami
ustrukturyzowanych i nieustrukturyzowanych danych
z różnych źródeł.
• Skuteczne DMP – technologia zarządzania
informacjami i ich analizą w postaci
oprogramowania zapewniającego dostęp do
spójnych, dokładnych i aktualnych informacji.
Datability
• Zdolność wykorzystania dużych wolumenów
danych w sposób odpowiedzialny
i zrównoważony.
• Np. wśród wyników znajdą się cytaty z forów, blogów i
serwisów tematycznych, dotyczących poszukiwanego
hasła.
• Aplikacja sama też podzieli znalezione komentarze na
pozytywnie i negatywnie nacechowane emocjonalnie.
• Wskaże najbardziej wpływowych liderów
opinii publicznej.
www.pcworld.pl maj 2014
In-memory computing
• SAP - system analizujący grę drużyny
piłkarskiej. Zawodnicy zostali „uzbrojeni" w
zestaw czujników mierzących ich prędkość
poruszania się, rytm serca itd.
• Generowane przez nie dane na bieżąco
spływają do aplikacji opartej na platformie
SAP HANA. Zwrot wyniku jest
natychmiastowy.
www.pcworld.pl maj 2014
Mecz
• Zaimplementowanie czujników na boisku i w
osprzęcie piłkarzy pozwala analizować wszystko,
co wydarzyło się w trakcie gry, bez konieczności
oglądania potem całej rozgrywki na wideo.
• Na mecz można spojrzeć przez pryzmat
liczb i dostrzec zależności.
• Pomaga to piłkarzom po meczu zrozumieć, co
robili i jak się zachowywali, kiedy wygrywali, a jak
i kiedy przegrywali
www.pcworld.pl maj 2014
Alerty
• Ilościowe miary rafinacji umożliwiają m.in.
uruchomienie funkcji alertu – automatyczne
powiadamianie użytkownika o ważnych dla niego
(przekroczenie progu zadanej wartości
wymiaru/ów) zmianach zachowań przedmiotu
rafinacji.
• W odniesieniu do mediów idzie tu także o
automatyczne monitorowanie sieci w
poszukiwaniu – ilościowo ocenianych –
najpopularniejszych informacji.
Narzędzia alertów
Newspoint
Culturomics
• Dwa istniejące filary rafinacji: Culturomics
i Curation.
• Culturomics obejmuje aktywności
związane z eksploracją szerokiego
spektrum kulturowych trendów poprzez
komputerową analizę cyfrowych archiwów
książek. Stwarza nowe możliwości wglądu
w funkcjonowanie społeczeństwa
194
„curation"
• Dopasowywanie wyników
wyszukiwania w internecie
do preferencji
użytkownika.
• Curatorem jest ktoś
kto ciągle szuka, grupuje,
organizuje i udostępnia
najlepszą, najbardziej
odpowiednie treści dla
specyficznych potrzeb
online.
Przykład curation
• Axiom – 500 milionów konsumentów, 1500
kategorii informacji o każdym
• Każdy umieszczany jest w jednej z 70
socjoekonomicznych kategorii
Consumer Data, but Not for Consumers, By NATASHA SINGER, Published: July 21, 2012, NYT.
Rafinacja - zasięg
• Analizując miliardy postów, blogów i
artykułów dostępnych online możliwe jest
uzyskanie nowych informacji o
społecznych fenomenach, państwach,
organizacjach i osobach (relacje, migracje
itp.)
• Wynik: ocena emocji relacji: sympatia,
antypatia, poczucie szczęścia, optymizm,
pesymizm, strach.
Narzędzia
rafinacji
• Wyszukiwarki
• Dane behawioralne
(zachowania w Sieci)
• Personalizacja (np. kryteria opisujących osobę
decydują o wynikach wyszukiwania)
• Zaawansowane narzędzia, np. ocena
sentymentu (Attentio)
Diagnoza emocjonalnych
odczuć adresata przekazu
• Tłumaczenie emocjonalnych odczuć
na liczby.
• Analityczne narzędzia mierzące sentyment
użytkownika Sieci (sentiment analysis)
do określonych zdarzeń, informacji, marek
towarowych oraz towarów, a nawet
wskazywania dni, w których Internauci są
najbardziej podatni na określone przekazy
informacyjne.
Bo Pang, Lillian Lee, Opinion Mining and Sentiment Analysis, Publishers Inc. Hanover, USA,
2008. United States Gross National Happiness, za: http://apps.facebook.com/usa_gnh/ [wrzesień 2009].
Hadoop
• Zbiór standardów do analizy dużych zbiorów
danych
• Hadoop jest metodą dystrybucji, zarządzania i
przetwarzania bardzo dużych i często
różniących się danych.
• Jest to oprogramowanie typu open-source,
jest dziełem Yahoo i Google’a
Inne narzędzia analizy Big Data
• Pivotal
• Predix
Ocena emocji z Twittera 1/2
• Analiza komunikatów (ang.) >2 mln osób z
84 krajów (II.2008 – I.2010).
• Emocjonalny ton (wybrane słowa i
emotikony) komunikatów jest podobny w
skali tygodnia, pór roku.
• 7% - nocne marki, 16% - poranne
skowronki.
• Najlepsze samopoczucie 6-9 rano/koniec
tygodnia/lato, kryzys po 15.00/początek
tygodnia/jesień-zima.
Ocena emocji z Twittera 2/2
http://www.nytimes.com/2011/09/30/science/30twitter.html?_r=1&nl=todaysheadlines&emc=tha26
Mierzenie szczęścia narodowego w czasie
realnym - infodemiologia
• Martin Seligman w książce Fluorish: A Visionary New
Understanding of Happiness and Wellness pisze:
• Dobrobyt ma swoje słownictwo: będziemy w stanie
mierzyć dobrobyt na planecie w czasie realnym przez
czytanie zdepersonalizowanych maili i liczenie słów i
fraz związanych z dobrobytem i niepowodzeniem.
• Możliwości takich dostarcza obecnie metodologia Big Data
stosowana w dziedzinie badań zwanej infodemiologią.
Piotr Płoszajski, Big Data: nowe źródło przewag i wzrostu firm, http://www.ementor.edu.pl/czasopismo/spis-tresci/numer/50
Informacja o poczuciu
szczęścia użytkowników Sieci
– wg. Liczby użytych na stronie słów:
szczęście, wspaniale!, smutek, wątpliwości i tragedia
http://apps.facebook.com/gnh_index/
October 12, 2009, NYT, Link by Link, Is It a Day to Be Happy? Check the Index, By NOAM COHEN
United States Gross National Happiness
(2009)
http://apps.facebook.com/usa_gnh/
https://foursquar
e.com/10million
https://foursquare.com/10million
Aktywność w Twitterze
Wybór czasu generowania reklam
Twitter Knows When You Sleep, and More
By SOMINI SENGUPTA |NYT, June 7, 2012,
Sympatie polityczne:
nieb. – demokraci, róż. - republikanie
Twitter Knows When You Sleep, and More
By SOMINI SENGUPTA |NYT, June 7, 2012,
Wyniki rafinacji –
przewidywanie przyszłości
• Zachowania giełd, sprzedaż książek,
wideo
• Choroby
• Zjawiska
polityczne
i społeczne
• Konflikty
społeczne
Liczba
odniesień
300
250
200
150
100
50
0
18
19
20
21
22
Jarosław Kaczyński
23
24
25
26
Bronisław Komorowski
27
Tydzień
Dynamiczna analiza relacji informacji w Sieci
Wizualizacja - Tableau
• Allow people across the business and data groups to actively
collaborate on analysis to reach conclusions
faster. ClearStory’s breakthrough in collaboration, provides
an easy, natural way for people to actively participate in an
analysis. It lets users capture discussions on evolving insights,
ask new questions, annotate visualizations and share their
business intuition in a consistent way to speed conclusions.
Collaboration is uniquely data-aware, capturing both the
visual context and state of the data for each discussion, so
insights and actions can be tracked in real-time and over time.
Do away with static reports, PowerPoints, and email threads
and let collaborative capabilities ensure consistency
of insights.
Preferencje wyborcze przed wyborami
parlamentarnymi w Polsce w 2011 r.
• Ilustracja potencjału rafinacji sieciowej.
• Wskazanie i weryfikacja narzędzi obróbki
informacji umożliwiających ocenę
bieżących preferencji wyborczych.
• Możliwa była wiarygodna ocena bieżących
preferencji wyborczych przed wyborami
parlamentarnymi w Polsce w 2011 r. na
podstawie rafinacji sieciowej.
Rozkład liczb wpisów pozytywnych (A) i
negatywnych (B) na forach
Rozkład różnic liczb wpisów pomiędzy
wpisami pozytywnymi a negatywnymi
Ilustracja podobieństwa/różnic proporcji (nie
bezwzględnej wielkości) pozytywnych wpisów
na blogach z liczbą uzyskanych głosów
Wartości korelacji Pearsona i Spearmana związku
wartości wyników sondaży CBOS z liczbami
pozytywnych wpisów na blogach dla wszystkich partii
wraz z wartościami istotności
Wyniki rafinacji
• Ocena przeszłości, zmian na podstawie
korpusu 5.2 milionów książek z lat 1500 2008 containing about 4% of all books
ever printed.
• Np. badanie kulturalnych trendów,
korzystanie z kolektywnej pamięci, ocena
adaptacji nowych technologii,
epidemiologia, cenzura itp.
Google wykresy i liczby
• Google udostępnił do analizy bazę 5.2
milionów książek dla on-linowych analiz –
4% wszystkich książek od 1800 roku.
• Baza zawiera 15 milionów książek – 12%
od Biblii Gutenberga z 1450 r.
file:///E:/Materia%C5%82y/17words.html
file:///E:/Materia%C5%82y/1600.full.htm
5,2 mln cyfrowych książek – Google
- Ngram Viewer (p#)
• 7,5 mln książek, 6% wszystkich opublikowanych
• 500 miliardów słów: English, French, Spanish,
German, Chinese and Russian.
• Źródło oceny kulturowych trendów na świecie.
• Inne rozumienie języka, kultury i przepływu idei
• Zjawisko: culturomics
• Aktualizacja 27.01.2013 – 20 milionów
książek
Dickens, Austen and Twain, Through a Digital Lens, By STEVE LOHR, Published: January 26, 2013, NYT
December 7, 2013, In a Scoreboard of Words, a Cultural Guide, By NATASHA SINGER, NYT
http://www.sciencemag.org/content/early/2
010/12/15/science.1199644
December 16, 2010, NYT.
In 500 Billion Words, New Window on Culture
By PATRICIA COHEN
December 16, 2010, NYT.
In 500 Billion Words, New Window on Culture
By PATRICIA COHEN
http://ngrams.googlelabs.com/graph?content=education%2Ccomputer%2Cmone
y&year_start=2000&year_end=2008&corpus=0&smoothing=0
http://books.google.com/ngrams/graph?content=computer%2Ceducation%2Cmoney&year_start=1800&year_end=2000&corpus=15&smoothing=10&share=
styczeń 2013
Wartość BD dla medycyny
• Analiza 100 milionów przypadków chorych
poważnych epidemii (polio, measles, rubella,
mumps, hepatitis A, diphtheria and pertussis,
or whooping cough) w USA od 1924 roku
wskazuje m.in. skuteczność szczepionek.
• Uratowano 3 – 4 miliony osób.
• Dane (ogólnie dostępne) mogą służyć do
przewidywania konieczności stosowania
szczepionek.
November 27, 2013, 5:00 pm The Vaccination Effect: 100 Million Cases of Contagious Disease
Prevented, Yhe NYT, Bits, By STEVE LOHR
Intensywność epidemii w latach
November 27, 2013, 5:00 pm The Vaccination Effect: 100 Million Cases of Contagious Disease
Prevented, Yhe NYT, Bits, By STEVE LOHR
Intensywność epidemii w latach
Dawniej
teraz
November 27, 2013, 5:00 pm The Vaccination Effect: 100 Million Cases of Contagious Disease
Prevented, Yhe NYT, Bits, By STEVE LOHR
Otwarty Project Tycho – dla
zdrowia
• It is called, after the 16th century Danish
nobleman Tycho Brahe, whose careful,
detailed astronomical observations were the
foundation on which Johannes Kepler made
the creative leap to devise his laws of
planetary motion.
November 27, 2013, 5:00 pm The Vaccination Effect: 100 Million Cases of Contagious Disease
Prevented, Yhe NYT, Bits, By STEVE LOHR
http://www.google.org/flutrends/about/how.html
Web data predict flu
Tendencje aktywności wirusa grypy –
Polska (2014-2015)
http://www.google.org/flutrends/pl/#PL
Przykład: tendencje aktywności wirusa grypy
na świecie
Odkryliśmy, że niektóre z wyszukiwanych haseł są dobrymi wskaźnikami
aktywności grypy. Google Flu Trends używa zagregowanych danych
wyszukiwania Google do szacowania aktualnej aktywności grypy na całym
świecie niemal w czasie rzeczywistym.
http://www.google.org/flutrends/about/how.html
Częstotliwość słów w książkach/lata
December 16, 2010, NYT.
In 500 Billion Words, New Window on Culture
By PATRICIA COHEN
Prognozowanie z informacji
sieciowych
• Ludzie szukając dzisiaj wskazują co będą robili
w przyszłości.
• Np. bezrobocie, sprzedaż samochodów,
choroby.
• Badania potwierdziły prognozy sprzedaży filmów
i pozycję muzyki na liście przebojów.
• Realne przewidywanie kolektywnych zachowań
w zakresie ekonomii, kultury
i polityki.
Rafinacja w czasie rzeczywistym
• Udostępnia oczekiwane informacje na bieżąco,
które są wynikiem procesu rafinacji.
Wartość wyszukiwania dla filmu, gry i piosenki
Zbieżność dat publikacji z wartością zapytań
Predicting consumer behavior with Web searchSharad Goel1, Jake M. Hofman1, Sébastien Lahaie1, David M. Pennock1, and Duncan J. Watts1
Microeconomics and Social Systems, Yahoo! Research, 111 West 40th Street, New York, NY 10018
Edited* by Simon A. Levin, Princeton University, Princeton, NJ, and approved August 10, 2010 (received for review April 29, 2010)
Sentione usługi
• dotarcie do źródeł wypowiedzi problematycznych i
rozwiązanie problemu,
• porównanie z konkurencją,
• kompletna usługa, dane do 3 lat wstecz,
• szybkość,
• możliwość personalizacji,
• przyjazny interfejs,
• okres próbny i dogodny system płatności, choć dość
kosztowny.
Sentione - zakres
• dowolna liczba zwrotów kluczowych,
• przeszukuje cały Polski Internet i dane z 6
innych krajów,
• lista najważniejszych wypowiedzi z ostatnich
30 dni,
• mierzenie efektywności, szumu, pokazanie
źródeł,
• precyzuje, kto miał wpływ na
rozprzestrzenianie się informacji,
http://sentione.pl/search?q=iPhone [12.IV.2013]
http://sentione.pl/search?q=Legia
http://sentione.pl/search?q=Legia
Brandometr
• Brandometr pozwala na bieżąco śledzić nowe
wypowiedzi, jakie pojawiły się w Internecie na
temat danej marki.
• Umożliwia łatwe odnajdowanie trwających
dyskusji, przysłuchiwanie się im oraz włączanie
się do nich.
• Śledzi: blogi (>600 000), fora (>23 000) i inne
• odnajdywanie tzw. liderów opinii, wywierających
wpływ na innych użytkowników.
Brandometr
przykład zawartości raportu – analiza ilościowa oraz treści
•
•
•
•
•
•
•
•
•
•
- Ilość wyników ogólnie
- Ilość wyników w czasie
- Ilość wyników w czasie z oznaczonymi wydarzeniami
- Ilość wyników w czasie (tylko social media)
- Ilość wyników w czasie (tylko newsy i artykuły)
- Sentyment narracji
- Sentyment
- Najpopularniejsze źródła wyników
- Liderzy opinii
- Przykładowe wypowiedzi
Marka: OLT Express
Sentyment
narracji:
Najpopularniejsze źródła:
Najpopularniejsze źródła artykuły:
Mobuzzer
• oprogramowanie typu SaaS
• gromadzeni danych ilościowych oraz
demograficznych związanych z zachowaniami
użytkowników społeczności,
• oprogramowani analizujące semantykę treści
publikowanych przez internautów.
• Mobuzzer staje się narzędziem łączącym w sobie
zarówno analizę ilościową jak i jakościową działań w
sieci
• dla marketerów monitorujących skuteczność działań w sieci, jak i
pracowników agencji PR oraz agencji interaktywnych odpowiadających za
podejmowane przedsięwzięcia..
Using Algorithms to Determine Character
(pracownik, spłata krydytu)
• Character (though it is usually called something more neutralsounding) is now judged by many other algorithms. Workday,
a company offering cloud-based personnel software, has
released a product that looks at 45 employee performance
factors, including how long a person has held a position and
how well the person has done. It predicts whether a person is
likely to quit and suggests appropriate things, like a new job or
a transfer, that could make this kind of person stay.
• There are reasons to think that data-based character
judgments are more reasonable.
• “Algorithms aren’t subjective,” he said. “Bias comes from
people.”
http://www.nytimes.com/2015/07/28/technology/elon-musk-and-stephen-hawking-among-hundreds-to-urgeban-on-military-robots.html?emc=edit_th_20150728&nl=todaysheadlines&nlid=4706125&_r=0
Wolfram|Alpha
• Making the world’s knowledge computable
• introduces a fundamentally new way to get
knowledge and answers—
not by searching the web, but by doing
dynamic computations based on a vast
collection of built-in data, algorithms, and
methods.
News Point
• . umożliwia śledzenie ponad 180 tys. źródeł
(90 tys. forów, 70 tys. blogów) oraz oferuje
ocenę sentymentu (wydźwięku)
poszczególnych postów lub komentarzy.
System rekomendacji (SR)
• to technologia filtrowania informacji
wykorzystywana w serwisach e-commerce do
prezentowania informacji o produktach które z
dużym prawdopodobieństwem mogą być
interesujące dla klientki/klienta.
• odfiltrowują nieinteresujące użytkownika
informacje, sugerując te, które zapewne
http://www.webopedia.com/
przypadną mu do gustu.
TERM/R/recommender_syst
http://www.webopedia.co
m/TERM/R/recommende
r_systems.html
ems.html
Systemy rekomendacyjne - podział

systemy bazujące na cechach pewnych grup/produktów
(ang. Content Based Filtering),

systemy
bazujące
na
ocenach
innych
użytkowników
(ang. Collaborative Filtering),

systemy hybrydowe bazujące na obu powyższych metodach.
http://tsiss.wordpress.com/2011/1
1/27/systemy-rekomendacyjne/
Collaborative Filtering
• CF – odrzuca cechy danego produktu/strony
internetowej skupiając się wyłącznie na
opiniach i rekomendacjach jego
użytkowników/kupujących.
• Gust osób określany jest poprzez zapis ich
przeszłych decyzji (np. kupna) i ocen jakie
wystawiły. Osoby z podobnymi „historiami”
uznawane są za „gustopodobne”.
StumbleUpon ( ang. Natknąć się
przypadkiem)
• jest to wyszukiwarka stron i treści
internetowych oparta na opisanym powyżej
systemie CF.
• Efekt – podpowiedzi stron zbliżonych do
profilu/oczekiwań internauty
Polska (ułamek danych)
Minerva –
inicjatywa Pentagonu
• Poszukiwania w celu zdefiniowania i
rozwoju podstawowej wiedzy o obecnych
i przyszłych konfliktach w kierunku
lepszego zrozumienia politycznych
trajektorii w kluczowych regionach świata.
• Doskonalenie możliwości DoD w celu rozwoju
nauk społecznych, problemów zagranicznych i
interdyscyplinarnych studiów.
http://minerva.dtic.mil/
Psychohistoria
Issac Asimov
• Kombinacja matematyki i psychologii do
przewidywania przyszłości.
• Obecnie bazą „big data”: RFID,
POSy,Twitter, Facebook, blogi, Wiki,
lokalizacja komórek, ruch w Sieci,
zapytania, dane z rynków finansowych,
webcamy z ulic. Efekt – przewidywanie
politycznych kryzysów, rewolucji i innych
form społecznej i ekonomicznej
niestabilności, epidemii.
Ton dziennikarskich
wiadomości z Egiptu
First Monday, Volume 16, Number 9 - 5 September 2011, in:
http://www.uic.edu/htbin/cgiwrap/bin/ojs/index.php/fm/article/view/3663/3040. {January 2012].
Tunezja
First Monday, Volume 16, Number 9 - 5 September 2011, in:
http://www.uic.edu/htbin/cgiwrap/bin/ojs/index.php/fm/article/view/3663/3040. {January 2012].
Nazwy miejsc blisko słów Bin
Laden
By Michel JB, Shen YK, Aiden AP, Veres A, Gray MK, Pickett JP, Hoiberg D, Clancy D, Norvig P, Orwant J, Pinker S, Nowak MA, Aiden EL,
Quantitative Analysis of Culture Using Millions of Digitized Books, Science; 1/14/2011, Vol. 331 Issue 6014, p176-182, 7p.
Predykcja – Big Data
• Dzięki poprawnej analizie zmieni się sposób
uczenia się. Będziemy mogli dokonywać
predykcji bez wcześniejszego budowania
modeli i tworzenia teorii.
• Np. Google „wytrenował” swój francusko-angielski automat
tłumaczeniowy poprzez załadowanie do niego kanadyjskich
dokumentów, które zwykle publikowane są równocześnie w
obu językach. Żadna z osób pracujących nad chińskim
programem translacyjnym nie mówiła po chińsku. Nie było też
żadnej teorii języka chińskiego - tylko dane.
Piotr Płoszajski, Big Data: nowe źródło przewag i wzrostu firm. E-mentor nr 3 (50) / 2013
Algorytm wykrywania zbrodni
• Raport mniejszości". świat w którym
przestępstwa są wykrywane, zanim do nich
dojdzie.
• Rozwiązania z zakresu tzw. Predictive Policing
istnieją już dziś.
Precobs
• „Nasze prognozy opierają się na szczegółowych
danych dotyczących przestępczości w danym reionie:
są analizowane miejsca, czas, opisowe cechy
przestępstw i wykroczeń, tryb działania, motyw, łup
itp.
• Dane archiwalne z ubiegłych lat pozwoliły nam
opracować i skonfigurować silnik reguł".
• System Precobs pozwala przewidywać lokalizacje, w
których prawdopodobieństwo wystąpienia w
najbliższym czasie działań sprzecznych z prawem jest
wysokie (Zurych – 86%).
MARZEC 2015 CHIP.PL
“We’re moving
towards a ‘postautomated’ world,
where the valuable
thing about people
will be their
emotional content,”
Praca ludzka zyskuje
na wartości, rzeczy
tracą wartość
Increasingly, the
most valuable things
in our world involve
people looking at
you, touching you
and understanding
you.
Changed Life of the Poor: Better Off,
but Far Behind
By ANNIE LOWREYAPRIL 30, 2014
Valuable Humans in Our Digital
Future, NYT,
By QUENTIN HARDY May 3, 2014,
Autonomiczne źródła informacji
Obrazy z dronów
• Zdjęcia z niebezpiecznych,
niedostępnych regionów
• Zasięg do 40 km,
autonomia, GPS
• Sensory
temperatury
• Zagrożenie
prywatności
BBC News
BBC News
BBC News
Dostęp do internetu, fotografie,
kilka lat lotu,
http://gadgets.ndtv.com/others/news/with-purchase-of-drone-maker-google-sees-a-fleet-of-satellites-508639
Autonomia –
obrona (więcej →zasoby
• Roboty zakładają tysiące reklamowych blogów, kont
pocztowych, całych stron. Inny sposób wykorzystania tych robotów
to zakładanie kont pocztowych w celu wykorzystania ich
do rozsyłania spamu.
Completely
Automated Public
Turing Test to Tell
Computers and
Humans Apart
• Hawk Eye, RFID-piłka, snipery, robo-trader, OIOM
• Dokładność punktu odbicia piłki Hawk-eye wynosi około 3,6
milimetra.
System Cairos GLT
• działanie oparte jest na polu magnetycznym w celu
określenia, czy piłka przekroczyła linię bramkową ,czy
też nie.
• System Cairos GLT można szybko i łatwo zainstalować
w każdym stadium, zajmuje on bardzo mało miejsca i
nie ma też wpływu na stadionową infrastrukturę.
• Niezależny od pogody, oświetlenia
http://www.cairos.com/?page_id=28
Hawk-eye w piłce nożnej - GoalRef
• dostarcza sędziemu informacji w momencie
przekroczenia linii bramkowej przez piłkę.
• Wykorzystywane do tego jest pole
magnetyczne i specjalne czujniki.
• Od sezonu 2013/2014 system siedmiu kamer
kontrolował bramki w rozgrywkach ligi
angielskiej.
Cyfrowy testament
Po zmarłych mogły pozostać
• pieniądze w bankach online,
• wartościowe sentymentalnie i materialnie
materiały multimedialne,
• zdjęcia w sieciowych galeriach,
• życiorysy i CV w serwisach rekrutacyjnych,
• maile itp.
Cyfrowy testament
• Facebook – kilka milionów kont osób
nieżyjących. W tym roku przybędzie kolejne 1,5
mln kont należących do zmarłych.
• Usługa polegająca na spisaniu cyfrowego
testamentu. Umożliwia to bliskim zmarłych
użytkowników odzyskanie ich kont i zarządzanie
nimi.
• Twitter - LiveOn
Konta bakowości online
• Po śmierci brak dostępu do kont osoby zmarłej
– żadnych papierowych śladów
• 45% zamożnych osób w USA nie zostawia
śladu dostępu do majątków w bankach online:
co w nich jest, jakie loginy, hasła
5 zasad cyfrowego finansowego życia
na wypadek śmierci
1. prowadzić papierową listę swoich cyfrowych
informacji,
2. wysłać informacje do kogoś zaufanego,
3. upewnić się, że inni ludzie wiedzą, kto ma
informacje,
4. zostawić instrukcje, jak wszystkie konta
obsługiwać,
5. wszystko zanotować na papierze i
aktualizować regularnie.
Przykłady miejsc i form
testamentów
• Nagrania wideo i audio (legacylocker,
greatgoodbye)
• Zamieszczanie komunikatów na blogu
(mywebwill)
• Konieczność potwierdzenia przez dwie
osoby lub cykliczne potwierdzanie życia.
• Testament sieciowy bywa łączony z
tradycyjnym.
Dane giną razem z użytkownikiem
• Niektóre firmy internetowe po śmierci
użytkownika kasują wszystkie jego dane.
• Np. Yahoo, obchodzący się w ten sposób nie
tylko z emailami, ale też z prywatnymi
zdjęciami przechowywanymi w należącej do
niego usłudze Flickr.
• Apple odmawia bliskim swoich klientów
prawa do cyfrowego spadku: muzyka, filmy czy
książki kupione w iTunes są udostępniane
wyłącznie nabywcy
GRUDZIEŃ 2013 CHIP.PL
ZostawŚlad.pl
• jest polskim odpowiednikiem stron, takich jak
Netarius (netarius.com) czy LegacyLocker
(passwordbox.com/legacylocker),
• umożliwiają one przekazywanie wskazanym osobom
nagrań wideo, haseł, dokumentów, przygotowanie
ostatniej wiadomości, która zostanie po śmierci
automatycznie opublikowana na Facebooku.
• ZostawŚlad.pl pełni podobne funkcje. Proponuje
użytkownikom przesyłanie ważnych dla nich plików –
muzycznych, filmowych czy tekstowych, pisanie pamiętnika,
zapisanie loginów i haseł, tak by w jednym miejscu zebrać całą
naszą internetową aktywność.
polski serwis Bank na Wypadek
(nawypadek.pl)
• wybierani są powiernicy, bank przechowuje
ważne dokumenty i pliki, udostępniane po
śmierci rodzinie.
Serwisy powiązane z
testamentami – USA
•
•
•
•
•
•
www.ifidie;
www.deadsocial;
www.mywebwill;
www.legacylocker;
www.deathswitch;
www.greatgoodbye.
Inne miejsca ostatniej woli
• Legacy Locker, w którym oprócz tradycyjnego testamentu
można zamieścić pożegnalny list lub film, a także wgrać kopie
ważnych dokumentów.
• Great Goodbye oferuje podobne usługi jak Legacy Locker –
również umożliwia umieszczanie nagrań wideo i audio, a także
utrzymuje dane na serwerze przez 20 lat,
• My Webwill, udostępnia opcję pośmiertnego opublikowania
pożegnalnego tekstu na blogu bądź danym serwisie
społecznościowym.
• Ghost Memo, nie pełni do końca funkcji standardowego
testamentu, jednakże daje szansę wysyłania listów do bliskich
– w ustalonych przerwach czasowych, nawet do 60 lat.
Google
• Od kwietnia 2013 roku. Możemy wybrać opcję
powiadomienia o śmierci przez 2 osoby lub
cykliczne potwierdzanie życia.
• Decydujemy jaki okres braku aktywności w
internecie może być oznaką naszej śmierci (3,
6, 9 czy 12 miesięcy), po czym serwis wysyła
do nas maila.
Pożegnalne wiadomości
• Każdemu możemy przekazać coś innego, wyjaśnić
nieporozumienia, podziękować, dać dobre rady,
przyznać się do błędu, wyjawić skrywaną przez całe
życie tajemnice.
• do 60 lat wprzód wysyłane będą wiadomości zza
grobu, które będą wysyłane w interwałach przez
www.ghostmemo.com.
• Możemy także przygotować wcześniej wiadomość,
która zostanie automatycznie opublikowana np. na
naszej tablicy na Facebooku lub post na blogu
będący zakończeniem naszej aktywności.
LivesOn Twittera
• „gdy Twoje serce przestanie bić, będziesz dalej
tweetować” oraz „Bóg nie istnieje, za to
serwery tak- zaloguj się do prawdziwego życia
po śmierci”.
• Aplikacja po przeanalizowaniu stylu pisania,
gustu, postów i eventów w których po śmierci
nadal nasz profil będzie aktywny. W naszym
imieniu będą pisane posty, czy zaznaczane
ulubione wpisy.
Testament
PCWorld.IX.2011
Twitter
usługa LivesOn - „When your heart stops beating,
you'll keep tweeting”, które na język polski można
przetłumaczyć jako “kiedy twoje serce przestanie bić,
ciągle
będziesz
wrzucać
twitty.”
Usługa
ta
ma
analizować wpisy użytkownika, aby w ten sposób
poznać jego gusta i preferencje i następnie móc
aktualizować się już bez jego udziału, gdy ten umrze. O
tym jak długo taka aktualizacja ma trwać będzie
decydować specjalnie wyznaczona przez zmarłego
użytkownika osoba.
Narzędzie do zarządzania
kontami zmarłych internautów
• Google udostępnił narzędzie o nazwie Menedżer
Kont Nieaktywnych (Inactive Account Manager),
służące do zarządzania danymi przechowywanym w
usługach Google'a po śmierci użytkownika.
• Zamknięcie kont po zadanym okresie nieużywania i
otwarcie spadkobiercom – do 10 nazwisk lub
wykasowanie wszystkiego
• www.google.com/settings/account

Podobne dokumenty

Biznes online (2016) - Technologie Informacyjne

Biznes online (2016) - Technologie Informacyjne rozprzestrzenianiem się – Sieć dla dziesięciu osób stanowi większą wartość od Sieci dla dwóch osób. • Wzrostowi Sieci (ponadnarodowej) nie towarzyszy konstruowanie stosownych regulacji.

Bardziej szczegółowo