SemWeb Sprawozdanie nr 1 Przemysław Kwiatkowski 1.1.3
Transkrypt
SemWeb Sprawozdanie nr 1 Przemysław Kwiatkowski 1.1.3
SemWeb Sprawozdanie nr 1 Przemysław Kwiatkowski 1.1.3 channel rdf:about="http://geist.agh.edu.pl/feed.php"> Typ danyh kanał rss 1.0 <rdf:li rdf:resource="http://geist.agh.edu.pl/pub:teaching:courses:rnd? rev=1381787705&do=diff"/> sekwencji RDF <image rdf:about="http://geist.agh.edu.pl/lib/tpl/dokuwiki/images/favicon.ico"> obrazek <item rdf:about="http://geist.agh.edu.pl/pub:teaching:courses:ids? rev=1381787639&do=diff"> element i podlinkowany obiekt docelowy 1.2.4 Number Subject http://www.kanzaki.com/works/2 1 003/imagedesc/1114yakitoriya.jpg http://www.w3.org/RDF/Validato 2 r/run/1381821373030#p1 http://www.kanzaki.com/works/2 3 003/imagedesc/1114yakitoriya.jpg http://www.w3.org/RDF/Validato 4 r/run/1381821373030#p1 http://www.w3.org/RDF/Validato 5 r/run/1381821373030#p1 http://www.w3.org/RDF/Validato 6 r/run/1381821373030#p1 http://www.w3.org/RDF/Validato 7 r/run/1381821373030#p1 8 genid:A577131 Predicate Object http://www.w3.org/1999/ http://xmlns.com/foaf/0.1/Im 02/22-rdf-syntax-ns#type age http://www.w3.org/1999/ http://jibbering.com/vocabs/i 02/22-rdf-syntax-ns#type mage/#Rectangle http://www.w3.org/RDF/Vali http://jibbering.com/voca dator/run/1381821373030#p bs/image/#hasPart 1 http://jibbering.com/voca "34,86 143,323" bs/image/#points http://purl.org/dc/elemen "Name" ts/1.1/title http://purl.org/dc/elemen "Nobuhisa Shiraishi" ts/1.1/description http://jibbering.com/voca genid:A577131 bs/image/#depicts http://purl.org/dc/elemen "Name of the person" ts/1.1/description 2.2.1 SKOS – model do opisywania struktur oraz różnego rodzaju schematów DCMI – zestaw podstawowych metadanych do opisu różnych zaobów w Internecie FOAF – język do opisu atrybutów i klas, głównie stworzony do połączenia elementów takich jak ludzie i informacje o nich 2.2.2 SKOS – EuroVoc thesaurus, jest używany w terminologii Unii Europejskiej Dublin Core - Open Source Metadata Framework, używany np. w GNOME i KDE, książki w formacie EPUB FOAF – używany przez Google Social Graph oraz SearchMonkey od Yahoo! 2.3 Music Ontology – ontologia używana do opisywanie danych związanych w jakiś sposób z muzyką, np. gatunek, użyte instrumenty, tekst utworów itp. Dane są udostępniane poprzez stronę internetową albo samodzielnie utworzone API. Music Ontology można opisywać jako RDF w HTMLu, JSON lub Turtle, czyli trójki RDFowe. Ontologia ta oparta jest na FOAFie, Event Ontology, Timeline Ontology oraz FRBR Ontology. 3.1. <rdf:RDF xmlns:rdf="http://www.w3.org/1999/02/22-rdf-syntax-ns#" xmlns:rdfs="http://www.w3.org/2000/01/rdf-schema#" xmlns:foaf="http://xmlns.com/foaf/0.1/" xmlns:admin="http://webns.net/mvcb/"> <foaf:PersonalProfileDocument rdf:about=""> <foaf:maker rdf:resource="#me"/> <foaf:primaryTopic rdf:resource="#me"/> <admin:generatorAgent rdf:resource="http://www.ldodds.com/foaf/foaf-a-matic"/> <admin:errorReportsTo rdf:resource="mailto:[email protected]"/> </foaf:PersonalProfileDocument> <foaf:Person rdf:ID="me"> <foaf:name>John Doe</foaf:name> <foaf:title>Mr</foaf:title> <foaf:givenname>John</foaf:givenname> <foaf:family_name>Doe</foaf:family_name> <foaf:nick>JohnDoe</foaf:nick> <foaf:mbox_sha1sum>11ca77f21f883242294a4dcf49c53ea19974b4b4</foaf:mbox_sha1sum> <foaf:homepage rdf:resource="johndoe.com"/> <foaf:phone rdf:resource="tel:1111111"/> <foaf:workplaceHomepage rdf:resource="johnsdoeworkhomepage.pl"/> <foaf:workInfoHomepage rdf:resource="I am doing noting"/> <foaf:schoolHomepage rdf:resource="johnsdoeschool.com"/> <foaf:knows> <foaf:Person> <foaf:name>Jane Doe</foaf:name> <foaf:mbox_sha1sum>5f274bbf21e919ce934bb0259613ebaae3ad3623</foaf:mbox_sha1sum></f oaf:Person></foaf:knows> <foaf:knows> <foaf:Person> <foaf:name>Jan Kowalski</foaf:name> <foaf:mbox_sha1sum>1178877549b613df76422f4ec4f4c12c17be6422</foaf:mbox_sha1sum></fo af:Person></foaf:knows></foaf:Person> </rdf:RDF> 3.2 http://xml.mfd-consult.dk/foaf/explorer/?foaf=http%3A%2F%2Fstudent.agh.edu.pl %2F~pepcok%2Ffoaf.rdf 3.3 http://student.agh.edu.pl/~pepcok/foaf.rdf 4.4 http://student.agh.edu.pl/pepcok/review.html Extracted structured data rdfa-node type: property: reviewer: dtreviewed: summary: description: rating: Review itemreviewed: Best album ever John Doe 2013-10-21 Great Sound super truper Best album recorder by this band. It rock, it's awesome. Super guitar, great vocal and amaz piano 5.0 4.5 <!-- Microdata markup added by Google Structured Data Markup Helper. --> <html><head> <title>Best albumever2</title> </head> <body> <p itemscope itemtype="http://schema.org/Book"> Best album ever Reviewed by <span itemprop="author" itemscope itemtype="http://schema.org/Person"> <span itemprop="name">John Doe</span> </span>on <span itemprop="datePublished" content="Please insert valid ISO 8601 date/time here. Examples: 2015-07-27 or 2015-07-27T15:30">21 październik</span> Great Sound super truper Best album recorder by this band. It <span itemprop="genre">rock</span>, it's awesome. Super guitar, great vocal and amazing piano Rating: </p> </body></html> http://student.agh.edu.pl/pepcok/review2.html 5.2 Lexovo – zawiera informacje dotyczące słów, języka I znaków. Jamendo – duży zbiór muzyki na licencji Creative Commons. Ma na celu połączenie tych danych z Linked Data. Zawiera informacje o artystach, utworach, występach tp. Lotico – sieć łącząca pojęcia czasu, miejsca, społeczności i pomysłów. Govtrack – ma na celu łatwe śledzenie działalności amerykańskiego Konkgresu. Zawiera informacje dotyczące członków kongresu, rezolucji, wyników głosowań oraz komitetów. OpenEi – społeczność dzieląca się informacjami dotyczącymi energii, takimi jak odkrycia geograficzne oraz poprzez wizualizacje. 5.3 http://datahub.io/dataset/uniprot Dane naukowe ze szwedzkiego instytutu Bioinformatyki z lat 2007-2012. Zawiera ponad 3 miliardy trójek. 6.1 XLS/CSV -> RDF> Ilość danych w tego typu plikach może być ogromna i jeśli kiedyś dane te można by odczytać we względnie prosty sposób, to dużo łatwiej dokonywało by się pewnych obliczeń „w locie”, tj. podczas tworzenia zapytań „na żywo”. 6.2 6.3 Semantic Web Search Engines: Nie udało mi się znaleźć sensownych danych. 6.4 6.5 SPARQL Endpoint interface to Python – biblioteka do Pythona pozwalająca na odczytanie informacji ze strony zapisanych w SPARQL strony oraz wykonywanie zapytań na tej stronie Feedback Za dużo tasków jak na jedne zajęcia Za dużo kontaktu z brzydkimi stronami, na których ciężko jest znaleźć prostą informację po co powstały i co zawierają