Archiwa jakościowych danych badawczych w internecie
Transkrypt
Archiwa jakościowych danych badawczych w internecie
Seediscussions,stats,andauthorprofilesforthispublicationat:https://www.researchgate.net/publication/272489192 Archiwajakościowychdanychbadawczychw internecie Chapter·December2014 READS 199 1author: SabinaCisek JagiellonianUniversity 51PUBLICATIONS31CITATIONS SEEPROFILE Allin-textreferencesunderlinedinbluearelinkedtopublicationsonResearchGate, lettingyouaccessandreadthemimmediately. Availablefrom:SabinaCisek Retrievedon:04July2016 Opis bibliograficzny wersji opublikowanej: Cisek, Sabina (2014). Archiwa jakościowych danych badawczych w internecie. W: Korycińska-Huras, Agnieszka; Janiak, Małgorzata (red.). Komunikacja naukowa w środowisku cyfrowym. Badania, zasoby, użytkownicy. Warszawa: Wydawnictwo SBP, s. 68-80. Sabina Cisek Instytut Informacji Naukowej i Bibliotekoznawstwa Uniwersytet Jagielloński Archiwa jakościowych danych badawczych w Internecie Wprowadzenie Artykuł poświęcony jest archiwom jakościowych danych badawczych (ang. qualitative data archives), które stanowią specyficzny typ zasobów naukowych w Internecie. Takie archiwa mogą oczywiście mieć również postać tradycyjną i być przechowywanie „gdziekolwiek”, np. w szufladzie biurka badacza, rzecz jednak w tym, by standardowo stały się dostępne online w formie cyfrowej. Albo przynajmniej, w trudniejszych przypadkach, by informacja o ich istnieniu i miejscu przechowywania zamieszczona została w sieci, w odpowiednich specjalistycznych serwisach. Autorzy piszący o kolekcjach danych z reguły mają na myśli nowoczesną, zdigitalizowaną ich postać, takie znaczenie obowiązuje również w niniejszym tekście. Archiwa danych jakościowych, zwane też czasami repozytoriami (ang. qualitative data repositories), stanowią podgrupę archiwów danych badawczych (ang. research data archives / repositories), dla których z kolei kategorią nadrzędną są zbiory danych online (ang. data collections / datasets). Ogólna charakterystyka i typologia kolekcji danych w Internecie, stanowiąca kontekst dla opisu archiwów jakościowych danych badawczych, znajduje się w części pierwszej tego artykułu. Tam też zamieszczono wykaz dedykowanych tym zasobom serwisów wyszukiwawczych. Część druga dotyczy ściśle danych jakościowych i ich zbiorów, a także towarzyszących im wybranych problemów, zwłaszcza metodologicznych. Inne zagadnienia (etyczne, prawne, techniczne, z zakresu organizacji wiedzy) są jedynie zasygnalizowane. Podano również przykłady rzeczywiście funkcjonujących archiwów jakościowych danych badawczych. Zakończenie zawiera m.in. propozycję wykorzystania tychże repozytoriów w badaniach i edukacji z zakresu bibliologii i informatologii. Zagadnienie archiwizowania danych jakościowych oraz dzielenia się nimi (ang. data sharing problem) zainteresowało badaczy na szerszą skalę już w latach 90. XX wieku. Początkowo na ten temat pisali głównie – i nadal to robią – przedstawiciele nurtu jakościowego w naukach humanistycznych i społecznych, zwłaszcza socjologowie. W XXI wieku do grona autorów we wskazanym zakresie dołączyli informatolodzy i bibliotekoznawcy. Obecnie problematyka archiwów danych, w tym jakościowych, jest stosunkowo często dyskutowana w zagranicznej literaturze przedmiotu, m.in. informatologiczne czasopismo IASSIST Quarterly poświęciło temu zagadnieniu poczwórny numer specjalny [IASSIST 2010 / 2011]. Interesujący i wielostronny przegląd kwestii związanych z archiwizowaniem danych badawczych (dowolnych) przedstawiły także, na łamach Annual Review of Information Science and Technology, Stacy Kowalczyk i Kalpana Shankar [Kowalczyk, Shankar 2011]. W Polsce natomiast wybrane aspekty funkcjonowania archiwów danych jakościowych, w tym związane z nimi dylematy metodologiczne, rozważali w czasopiśmie ASK badacze związani z Instytutem Filozofii i Socjologii PAN [Filipkowski 2005; Kościański 2005; Palska 2005]. Z kolei przedstawicielka środowiska bibliotekarskiego, Bożena Bednarek-Michalska [Bednarek-Michalska 2012], wypowiedziała się na temat repozytoriów surowych danych badawczych w kontekście m.in. otwartej nauki, publicznego dostępu, a także spodziewanej w przyszłości, aktywnej roli bibliotekarzy w tym obszarze. Archiwizowanie badawczych danych jakościowych oznacza celowe, przemyślane ich gromadzenie, opracowanie, przechowywanie i udostępnianie, a także informowanie o ich istnieniu i zachęcanie do wykorzystywania. Są to typowe czynności z zakresu bibliotekarstwa i działalności informacyjnej, co więcej, dotyczą treści poznawczych utrwalonych na nośnikach materialnych (czyli informacji naukowej), w związku z czym bibliotekarze i informatolodzy, także w Polsce, powinni się tą sprawą zainteresować. Niniejszy artykuł ma się do tego się przyczynić. Ponieważ jednak wskazana problematyka jest rozległa i wielowątkowa, całościowe, wyczerpujące jej omówienie w jednym, stosunkowo krótkim tekście nie jest możliwe. Skupiono się zatem na aspektach metodologicznym oraz naukowym (poznawczym) archiwów danych jakościowych, pozostałe jedynie sygnalizując i pozostawiając do odrębnych, pogłębionych rozważań. Warto również zauważyć, iż słowo „jakościowy” ma kilka odmiennych znaczeń. Mianowicie, może m.in. wskazywać na pewien specyficzny sposób poznawania świata w nauce (badanie jakościowe, metodologia jakościowa), może też posiadać zupełnie inny, aksjologiczny, wartościujący charakter, związany z oceną jakości, np. archiwów albo serwisów WWW. Dane badawcze i ich zbiory w Internecie – charakterystyka, typologia, wyszukiwanie Problematyka zasobów danych w Internecie jest bardzo obszerna, wiąże się m.in. z zagadnieniami Big Data i data mining, kompleksowa charakterystyka tematu wymagałaby zatem osobnej, jemu tylko poświęconej publikacji. W artykule pominięta została także ogólna, wielowymiarowa dyskusja nad różnymi sposobami rozumienia terminu „dane” oraz jego relacjami do pokrewnych „informacji” i „wiedzy”, wskazano jedynie pewne podstawowe wątpliwości. Natomiast pojęcie danych jakościowych, jako centralne dla bieżących rozważań, jest szczegółowo omówione w następnym rozdziale. Na użytek tego artykułu przyjmuje się, zgodnie zresztą z duchem literatury przedmiotu [Bednarek-Michalska 2012; Corti 2011], iż obiektem zainteresowania są tzw. dane surowe (ang. raw data), czyli w niewielkim stopniu przetworzone, jak np. dokumenty finansowe, filmy, fotografie, nagrania audio, notatki, pamiętniki, rysunki, statystyki demograficzne i ekonomiczne, transkrypcje wywiadów, wykazy wydatków organów państwowych i samorządowych, wypełnione ankiety, zapisy z instrumentów astronomicznych, laboratoryjnych albo monitoringu, zestawienia numeryczne i inne. Tak rozumiane dane przeciwstawione są opracowaniom, czyli tradycyjnym publikacjom naukowym, fachowym, publicystycznym, jak artykuły, eseje, książki, podręczniki, raporty, referaty itp. Oczywiście „surowe dane” to metafora, określenie nieprecyzyjne. Z metodologicznego punktu widzenia „czyste”, całkowicie nieprzetworzone dane nie istnieją, co więcej, można wyróżnić kolejne „stopnie” ich postępującego przetworzenia [Kowalczyk, Shankar 2011, p. 255]. Dodatkowo, określenie tego, co może być kwalifikowane jako „dane”, jest względne. Zasoby statystyczne, np. takie, jakie oferuje europejski http://epp.eurostat.ec.europa.eu/portal/page/portal/eurostat/home, serwis bez Eurostat wzbudzania kontrowersji można nazwać danymi, zawartość Google Maps albo kolekcje fotografii w Narodowym Archiwum Cyfrowym http://www.nac.gov.pl – zapewne też, natomiast jak potraktować, przykładowo, pełne teksty Monitora Sądowego i Gospodarczego https://ems.ms.gov.pl, obejmujące bieżące ogłoszenia spółek handlowych, postanowienia o upadłości itp.? Przy odpowiednio sformułowanym problemie badawczym właściwie wszystko może stać się danymi, m.in. wpisy na forach dyskusyjnych, posty w blogach, a nawet publikacje naukowe (np. dla kogoś, kto prowadzi badania bibliometryczne). Kowalczyk i Shankar [Kowalczyk, Shankar 2011, p. 250–251] posługują się następującym sformułowaniem, określając dane jako „każdą informację, która może być przechowywana w formie elektronicznej, w tym teksty, dane liczbowe, grafikę, nagrania wideo i filmy, nagrania audio, oprogramowanie, algorytmy, równania, animacje, modele, symulacje etc. Tego rodzaju dane mogą być tworzone na różne sposoby, w tym metodą obserwacji, kalkulacji lub eksperymentu”1. Generalnie w Internecie istnieje ogromna liczba zróżnicowanych zbiorów danych, dających się wyodrębnić spośród innych zasobów jako mniej lub bardziej spójne całości. Niektóre z nich powstały nieintencjonalnie, „przy okazji”, np. usługa Google Książki stanowi właściwie ogromny korpus językowy, który, dodatkowo, kilka lata temu „dorobił się” własnego narzędzia analitycznego o nazwie Ngram Viewer https://books.google.com/ngram. Inne zostały zbudowane celowo, jak – by pozostać w tym samym kręgu – Narodowy Korpus Języka Polskiego http://www.nkjp.pl. Z innego punktu widzenia zbiory danych w Internecie można podzielić na o t w a r t e i zamknięte. Te pierwsze są udostępnione publicznie, bez ograniczeń, drugie natomiast cechują się dostępem mniej lub bardziej restrykcyjnym. Jeżeli chodzi o typy kolekcji danych, to najbardziej widoczne są trzy: wspomniane już korpusy językowe, (otwarte) dane badawcze / naukowe, (otwarte) dane publiczne (często produkowane przez rządy państw, instytucje i urzędy krajowe oraz organizacje międzynarodowe, takie jak Bank Światowy, OECD, Światowa Organizacja Handlu czy Unia Europejska). To prawdopodobnie nie jest wyczerpująca typologia, ale stworzenie takowej nie jest celem niniejszych dociekań. Na marginesie warto jednak zauważyć, iż we współczesnym piśmiennictwie informatologicznym generalnie brakuje przemyślanej, rzetelnej typologii źródeł informacji w Internecie, która obejmowałaby m.in. także archiwa „surowych” danych i odróżniała je od innych zasobów online. W Polsce bodaj najwięcej uwagi poświęca się zbiorom danych publicznych, prawdopodobnie dlatego, iż mają one także wymiar obywatelski i polityczny (zob. np. 1 Tekst oryginalny: any information that can be stored in digital form, including text, numbers, images, video or movies, audio, software, algorithms, equations, animations, models, simulations, etc. Such data may be generated by various means including observation, computation, or experiment [Kowalczyk, Shankar 2011, p. 250–251]. http://mojepanstwo.pl albo http://otwartedane.pl), a poza tym w dużej mierze podlegają polskim i unijnym regulacjom prawnym, w tym Ustawie o dostępie do informacji publicznej [Obwieszczenie... 2014]. Archiwa / repozytoria danych badawczych z kolei są to intencjonalnie stworzone zbiory danych / materiałów, powstałych w wyniku badań empirycznych w różnych przedsięwzięciach naukowych lub też zgromadzonych na potrzeby konkretnych projektów badawczych. Innymi słowy, termin ten nie określa wszystkich istniejących kolekcji danych, które ewentualnie mogłyby „przydać się” w dociekaniach naukowych (zob. też wcześniejsze uwagi), lecz tylko te, które obejmują materiały uzyskane w rezultacie badań, a także zostały zorganizowane celowo, odpowiednio uporządkowane, opisane metadanymi i przygotowane do udostępniania [Archiwum... 2014; Brady 2006; Kowalczyk, Shankar 2011; IASSIST 2010 / 2011]. Cytowane już Kowalczyk i Shankar [Kowalczyk, Shankar 2011, p. 256–257] wyróżniają trzy rodzaje archiwów danych badawczych, biorąc pod uwagę ich wielkość i zasięg. Są to kolekcje danych pochodzących z jednego projektu naukowego (ang. research data collections), z jednego kierunku bądź obszaru badawczego (ang. community collections) i wreszcie wielodziedzinowe, często międzynarodowe, oparte na dobrze zorganizowanej infrastrukturze technologicznej (ang. reference collections). Archiwa danych badawczych mogą zawierać, po pierwsze, materiał empiryczny pochodzący z badań nauk matematycznych, przyrodniczych i z nurtu pozytywistycznego w dyscyplinach społecznych, czyli tzw. dane ilościowe, chociaż w rzeczywistości są to nie tylko liczby, ale również zdjęcia, np. galaktyk albo dna morskiego. Dobry przykład takiego zbioru w otwartym dostępie http://ned.ipac.caltech.edu, stanowi a w Polsce NASA – / IPAC Archiwum Extragalactic Danych Database Społecznych http://www.ads.org.pl (dostęp „półotwarty”, możliwy po zarejestrowaniu, nie dotyczy zbiorów zastrzeżonych). Po drugie, archiwa mogą obejmować tzw. dane jakościowe, zgromadzone w ramach podejścia interpretatywnego / rozumiejącego w naukach humanistycznych i społecznych. Widać, że rozróżnienie archiwów danych ilościowych i jakościowych jest właściwie pochodną stosowanej metodologii badań. W ostatnich kilku latach pojawiły się interesujące inicjatywy, a także globalne internetowe serwisy wyszukiwawcze, promujące (otwarty) dostęp do „surowych” danych badawczych. Są to m.in.: Databib http://databib.org, serwis wyszukiwawczy archiwów danych badawczych, obejmujący obecnie (lipiec 2014) 978 repozytoriów z wszystkich dziedzin nauki, w tym humanistycznych i społecznych, DataCite http://www.datacite.org, założona w 2009 roku międzynarodowa organizacja non-profit, mająca na celu ułatwienie dostępu do danych badawczych w Internecie, Data repositories http://oad.simmons.edu/oadwiki/Data_repositories (serwis dotyczy danych otwartych, jest mocno niekompletny), ICSU World Data System http://www.icsu-wds.org, istniejące od 2008 roku przedsięwzięcie Międzynarodowej Rady Nauki (International Council for Science), z dostępem do zbiorów danych badawczych poprzez Data Portal http://www.icsuwds.org/services/data-portal, re3data.org – Registry of research data repositories http://www.re3data.org/, rejestr powstały w 2012 roku w Niemczech, w połowie roku 2014 indeksujący ok. 650 archiwów danych badawczych z całego świata. W marcu 2014 roku Databib, DataCite i re3data.org ogłosiły połączenie sił do końca roku 2015, z zamiarem stworzenia uniwersalnego serwisu wyszukiwawczego dla kolekcji ilościowych i jakościowych danych badawczych w Internecie [re3data.org team 2014]. Archiwizowanie i ponowne wykorzystywanie danych jakościowych – wybrane aspekty Dane ilościowe są archiwizowane standardowo. Piotr Filipkowski pisze: „Potrzeba archiwizowania danych ilościowych jest oczywistością. Nikt nie podaje jej w wątpliwość. Specjalizacja sprzyja wręcz temu, by jedni zbierali i archiwizowali te dane, inni je porządkowali, zestawiali w tabele i wykresy, uczenie analizowali i omawiali, a jeszcze inni – z większą już swobodą – uogólniali” [Filipkowski 2005, s. 32]. W naukach przyrodniczych wiodące czasopisma często wymagają podania gdzie przechowywane są dane empiryczne stanowiące podstawę publikacji, a ich opracowanie i udostępnienie stanowi warunek wstępny przyjęcia artykułu do druku [Kowalczyk, Shankar 2011, p. 248]. „Wśród badaczy jakościowych (…) tendencja jest dokładnie odwrotna: dane zebrane przez jednych badaczy niezwykle rzadko są traktowane jako źródło w badaniach drugich” [Filipkowski 2005, s. 32]. Jak na wpół żartobliwie zauważa Arja Kuula [Kuula 2010 / 2011], materiały jakościowe często „kończą” w szufladzie, na strychu albo w domku letniskowym badacza. Zrozumienie potrzeby archiwizowania, udostępniania i powtórnego wykorzystywania danych jakościowych na szerszą skalę dopiero się rodzi. Tym niemniej, archiwizacja i udostępnianie jakościowych danych badawczych stanowi dzisiaj dynamicznie rozwijającą się dziedzinę zarówno działalności, jak i refleksji teoretycznej. W ostatnich latach pojawiły się różne krajowe i międzynarodowe inicjatywy w tym zakresie, powstają kolejne repozytoria, pojawiła się też odpowiednia oferta edukacyjna, m.in. w Wielkiej Brytanii [Bishop 2014; Corti 2011; IASSIST 2010 / 2011; Perez-Hernandez 2014; Secondary 2014]. Także biblioteki akademickie na świecie zaczęły umieszczać na swoich stronach przewodniki po zbiorach danych jakościowych [Identifying... 2014]. Wynika to, po pierwsze, z rosnącej popularności badań jakościowych, po drugie – z coraz silniejszego oddziaływania ideologii otwartej nauki [zob. m.in. Panton 2010], po trzecie wreszcie – z możliwości, które oferuje współczesna technologia informacyjna i sieciowa. Długą tradycję w archiwizowaniu i udostępnianiu danych badawczych ma Wielka Brytania, gdzie już w roku 1994 powstał pierwszy oficjalny narodowy serwis o zbiorach danych jakościowych ESDS Qualidata, który w 2012 roku został włączony do systemu z zakresu nauk ekonomicznych i społecznych UK Data Service http://ukdataservice.ac.uk. Od 2014 roku działa w USA portal Qualitative Data Repository QDR https://qdr.syr.edu, finansowany przez amerykańską Narodową Fundację Nauki. Zainteresowanie archiwizowaniem danych jakościowych widać również w kilkunastu krajach europejskich, stan obecny i perspektywy w tym zakresie zostały przedyskutowane m.in. podczas warsztatów w Bremie w 2009 roku [IASSIST 2010 / 2011]. W Polsce wspomniany już Instytut Filozofii i Socjologii PAN prowadzi obecnie projekt pod nazwą Archiwum Danych Jakościowych, finansowany ze środków Narodowego Programu Rozwoju Humanistyki [Archiwum... 2014]. Czym jednak są dane jakościowe, które mają być udostępniane poprzez repozytoria online? Jest to materiał empiryczny, zgromadzony przy wykorzystaniu technik jakościowych w ramach podejścia interpretywnego / rozumiejącego w naukach o człowieku. Źródłami danych mogą tutaj być: (1) dokumenty, teksty, już istniejące lub stworzone na prośbę badacza, oficjalne i nieoficjalne, (2) fokus, zogniskowany wywiad grupowy, (3) obserwacja w różnych wariantach (etnograficzna, naturalistyczna, samoobserwacja, shadowing, uczestnicząca lub nie), (4) wywiad indywidualny (jakościowy, pogłębiony, narracyjny, Sense-Making i in.) [Cisek 2013]. Empiryczne dane jakościowe dzieli się czasami na niewywołane (zastane) i wywołane (wytworzone). Pierwsze z nich powstają „naturalnie”, bez ingerencji badacza (np. listy, posty w blogach, wpisy w portalach społecznościowych, zdjęcia z wakacji), drugie – w efekcie czynności uczonego, w „sztucznych”, stworzonych na potrzeby badania sytuacjach, np. podczas obserwacji uczestniczącej albo wywiadu pogłębionego. Jednakże, jak trafnie zauważa Tim Rapley, „w rzeczywistości w obu przypadkach działania badacza odgrywają podstawową rolę w procesie wytwarzania materiałów i ich przekształcania w dane. W obu przypadkach trzeba je przecież odkryć, fizycznie zgromadzić, wybrać te, które zatrzymamy, i odrzucić te, które pominiemy. (…) Najważniejsza decyzja wiąże się z uznaniem konkretnego zestawu materiałów za zbiór danych” [Rapley 2010, p. 34]. W piśmiennictwie dotyczącym archiwizowania danych jakościowych autorzy najczęściej mają na myśli udostępnianie i powtórne wykorzystanie materiałów wywołanych, jednakże zbiory materiałów niewywołanych również mogą być cenne, zwłaszcza, że granica między nimi bywa płynna, jak wskazano w poprzednim akapicie. Doskonały przykład stanowią tutaj kolekcje cyfrowe Ośrodka Karta, w tym Archiwum Fotografii http://foto.karta.org.pl i Archiwum Historii Mówionej http://www.audiohistoria.pl. W repozytoriach badawczych danych jakościowych znajduje się zatem bogaty, z reguły słabo ustrukturyzowany materiał empiryczny w postaci werbalnej (dzienniki, nagrania audio, notatki terenowe, ogłoszenia, opowieści, pamiętniki, regulaminy, transkrypcje, zapisy wywiadów, zarządzenia itp.), wizualnej (fotografie, rysunki) lub multimedialnej (filmy, nagrania wideo, zawartość serwisów WWW). Tutaj także, podobnie jak generalnie w odniesieniu do archiwów danych badawczych, trzeba podjąć decyzję dotyczącą stopnia przetworzenia danych zamieszczonych w zbiorze, np. czy będą tam oryginalne nagrania przeprowadzonych wywiadów, czy tylko ich transkrypcje, czy jedno i drugie (najlepiej). Podstawowe pytanie brzmi – czemu mają służyć archiwa danych jakościowych, po co właściwie je organizować? Otóż przede wszystkim po to, by umożliwić powtórne wykorzystanie istniejącego, już raz wytworzonego materiału empirycznego, przede wszystkim w celach naukowych, ale również edukacyjnych, a nawet gospodarczych i społecznych (kontrola wydatkowania publicznych pieniędzy, transfer wiedzy z nauki do gospodarki). Dzięki temu można osiągnąć m.in. korzyści poznawcze, o których mowa w dalszej części rozważań, dydaktyczne, zwłaszcza w szkolnictwie wyższym, gdzie dane empiryczne zgromadzone w autentycznych badaniach mogą stanowić znakomitą pomoc w nauczaniu metodologii i nie tylko, oraz finansowe i organizacyjne. Badania jakościowe często są czaso- i pracochłonne, a więc drogie. Powtórne wykorzystanie raz zgromadzonego materiału empirycznego przynosi oszczędność czasu, pieniędzy i wysiłku. Poza tym, dane jakościowe mogą np. dotyczyć grup ludzi, do których dotarcie stało się utrudnione bądź niemożliwe. Wówczas istniejące, „gotowe” dane są jedynym źródłem dla przyszłych badaczy. Tworzeniu archiwów danych jakościowych towarzyszą problemy metodologiczne, etyczne, organizacyjne, prawne, a także informacyjne / informatologiczne (z zakresu organizacji wiedzy, zarządzania informacją i udostępniania). Zagadnienia metodologiczne wiążą się z poznawczymi celami tworzenia archiwów danych jakościowych. Obejmują dwa podstawowe wymiary, odnoszące się do wykorzystania udostępnionego materiału empirycznego: dla zapewnienia intersubiektywnej kontrolowalności i sprawdzalności badań jakościowych oraz dla przeprowadzenia nowych projektów badawczych. Intersubiektywna sprawdzalność stanowi uniwersalny warunek naukowości, może jednak być osiągnięta na różne sposoby. W metodologii ilościowej, w naukach przyrodniczych często można „po prostu” powtórzyć badania poprzedników (sprawdzić poprawność obliczeń, wykonać ten sam eksperyment itp.). W dociekaniach jakościowych zazwyczaj nie jest to możliwe, nie da się drugi raz zrobić „tej samej” obserwacji etnograficznej czy wywiadu narracyjnego, dlatego należy pozostawić tzw. ścieżkę sprawdzenia (ang. audit trial), czyli rygorystycznie i wyczerpująco opisać własne postępowanie badawcze. Szczegółowo scharakteryzowane powinny zostać nie tylko: kontekst, uwarunkowania i założenia badań oraz sam tok rozumowania, ale również – właśnie – dane empiryczne, na których oparte zostały wnioski [Cisek 2013]. Jeszcze lepiej byłoby, gdyby czytelnicy, inni naukowcy, mogli sięgnąć do oryginalnego materiału empirycznego i stwierdzić, czy został odpowiednio i poprawnie wykorzystany, zapewniając trafność i rzetelność badań. Z drugiej strony, niektórzy obawiają się niewłaściwego wykorzystania „swoich” danych przez „konkurencję”, np. do uzyskania grantów, albo złośliwej krytyki. Jednakże transparentność procesu badawczego jest wartością nadrzędną [Kuula 2010 / 2011, p. 14]. Dane jakościowe zgromadzone w archiwach można też wykorzystać w nowych projektach badawczych. Potencjał jest spory i obejmuje m.in.: badania długookresowe, np. powrót po latach do tych samych badanych albo przynajmniej do tej samej grupy społecznej; dociekania porównawcze, np. zbadanie istniejących danych empirycznych inną metodą / techniką (komparatystyka metodologiczna). Hanna Palska zauważa: „Użytkownicy nowych metod interpretatywnych raz po raz apelują o reanalizę starych materiałów, by skonfrontować własne techniki interpretacyjne z technikami niegdyś używanymi” [Palska 2005, s. 14]; powtórne poszukiwanie odpowiedzi na pytania postawione w oryginalnych dociekaniach, co może zaowocować uchwyceniem innego aspektu badanego wycinka rzeczywistości. Kolejna analiza istniejących materiałów, przeprowadzona w odmiennych ramach pojęciowych, często pozwala odnaleźć relacje i treści, których dotąd nikt nie zauważył [Kuula 2010 / 2011, p. 14]; wykorzystanie tego samego, „starego” materiału empirycznego do poszukiwania rozwiązań zupełnie nowych, innych zagadnień. Jednakże czy można (w obydwu znaczeniach – czy się da i czy wolno) ponownie wykorzystywać badawcze dane jakościowe? Ich powtórne użycie wzbudza niejakie kontrowersje metodologiczne, ponieważ dla dociekań jakościowych często charakterystyczne jest osobiste zaangażowanie badacza, nawiązanie emocjonalnej i intelektualnej więzi z badanymi, pozwalające ich zrozumieć. Gdy inni uczeni mają do dyspozycji tylko sam zapis materiału empirycznego, tego ważnego czynnika może im brakować. To zastrzeżenie oczywiście dotyczy tylko danych wywołanych, powstałych w interakcji z badanymi lub na prośbę badacza. W odniesieniu do danych zastanych, np. istniejących dokumentów, nie ma ono większego sensu. Z kolei kontrargumenty wobec wskazanego zastrzeżenia są następujące: W repozytoriach de facto archiwizuje się jakościowy materiał empiryczny, z którego dopiero należy „zrobić” różne konkretne dane na potrzeby kolejnych, odmiennych projektów naukowych. Co więcej, z reguły jest on redundantny wobec zagadnienia badawczego, dla którego został zgromadzony. Jak zauważa Piotr Filipkowski: „Każde dane wymagają interpretacji. Dane jakościowe – dokumenty osobiste, relacje biograficzne, notatki z obserwacji, zapisy fokusów itp. – otwierają szczególne możliwości reinterpretacji. Są to bowiem prawie zawsze dane nadmiarowe w stosunku do pytań, jakie postawił wobec nich badacz, który je zgromadził i zanalizował” [Filipkowski 2005, s. 34]. Materiały takie można wykorzystać, jak już wcześniej wspomniano, do rozwiązania innego, zupełnie nowego problemu poznawczego. W dociekaniach jakościowych nie istnieje pojedynczy i „jedynie słuszny” sposób analizy i interpretacji zebranego materiału badawczego, więc nie można twierdzić, że tylko „oryginalny” badacz ma prawo to zrobić [Kuula 2010 / 2011, p. 14]. Czasami i w „tradycyjnych” badaniach jakościowych bywa tak, że kto inny np. przeprowadza wywiady, a kto inny je analizuje i to jest akceptowane [Kuula 2010 / 2011, p. 14]. Aby powtórne wykorzystanie jakościowego materiału empirycznego było uzasadnione i wykonalne, konieczne jest zamieszczenie w archiwach, oprócz danych, także informacji kontekstowych, m.in. dla jakiego przedsięwzięcia badawczego i za pomocą jakich narzędzi / technik materiał został zgromadzony, jakie są jego relacje do innych zbiorów danych, czy wykorzystano konkretne oprogramowanie itp. Należy również określić nośnik, dostępność techniczną i, pod względem prawnym, kto jest właścicielem oraz podać inne potrzebne metadane [Kowalczyk, Shankar 2011, p. 253; Kuula 2010 / 2011, p. 14]. Cytowany już Filipkowski pisze: „Archiwizowanym danym powinna towarzyszyć rzetelna i wyczerpująca dokumentacja określająca założenia, cele, metody badawcze i wyniki projektu, w ramach którego te dane zebrano. Jest to warunek ich kompetentnej reanalizy” [Filipkowski 2005, s. 37–38]. Ważne jest także, by materiał zgromadzony i udostępniany poprzez archiwa był dobrej jakości, zarówno w wymiarze naukowym, jak i informacyjnym, by cechował się kompletnością intelektualną i techniczną, niezmiennością / trwałością, poprawnością i spójnością [Kowalczyk, Shankar 2011, p. 254]. Wskazane kwestie łączą w sobie aspekty metodologiczne i z zakresu zarządzania informacją. Problemy etyczne dotyczą ochrony prywatności, a także emocji, psychiki i społecznego funkcjonowania badanych. W dociekaniach jakościowych badacz często spędza z nimi wiele czasu, są to konkretne osoby (a nie – jak w metodologii ilościowej – „elementy” próby reprezentatywnej), poruszane bywają wrażliwe kwestie. W związku z tym, oczywiście, badani powinni podpisać zgodę na archiwizację, ich dane osobowe należy utajnić, a notatki i wypowiedzi poddać anonimizacji. Z drugiej strony, jak się okazuje, wbrew licznym i zdaje się nadmiernym obawom badaczy, zdecydowana większość badanych nie ma nic przeciwko powtórnemu wykorzystaniu związanych z nimi materiałów empirycznych, często wręcz tego oczekują, wychodząc z założenia, że skoro poświęcili swój czas, emocje, uwagę „dla dobra nauki”, to powinien być z tego daleko idący pożytek [Kuula 2010 / 2011, p. 15–16]. Wymiar organizacyjny i prawny jest równie istotny. Należy m.in. rozwiązać kwestie otwartego bądź restrykcyjnego dostępu do archiwów, prawa własności do materiału empirycznego (pozostające w gestii badacza, badanych lub instytucji finansującej), a także wspomnianej w poprzednim akapicie ochrony prywatności (np. udostępnianie informacji kontaktowych do badanych). Należy także rozważyć, kto ma się zajmować tworzeniem archiwów danych jakościowych: każda zainteresowana placówka badawcza, biblioteki akademickie i naukowe, organizacje społeczne lub uczelnie oraz czy powinny powstawać centralne archiwa narodowe / państwowe albo nawet europejskie. Są już próby formułowania pewnych zasad, jedną z nich stanowią tzw. Panton Principles [Bednarek-Michalska 2012; Panton 2014]. Aspekt informacyjny (informatologiczny) wiąże się z organizacją wiedzy i zarządzaniem informacją w repozytoriach jakościowych danych badawczych. Chodzi tutaj m.in. o formaty danych, standardy opisu i katalogowania jakościowego materiału empirycznego, adekwatny system metadanych, który umożliwiłby sprawny dostęp, wyszukiwanie i wymianę informacji między archiwami / instytucjami, a także o kwestie związane ze starzeniem się nośników, potrzebą digitalizacji itd. Jest to kolejny, ogromny obszar spraw do rozwiązania, który należałoby rozważyć w odrębnej publikacji. Zakończenie W artykule zarysowano obszar zagadnień związanych z tworzeniem archiwów / repozytoriów danych badawczych, w szczególności jakościowych. Obecnie podejmowane są różnorodne działania, których celem jest zbudowanie infrastruktury i kultury wielokrotnego wykorzystywania jakościowego materiału empirycznego. Otwiera się tu szerokie pole do badań i działalności, także dla praktyków i teoretyków bibliotekoznawstwa i nauki o informacji. Po pierwsze, interesujące są wymienione już kwestie związane z aspektami informacyjnym i organizacyjnym tworzenia repozytoriów danych jakościowych. Po drugie, można sprawdzić, czy w istniejących archiwach danych nie ma materiałów, które dałoby się wykorzystać również i w dociekaniach bibliologicznych i informatologicznych, zamiast, powiedzmy, przeprowadzać kolejną standardową ankietę. Po trzecie, archiwa danych badawczych to rodzaj naukowych źródeł informacji, należy więc włączyć je do treści kształcenia z zakresu informacji naukowej, zarządzania informacją itp. Po czwarte wreszcie, w literaturze przedmiotu nie ma publikacji poświęconych użytkownikom archiwów / repozytoriów danych jakościowych, ich zachowaniom informacyjnym itd., a warto byłoby to zbadać. To tylko kilka propozycji, zapewne interesujących możliwości jest więcej. Bibliografia 1. Archiwum Danych Jakościowych. Instytut Filozofii i Socjologii Polskiej Akademii Nauk (2014). http://www.ifispan.waw.pl/index.php?lang=pl&m=page&pg_id=55 [odczyt: 06.07.2014]. 2. Bednarek-Michalska, Bożena (2012). Repozytoria surowych danych – dlaczego biblioteki powinny je znać? [dok. elektr.] Biuletyn EBIB nr 8 (135). http://open.ebib.pl/ojs/index.php/ebib/article/view/152/292 [odczyt: 02.07.2014]. 3. Bishop, Libby (2014). An invitation to secondary analysis of qualitative data. Secondary analysis of qualitative data: an advanced course, University of Essex, 22–23 May 2014 [dok. elektr.]. http://ukdataservice.ac.uk/media/440302/secondaryanalysis2223may14.pdf [odczyt: 11.07.2014]. 4. Brady, Angela (2006). Qualitative data archives. W: The SAGE Dictionary of Social Research Methods [dok. elektr.]. http://srmo.sagepub.com/view/the-sage-dictionary-ofsocial-research-methods/n164.xml [odczyt: 08.07.2014]. 5. Cisek, Sabina (2013). Metodologia jakościowa we współczesnej informatologii. Wybrane aspekty. Przegląd Biblioteczny R. 81, z. 3, s. 299–310. 6. Corti, Louise (2011). The European Landscape of Qualitative Social Research Archives: Methodological and Practical Issues [dok.elektr.]. Forum: Qualitative Social Research Vol. 12, Issue 3. http://nbn-resolving.de/urn:nbn:de:0114-fqs1103117 [odczyt: 06.07.2014]. 7. Filipkowski, Piotr (2005). Po co archiwizować dane jakościowe i jak robią to inni. ASK nr 14, s. 31–52. 8. IASSIST Quarterly Vol. 34, No. 3–4; Vol. 35., No. 1–2. Special Issue: Qualitative and Qualitative Longitudinal Resources in Europe. Mapping the field and exploring strategies for development (2010 / 2011) [dok. elektr.]. http://www.iassistdata.org/downloads/iqvol34_35.pdf, http://www.iassistdata.org/iq/issue/34/3 [odczyt: 02.07.2014]. 9. Identifying Repositories for Data Sharing (2014). [dok. elektr.] http://research.library.gsu.edu/content.php?pid=348991&sid=2855062 [odczyt: 10.07.2014]. 10. Kościański, Artur (2005). Archiwum społecznych danych jakościowych: potrzeby, kontrowersje, propozycje praktyczne. ASK nr 14, s. 19–29. 11. Kowalczyk, Stacy; Shankar, Kalpana (2011). Data sharing in the sciences. Annual Review of Information Science and Technology Vol. 45, Issue 1, p. 247–294. 12. Kuula, Arja (2010 / 2011). Methodological and Ethical Dilemmas of Archiving Qualitative Data [dok. elektr.]. IASSIST Quarterly Vol. 34–35, p. 12–17. http://www.iassistdata.org/iq/methodological-and-ethical-dilemmas-archiving-qualitativedata [odczyt: 06.07.2014]. 13. Obwieszczenie Marszałka Sejmu Rzeczypospolitej Polskiej z dnia 14 kwietnia 2014 r. w sprawie ogłoszenia jednolitego tekstu ustawy o dostępie do informacji publicznej. Dziennik Ustaw 2014 poz. 782 [dok. elektr.]. http://www.dziennikustaw.gov.pl/du/2014/782/1 [odczyt: 01.09.2014]. 14. Palska, Hanna (2005). O potrzebie ochrony danych jakościowych. Z doświadczeń socjologa-humanisty. ASK nr 14, s. 7–17. 15. Pampel, Heinz (2013). How to find an appropriate research data repository? PLOS Tech Blog [dok. elektr.]. http://blogs.plos.org/tech/how-to-find-an-appropriate-research-datarepository/ [odczyt: 02.07.2014]. 16. Pampel, Heinz et al. (2013). Making Research Data Repositories Visible: The re3data.org Registry [dok. elektr.]. PLOS ONE Vol. 8 (11). http://www.plosone.org/article/info%3Adoi%2F10.1371%2Fjournal.pone.0078080 [odczyt: 02.07.2014]. 17. Panton Principles. Principles for Open Data in Science (2010) [dok. elektr.]. http://pantonprinciples.org [odczyt: 07.07.2014]. 18. Perez-Hernandez, Danya (2014). New Repository Offers a Home for Data That Aren’t Numbers [dok. elektr.]. http://chronicle.com/blogs/wiredcampus/new-repository-offers-ahome-for-data-that-arent-numbers/50865 [odczyt: 10.07.2014]. 19. Rapley, Tim (2010). Analiza konwersacji, dyskursu i dokumentów. Warszawa: Wydawnictwo Naukowe PWN, 238 s. 20. re3data.org team (2014). DataCite, re3data.org, and Databib announce Collaboration [dok. elektr.]. http://www.re3data.org/2014/03/datacite-re3data-org-databib-collaboration/ [odczyt: 12.07.2014]. 21. Secondary Qualitative Data Sources and How to Find Them (2014) [dok. elektr.]. http://medanth.wikispaces.com/Secondary+Qualitative+Data+Sources+and+How+to+Fin d+Them [odczyt: 06.07.2014]. 22. What is DataCite? (2014) [dok. elektr.]. http://www.datacite.org/whatisdatacite [odczyt: 10.07.2014].