Archiwa jakościowych danych badawczych w internecie

Transkrypt

Archiwa jakościowych danych badawczych w internecie
Seediscussions,stats,andauthorprofilesforthispublicationat:https://www.researchgate.net/publication/272489192
Archiwajakościowychdanychbadawczychw
internecie
Chapter·December2014
READS
199
1author:
SabinaCisek
JagiellonianUniversity
51PUBLICATIONS31CITATIONS
SEEPROFILE
Allin-textreferencesunderlinedinbluearelinkedtopublicationsonResearchGate,
lettingyouaccessandreadthemimmediately.
Availablefrom:SabinaCisek
Retrievedon:04July2016
Opis bibliograficzny wersji opublikowanej:
Cisek, Sabina (2014). Archiwa jakościowych danych badawczych w internecie.
W: Korycińska-Huras, Agnieszka; Janiak, Małgorzata (red.). Komunikacja naukowa
w środowisku cyfrowym. Badania, zasoby, użytkownicy. Warszawa: Wydawnictwo SBP,
s. 68-80.
Sabina Cisek
Instytut Informacji Naukowej i Bibliotekoznawstwa
Uniwersytet Jagielloński
Archiwa jakościowych danych badawczych w Internecie
Wprowadzenie
Artykuł poświęcony jest archiwom jakościowych danych badawczych (ang.
qualitative data archives), które stanowią specyficzny typ zasobów naukowych w
Internecie. Takie archiwa mogą oczywiście mieć również postać tradycyjną i być
przechowywanie „gdziekolwiek”, np. w szufladzie biurka badacza, rzecz jednak w tym, by
standardowo stały się dostępne online w formie cyfrowej. Albo przynajmniej, w trudniejszych
przypadkach, by informacja o ich istnieniu i miejscu przechowywania zamieszczona została
w sieci, w odpowiednich specjalistycznych serwisach. Autorzy piszący o kolekcjach danych z
reguły mają na myśli nowoczesną, zdigitalizowaną ich postać, takie znaczenie obowiązuje
również w niniejszym tekście.
Archiwa danych jakościowych, zwane też czasami repozytoriami (ang. qualitative
data repositories), stanowią podgrupę archiwów danych badawczych (ang. research data
archives / repositories), dla których z kolei kategorią nadrzędną są zbiory danych online (ang.
data collections / datasets). Ogólna charakterystyka i typologia kolekcji danych w Internecie,
stanowiąca kontekst dla opisu archiwów jakościowych danych badawczych, znajduje się w
części pierwszej tego artykułu. Tam też zamieszczono wykaz dedykowanych tym zasobom
serwisów wyszukiwawczych. Część druga dotyczy ściśle danych jakościowych i ich zbiorów,
a także towarzyszących im wybranych problemów, zwłaszcza metodologicznych. Inne
zagadnienia (etyczne, prawne, techniczne, z zakresu organizacji wiedzy) są jedynie
zasygnalizowane. Podano również przykłady rzeczywiście funkcjonujących archiwów
jakościowych danych badawczych. Zakończenie zawiera m.in. propozycję wykorzystania
tychże repozytoriów w badaniach i edukacji z zakresu bibliologii i informatologii.
Zagadnienie archiwizowania danych jakościowych oraz dzielenia się nimi (ang. data
sharing problem) zainteresowało badaczy na szerszą skalę już w latach 90. XX wieku.
Początkowo na ten temat pisali głównie – i nadal to robią – przedstawiciele nurtu
jakościowego w naukach humanistycznych i społecznych, zwłaszcza socjologowie. W XXI
wieku
do
grona
autorów
we
wskazanym
zakresie
dołączyli
informatolodzy
i
bibliotekoznawcy. Obecnie problematyka archiwów danych, w tym jakościowych, jest
stosunkowo
często
dyskutowana
w
zagranicznej
literaturze
przedmiotu,
m.in.
informatologiczne czasopismo IASSIST Quarterly poświęciło temu zagadnieniu poczwórny
numer specjalny [IASSIST 2010 / 2011]. Interesujący i wielostronny przegląd kwestii
związanych z archiwizowaniem danych badawczych (dowolnych) przedstawiły także, na
łamach Annual Review of Information Science and Technology, Stacy Kowalczyk i Kalpana
Shankar [Kowalczyk, Shankar 2011]. W Polsce natomiast wybrane aspekty funkcjonowania
archiwów danych jakościowych, w tym związane z nimi dylematy metodologiczne, rozważali
w czasopiśmie ASK badacze związani z Instytutem Filozofii i Socjologii PAN [Filipkowski
2005; Kościański 2005; Palska 2005]. Z kolei przedstawicielka środowiska bibliotekarskiego,
Bożena Bednarek-Michalska [Bednarek-Michalska 2012], wypowiedziała się na temat
repozytoriów surowych danych badawczych w kontekście m.in. otwartej nauki, publicznego
dostępu, a także spodziewanej w przyszłości, aktywnej roli bibliotekarzy w tym obszarze.
Archiwizowanie badawczych danych jakościowych oznacza celowe, przemyślane ich
gromadzenie, opracowanie, przechowywanie i udostępnianie, a także informowanie o ich
istnieniu i zachęcanie do wykorzystywania. Są to typowe czynności z zakresu bibliotekarstwa
i działalności informacyjnej, co więcej, dotyczą treści poznawczych utrwalonych na
nośnikach materialnych (czyli informacji naukowej), w związku z czym bibliotekarze
i informatolodzy, także w Polsce, powinni się tą sprawą zainteresować. Niniejszy artykuł ma
się do tego się przyczynić. Ponieważ jednak wskazana problematyka jest rozległa i
wielowątkowa, całościowe, wyczerpujące jej omówienie w jednym, stosunkowo krótkim
tekście nie jest możliwe. Skupiono się zatem na aspektach metodologicznym oraz naukowym
(poznawczym)
archiwów
danych
jakościowych,
pozostałe
jedynie
sygnalizując
i
pozostawiając do odrębnych, pogłębionych rozważań.
Warto również zauważyć, iż słowo „jakościowy” ma kilka odmiennych znaczeń.
Mianowicie, może m.in. wskazywać na pewien specyficzny sposób poznawania świata w
nauce (badanie jakościowe, metodologia jakościowa), może też posiadać zupełnie inny,
aksjologiczny, wartościujący charakter, związany z oceną jakości, np. archiwów albo
serwisów WWW.
Dane badawcze i ich zbiory w Internecie – charakterystyka, typologia,
wyszukiwanie
Problematyka zasobów danych w Internecie jest bardzo obszerna, wiąże się m.in.
z zagadnieniami Big Data i data mining, kompleksowa charakterystyka tematu wymagałaby
zatem osobnej, jemu tylko poświęconej publikacji. W artykule pominięta została także
ogólna, wielowymiarowa dyskusja nad różnymi sposobami rozumienia terminu „dane” oraz
jego relacjami do pokrewnych „informacji” i „wiedzy”, wskazano jedynie pewne podstawowe
wątpliwości. Natomiast pojęcie danych jakościowych, jako centralne dla bieżących
rozważań, jest szczegółowo omówione w następnym rozdziale.
Na użytek tego artykułu przyjmuje się, zgodnie zresztą z duchem literatury przedmiotu
[Bednarek-Michalska 2012; Corti 2011], iż obiektem zainteresowania są tzw. dane surowe
(ang. raw data), czyli w niewielkim stopniu przetworzone, jak np. dokumenty finansowe,
filmy, fotografie, nagrania audio, notatki, pamiętniki, rysunki, statystyki demograficzne i
ekonomiczne, transkrypcje wywiadów, wykazy wydatków organów państwowych i
samorządowych,
wypełnione
ankiety,
zapisy
z
instrumentów
astronomicznych,
laboratoryjnych albo monitoringu, zestawienia numeryczne i inne. Tak rozumiane dane
przeciwstawione są opracowaniom, czyli tradycyjnym publikacjom naukowym, fachowym,
publicystycznym, jak artykuły, eseje, książki, podręczniki, raporty, referaty itp.
Oczywiście
„surowe
dane”
to
metafora,
określenie
nieprecyzyjne.
Z metodologicznego punktu widzenia „czyste”, całkowicie nieprzetworzone dane nie istnieją,
co więcej, można wyróżnić kolejne „stopnie” ich postępującego przetworzenia [Kowalczyk,
Shankar 2011, p. 255].
Dodatkowo, określenie tego, co może być kwalifikowane jako „dane”, jest względne.
Zasoby
statystyczne,
np.
takie,
jakie
oferuje
europejski
http://epp.eurostat.ec.europa.eu/portal/page/portal/eurostat/home,
serwis
bez
Eurostat
wzbudzania
kontrowersji można nazwać danymi, zawartość Google Maps albo kolekcje fotografii w
Narodowym Archiwum Cyfrowym http://www.nac.gov.pl – zapewne też, natomiast jak
potraktować,
przykładowo,
pełne
teksty
Monitora
Sądowego
i
Gospodarczego
https://ems.ms.gov.pl, obejmujące bieżące ogłoszenia spółek handlowych, postanowienia
o upadłości itp.? Przy odpowiednio sformułowanym problemie badawczym właściwie
wszystko może stać się danymi, m.in. wpisy na forach dyskusyjnych, posty w blogach, a
nawet publikacje naukowe (np. dla kogoś, kto prowadzi badania bibliometryczne).
Kowalczyk i Shankar [Kowalczyk, Shankar 2011, p. 250–251] posługują się następującym
sformułowaniem, określając dane jako „każdą informację, która może być przechowywana w
formie elektronicznej, w tym teksty, dane liczbowe, grafikę, nagrania wideo i filmy, nagrania
audio, oprogramowanie, algorytmy, równania, animacje, modele, symulacje etc. Tego rodzaju
dane mogą być tworzone na różne sposoby, w tym metodą obserwacji, kalkulacji lub
eksperymentu”1. Generalnie w Internecie istnieje ogromna liczba zróżnicowanych zbiorów
danych, dających się wyodrębnić spośród innych zasobów jako mniej lub bardziej spójne
całości. Niektóre z nich powstały nieintencjonalnie, „przy okazji”, np. usługa Google
Książki stanowi właściwie ogromny korpus językowy, który, dodatkowo, kilka lata temu
„dorobił
się”
własnego
narzędzia
analitycznego
o
nazwie
Ngram
Viewer
https://books.google.com/ngram. Inne zostały zbudowane celowo, jak – by pozostać w tym
samym kręgu – Narodowy Korpus Języka Polskiego http://www.nkjp.pl.
Z innego punktu widzenia zbiory danych w Internecie można podzielić na o t w a r t e
i zamknięte. Te pierwsze są udostępnione publicznie, bez ograniczeń, drugie natomiast
cechują się dostępem mniej lub bardziej restrykcyjnym.
Jeżeli chodzi o typy kolekcji danych, to najbardziej widoczne są trzy:
 wspomniane już korpusy językowe,
 (otwarte) dane badawcze / naukowe,
 (otwarte) dane publiczne (często produkowane przez rządy państw, instytucje i urzędy
krajowe oraz organizacje międzynarodowe, takie jak Bank Światowy, OECD, Światowa
Organizacja Handlu czy Unia Europejska).
To prawdopodobnie nie jest wyczerpująca typologia, ale stworzenie takowej nie jest celem
niniejszych dociekań. Na marginesie warto jednak zauważyć, iż we współczesnym
piśmiennictwie informatologicznym generalnie brakuje przemyślanej, rzetelnej typologii
źródeł informacji w Internecie, która obejmowałaby m.in. także archiwa „surowych” danych i
odróżniała je od innych zasobów online.
W Polsce bodaj najwięcej uwagi poświęca się zbiorom danych publicznych,
prawdopodobnie dlatego, iż mają one także wymiar obywatelski i polityczny (zob. np.
1
Tekst oryginalny: any information that can be stored in digital form, including text, numbers, images, video or
movies, audio, software, algorithms, equations, animations, models, simulations, etc. Such data may be
generated by various means including observation, computation, or experiment [Kowalczyk, Shankar 2011, p.
250–251].
http://mojepanstwo.pl albo http://otwartedane.pl), a poza tym w dużej mierze podlegają
polskim i unijnym regulacjom prawnym, w tym Ustawie o dostępie do informacji publicznej
[Obwieszczenie... 2014].
Archiwa / repozytoria danych badawczych z kolei są to intencjonalnie stworzone
zbiory danych / materiałów, powstałych w wyniku badań empirycznych w różnych
przedsięwzięciach naukowych lub też zgromadzonych na potrzeby konkretnych projektów
badawczych. Innymi słowy, termin ten nie określa wszystkich istniejących kolekcji danych,
które ewentualnie mogłyby „przydać się” w dociekaniach naukowych (zob. też wcześniejsze
uwagi), lecz tylko te, które obejmują materiały uzyskane w rezultacie badań, a także zostały
zorganizowane celowo, odpowiednio uporządkowane, opisane metadanymi i przygotowane
do udostępniania [Archiwum... 2014; Brady 2006; Kowalczyk, Shankar 2011; IASSIST 2010
/ 2011]. Cytowane już Kowalczyk i Shankar [Kowalczyk, Shankar 2011, p. 256–257]
wyróżniają trzy rodzaje archiwów danych badawczych, biorąc pod uwagę ich wielkość i
zasięg. Są to kolekcje danych pochodzących z jednego projektu naukowego (ang. research
data collections), z jednego kierunku bądź obszaru badawczego (ang. community collections)
i wreszcie wielodziedzinowe, często międzynarodowe, oparte na dobrze zorganizowanej
infrastrukturze technologicznej (ang. reference collections).
Archiwa danych badawczych mogą zawierać, po pierwsze, materiał empiryczny
pochodzący z badań nauk matematycznych, przyrodniczych i z nurtu pozytywistycznego w
dyscyplinach społecznych, czyli tzw. dane ilościowe, chociaż w rzeczywistości są to nie
tylko liczby, ale również zdjęcia, np. galaktyk albo dna morskiego. Dobry przykład takiego
zbioru
w otwartym
dostępie
http://ned.ipac.caltech.edu,
stanowi
a w Polsce
NASA
–
/
IPAC
Archiwum
Extragalactic
Danych
Database
Społecznych
http://www.ads.org.pl (dostęp „półotwarty”, możliwy po zarejestrowaniu, nie dotyczy
zbiorów zastrzeżonych). Po drugie, archiwa mogą obejmować tzw. dane jakościowe,
zgromadzone w ramach podejścia interpretatywnego / rozumiejącego w naukach
humanistycznych i społecznych. Widać, że rozróżnienie archiwów danych ilościowych i
jakościowych jest właściwie pochodną stosowanej metodologii badań.
W ostatnich kilku latach pojawiły się interesujące inicjatywy, a także globalne
internetowe serwisy wyszukiwawcze, promujące (otwarty) dostęp do „surowych” danych
badawczych. Są to m.in.:
 Databib http://databib.org, serwis wyszukiwawczy archiwów danych badawczych,
obejmujący obecnie (lipiec 2014) 978 repozytoriów z wszystkich dziedzin nauki, w tym
humanistycznych i społecznych,
 DataCite http://www.datacite.org, założona w 2009 roku międzynarodowa organizacja
non-profit, mająca na celu ułatwienie dostępu do danych badawczych w Internecie,
 Data repositories http://oad.simmons.edu/oadwiki/Data_repositories (serwis dotyczy
danych otwartych, jest mocno niekompletny),
 ICSU
World
Data
System
http://www.icsu-wds.org,
istniejące
od
2008
roku
przedsięwzięcie Międzynarodowej Rady Nauki (International Council for Science), z
dostępem do zbiorów danych badawczych poprzez Data Portal http://www.icsuwds.org/services/data-portal,
 re3data.org – Registry of research data repositories http://www.re3data.org/, rejestr
powstały w 2012 roku w Niemczech, w połowie roku 2014 indeksujący ok. 650 archiwów
danych badawczych z całego świata.
W marcu 2014 roku Databib, DataCite i re3data.org ogłosiły połączenie sił do końca roku
2015, z zamiarem stworzenia uniwersalnego serwisu wyszukiwawczego dla kolekcji
ilościowych i jakościowych danych badawczych w Internecie [re3data.org team 2014].
Archiwizowanie i ponowne wykorzystywanie danych jakościowych – wybrane
aspekty
Dane ilościowe są archiwizowane standardowo. Piotr Filipkowski pisze: „Potrzeba
archiwizowania danych ilościowych jest oczywistością. Nikt nie podaje jej w wątpliwość.
Specjalizacja sprzyja wręcz temu, by jedni zbierali i archiwizowali te dane, inni je
porządkowali, zestawiali w tabele i wykresy, uczenie analizowali i omawiali, a jeszcze inni –
z większą już swobodą – uogólniali” [Filipkowski 2005, s. 32]. W naukach przyrodniczych
wiodące czasopisma często wymagają podania gdzie przechowywane są dane empiryczne
stanowiące podstawę publikacji, a ich opracowanie i udostępnienie stanowi warunek wstępny
przyjęcia artykułu do druku [Kowalczyk, Shankar 2011, p. 248]. „Wśród badaczy
jakościowych (…) tendencja jest dokładnie odwrotna: dane zebrane przez jednych badaczy
niezwykle rzadko są traktowane jako źródło w badaniach drugich” [Filipkowski 2005, s. 32].
Jak na wpół żartobliwie zauważa Arja Kuula [Kuula 2010 / 2011], materiały jakościowe
często „kończą” w szufladzie, na strychu albo w domku letniskowym badacza. Zrozumienie
potrzeby
archiwizowania,
udostępniania
i
powtórnego
wykorzystywania
danych
jakościowych na szerszą skalę dopiero się rodzi.
Tym niemniej, archiwizacja i udostępnianie jakościowych danych badawczych
stanowi dzisiaj dynamicznie rozwijającą się dziedzinę zarówno działalności, jak i refleksji
teoretycznej. W ostatnich latach pojawiły się różne krajowe i międzynarodowe inicjatywy w
tym zakresie, powstają kolejne repozytoria, pojawiła się też odpowiednia oferta edukacyjna,
m.in. w Wielkiej Brytanii [Bishop 2014; Corti 2011; IASSIST 2010 / 2011; Perez-Hernandez
2014; Secondary 2014]. Także biblioteki akademickie na świecie zaczęły umieszczać na
swoich stronach przewodniki po zbiorach danych jakościowych [Identifying... 2014]. Wynika
to, po pierwsze, z rosnącej popularności badań jakościowych, po drugie – z coraz silniejszego
oddziaływania ideologii otwartej nauki [zob. m.in. Panton 2010], po trzecie wreszcie – z
możliwości, które oferuje współczesna technologia informacyjna i sieciowa.
Długą tradycję w archiwizowaniu i udostępnianiu danych badawczych ma Wielka
Brytania, gdzie już w roku 1994 powstał pierwszy oficjalny narodowy serwis o zbiorach
danych jakościowych ESDS Qualidata, który w 2012 roku został włączony do systemu z
zakresu nauk ekonomicznych i społecznych UK Data Service http://ukdataservice.ac.uk.
Od 2014 roku działa w USA portal Qualitative Data Repository QDR https://qdr.syr.edu,
finansowany
przez
amerykańską
Narodową
Fundację
Nauki.
Zainteresowanie
archiwizowaniem danych jakościowych widać również w kilkunastu krajach europejskich,
stan obecny i perspektywy w tym zakresie zostały przedyskutowane m.in. podczas
warsztatów w Bremie w 2009 roku [IASSIST 2010 / 2011]. W Polsce wspomniany już
Instytut Filozofii i Socjologii PAN prowadzi obecnie projekt pod nazwą Archiwum Danych
Jakościowych, finansowany ze środków Narodowego Programu Rozwoju Humanistyki
[Archiwum... 2014].
Czym jednak są dane jakościowe, które mają być udostępniane poprzez repozytoria
online? Jest to materiał empiryczny, zgromadzony przy wykorzystaniu technik jakościowych
w ramach podejścia interpretywnego / rozumiejącego w naukach o człowieku. Źródłami
danych mogą tutaj być: (1) dokumenty, teksty, już istniejące lub stworzone na prośbę badacza,
oficjalne i nieoficjalne, (2) fokus, zogniskowany wywiad grupowy, (3) obserwacja w różnych
wariantach (etnograficzna, naturalistyczna, samoobserwacja, shadowing, uczestnicząca lub
nie), (4) wywiad indywidualny (jakościowy, pogłębiony, narracyjny, Sense-Making i in.)
[Cisek 2013].
Empiryczne dane jakościowe dzieli się czasami na niewywołane (zastane) i wywołane
(wytworzone). Pierwsze z nich powstają „naturalnie”, bez ingerencji badacza (np. listy, posty
w blogach, wpisy w portalach społecznościowych, zdjęcia z wakacji), drugie – w efekcie
czynności uczonego, w „sztucznych”, stworzonych na potrzeby badania sytuacjach, np.
podczas obserwacji uczestniczącej albo wywiadu pogłębionego. Jednakże, jak trafnie
zauważa Tim Rapley, „w rzeczywistości w obu przypadkach działania badacza odgrywają
podstawową rolę w procesie wytwarzania materiałów i ich przekształcania w dane. W obu
przypadkach trzeba je przecież odkryć, fizycznie zgromadzić, wybrać te, które zatrzymamy, i
odrzucić te, które pominiemy. (…) Najważniejsza decyzja wiąże się z uznaniem konkretnego
zestawu materiałów za zbiór danych” [Rapley 2010, p. 34].
W piśmiennictwie dotyczącym archiwizowania danych jakościowych autorzy
najczęściej mają na myśli udostępnianie i powtórne wykorzystanie materiałów wywołanych,
jednakże zbiory materiałów niewywołanych również mogą być cenne, zwłaszcza, że granica
między nimi bywa płynna, jak wskazano w poprzednim akapicie. Doskonały przykład
stanowią
tutaj
kolekcje
cyfrowe
Ośrodka
Karta,
w
tym Archiwum
Fotografii
http://foto.karta.org.pl i Archiwum Historii Mówionej http://www.audiohistoria.pl.
W repozytoriach badawczych danych jakościowych znajduje się zatem bogaty, z
reguły słabo ustrukturyzowany materiał empiryczny w postaci werbalnej (dzienniki, nagrania
audio, notatki terenowe, ogłoszenia, opowieści, pamiętniki, regulaminy, transkrypcje, zapisy
wywiadów, zarządzenia itp.), wizualnej (fotografie, rysunki) lub multimedialnej (filmy,
nagrania wideo, zawartość serwisów WWW). Tutaj także, podobnie jak generalnie w
odniesieniu do archiwów danych badawczych, trzeba podjąć decyzję dotyczącą stopnia
przetworzenia danych zamieszczonych w zbiorze, np. czy będą tam oryginalne nagrania
przeprowadzonych wywiadów, czy tylko ich transkrypcje, czy jedno i drugie (najlepiej).
Podstawowe pytanie brzmi – czemu mają służyć archiwa danych jakościowych, po co
właściwie je organizować? Otóż przede wszystkim po to, by umożliwić powtórne
wykorzystanie istniejącego, już raz wytworzonego materiału empirycznego, przede
wszystkim w celach naukowych, ale również edukacyjnych, a nawet gospodarczych i
społecznych (kontrola wydatkowania publicznych pieniędzy, transfer wiedzy z nauki do
gospodarki). Dzięki temu można osiągnąć m.in. korzyści poznawcze, o których mowa w
dalszej części rozważań, dydaktyczne, zwłaszcza w szkolnictwie wyższym, gdzie dane
empiryczne zgromadzone w autentycznych badaniach mogą stanowić znakomitą pomoc w
nauczaniu metodologii i nie tylko, oraz finansowe i organizacyjne. Badania jakościowe często
są czaso- i pracochłonne, a więc drogie. Powtórne wykorzystanie raz zgromadzonego
materiału empirycznego przynosi oszczędność czasu, pieniędzy i wysiłku. Poza tym, dane
jakościowe mogą np. dotyczyć grup ludzi, do których dotarcie stało się utrudnione bądź
niemożliwe. Wówczas istniejące, „gotowe” dane są jedynym źródłem dla przyszłych badaczy.
Tworzeniu archiwów danych jakościowych towarzyszą problemy metodologiczne,
etyczne, organizacyjne, prawne, a także informacyjne / informatologiczne (z zakresu
organizacji wiedzy, zarządzania informacją i udostępniania).
Zagadnienia metodologiczne wiążą się z poznawczymi celami tworzenia archiwów
danych jakościowych. Obejmują dwa podstawowe wymiary, odnoszące się do wykorzystania
udostępnionego
materiału
empirycznego:
dla
zapewnienia
intersubiektywnej
kontrolowalności i sprawdzalności badań jakościowych oraz dla przeprowadzenia nowych
projektów badawczych.
Intersubiektywna sprawdzalność stanowi uniwersalny warunek naukowości, może
jednak być osiągnięta na różne sposoby. W metodologii ilościowej, w naukach
przyrodniczych często można „po prostu” powtórzyć badania poprzedników (sprawdzić
poprawność obliczeń, wykonać ten sam eksperyment itp.). W dociekaniach jakościowych
zazwyczaj nie jest to możliwe, nie da się drugi raz zrobić „tej samej” obserwacji
etnograficznej czy wywiadu narracyjnego, dlatego należy pozostawić tzw. ścieżkę
sprawdzenia (ang. audit trial), czyli rygorystycznie i wyczerpująco opisać własne
postępowanie badawcze. Szczegółowo scharakteryzowane powinny zostać nie tylko:
kontekst, uwarunkowania i założenia badań oraz sam tok rozumowania, ale również – właśnie
– dane empiryczne, na których oparte zostały wnioski [Cisek 2013]. Jeszcze lepiej byłoby,
gdyby czytelnicy, inni naukowcy, mogli sięgnąć do oryginalnego materiału empirycznego i
stwierdzić, czy został odpowiednio i poprawnie wykorzystany, zapewniając trafność i
rzetelność badań. Z drugiej strony, niektórzy obawiają się niewłaściwego wykorzystania
„swoich” danych przez „konkurencję”, np. do uzyskania grantów, albo złośliwej krytyki.
Jednakże transparentność procesu badawczego jest wartością nadrzędną [Kuula 2010 / 2011,
p. 14].
Dane jakościowe zgromadzone w archiwach można też wykorzystać w nowych
projektach badawczych. Potencjał jest spory i obejmuje m.in.:
 badania długookresowe, np. powrót po latach do tych samych badanych albo przynajmniej
do tej samej grupy społecznej;
 dociekania porównawcze, np. zbadanie istniejących danych empirycznych inną metodą /
techniką (komparatystyka metodologiczna). Hanna Palska zauważa: „Użytkownicy
nowych metod interpretatywnych raz po raz apelują o reanalizę starych materiałów, by
skonfrontować własne techniki interpretacyjne z technikami niegdyś używanymi” [Palska
2005, s. 14];
 powtórne poszukiwanie odpowiedzi na pytania postawione w oryginalnych dociekaniach,
co może zaowocować uchwyceniem innego aspektu badanego wycinka rzeczywistości.
Kolejna analiza istniejących materiałów, przeprowadzona w odmiennych ramach
pojęciowych, często pozwala odnaleźć relacje i treści, których dotąd nikt nie zauważył
[Kuula 2010 / 2011, p. 14];
 wykorzystanie tego samego, „starego” materiału empirycznego do poszukiwania
rozwiązań zupełnie nowych, innych zagadnień.
Jednakże czy można (w obydwu znaczeniach – czy się da i czy wolno) ponownie
wykorzystywać badawcze dane jakościowe? Ich powtórne użycie wzbudza niejakie
kontrowersje metodologiczne, ponieważ dla dociekań jakościowych często charakterystyczne
jest osobiste zaangażowanie badacza, nawiązanie emocjonalnej i intelektualnej więzi z
badanymi, pozwalające ich zrozumieć. Gdy inni uczeni mają do dyspozycji tylko sam zapis
materiału empirycznego, tego ważnego czynnika może im brakować. To zastrzeżenie
oczywiście dotyczy tylko danych wywołanych, powstałych w interakcji z badanymi lub na
prośbę badacza. W odniesieniu do danych zastanych, np. istniejących dokumentów, nie ma
ono większego sensu.
Z kolei kontrargumenty wobec wskazanego zastrzeżenia są następujące:
 W repozytoriach de facto archiwizuje się jakościowy materiał empiryczny, z którego
dopiero należy „zrobić” różne konkretne dane na potrzeby kolejnych, odmiennych
projektów naukowych. Co więcej, z reguły jest on redundantny wobec zagadnienia
badawczego, dla którego został zgromadzony. Jak zauważa Piotr Filipkowski: „Każde dane
wymagają interpretacji. Dane jakościowe – dokumenty osobiste, relacje biograficzne,
notatki z obserwacji, zapisy fokusów itp. – otwierają szczególne możliwości
reinterpretacji. Są to bowiem prawie zawsze dane nadmiarowe w stosunku do pytań, jakie
postawił wobec nich badacz, który je zgromadził i zanalizował” [Filipkowski 2005, s. 34].
Materiały takie można wykorzystać, jak już wcześniej wspomniano, do rozwiązania
innego, zupełnie nowego problemu poznawczego.
 W dociekaniach jakościowych nie istnieje pojedynczy i „jedynie słuszny” sposób analizy
i interpretacji zebranego materiału badawczego, więc nie można twierdzić, że tylko
„oryginalny” badacz ma prawo to zrobić [Kuula 2010 / 2011, p. 14].
 Czasami i w „tradycyjnych” badaniach jakościowych bywa tak, że kto inny np.
przeprowadza wywiady, a kto inny je analizuje i to jest akceptowane [Kuula 2010 / 2011,
p. 14].
Aby powtórne wykorzystanie jakościowego materiału empirycznego było uzasadnione
i wykonalne, konieczne jest zamieszczenie w archiwach, oprócz danych, także informacji
kontekstowych, m.in. dla jakiego przedsięwzięcia badawczego i za pomocą jakich narzędzi /
technik materiał został zgromadzony, jakie są jego relacje do innych zbiorów danych, czy
wykorzystano konkretne oprogramowanie itp. Należy również określić nośnik, dostępność
techniczną i, pod względem prawnym, kto jest właścicielem oraz podać inne potrzebne
metadane [Kowalczyk, Shankar 2011, p. 253; Kuula 2010 / 2011, p. 14]. Cytowany już
Filipkowski pisze: „Archiwizowanym danym powinna towarzyszyć rzetelna i wyczerpująca
dokumentacja określająca założenia, cele, metody badawcze i wyniki projektu, w ramach
którego te dane zebrano. Jest to warunek ich kompetentnej reanalizy” [Filipkowski 2005, s.
37–38]. Ważne jest także, by materiał zgromadzony i udostępniany poprzez archiwa był
dobrej jakości, zarówno w wymiarze naukowym, jak i informacyjnym, by cechował się
kompletnością intelektualną i techniczną, niezmiennością / trwałością, poprawnością i
spójnością [Kowalczyk, Shankar 2011, p. 254]. Wskazane kwestie łączą w sobie aspekty
metodologiczne i z zakresu zarządzania informacją.
Problemy etyczne dotyczą ochrony prywatności, a także emocji, psychiki i
społecznego funkcjonowania badanych. W dociekaniach jakościowych badacz często spędza
z nimi wiele czasu, są to konkretne osoby (a nie – jak w metodologii ilościowej – „elementy”
próby reprezentatywnej), poruszane bywają wrażliwe kwestie. W związku z tym, oczywiście,
badani powinni podpisać zgodę na archiwizację, ich dane osobowe należy utajnić, a notatki i
wypowiedzi poddać anonimizacji. Z drugiej strony, jak się okazuje, wbrew licznym i zdaje
się nadmiernym obawom badaczy, zdecydowana większość badanych nie ma nic przeciwko
powtórnemu wykorzystaniu związanych z nimi materiałów empirycznych, często wręcz tego
oczekują, wychodząc z założenia, że skoro poświęcili swój czas, emocje, uwagę „dla dobra
nauki”, to powinien być z tego daleko idący pożytek [Kuula 2010 / 2011, p. 15–16].
Wymiar organizacyjny i prawny jest równie istotny. Należy m.in. rozwiązać kwestie
otwartego bądź restrykcyjnego dostępu do archiwów, prawa własności do materiału
empirycznego (pozostające w gestii badacza, badanych lub instytucji finansującej), a także
wspomnianej w poprzednim akapicie ochrony prywatności (np. udostępnianie informacji
kontaktowych do badanych). Należy także rozważyć, kto ma się zajmować tworzeniem
archiwów danych jakościowych: każda zainteresowana placówka badawcza, biblioteki
akademickie i naukowe, organizacje społeczne lub uczelnie oraz czy powinny powstawać
centralne archiwa narodowe / państwowe albo nawet europejskie. Są już próby formułowania
pewnych zasad, jedną z nich stanowią tzw. Panton Principles [Bednarek-Michalska 2012;
Panton 2014].
Aspekt informacyjny (informatologiczny) wiąże się z organizacją wiedzy i
zarządzaniem informacją w repozytoriach jakościowych danych badawczych. Chodzi tutaj
m.in. o formaty danych, standardy opisu i katalogowania jakościowego materiału
empirycznego, adekwatny system metadanych, który umożliwiłby sprawny dostęp,
wyszukiwanie i wymianę informacji między archiwami / instytucjami, a także o kwestie
związane ze starzeniem się nośników, potrzebą digitalizacji itd. Jest to kolejny, ogromny
obszar spraw do rozwiązania, który należałoby rozważyć w odrębnej publikacji.
Zakończenie
W artykule zarysowano obszar zagadnień związanych z tworzeniem archiwów /
repozytoriów danych badawczych, w szczególności jakościowych. Obecnie podejmowane są
różnorodne działania, których celem jest zbudowanie infrastruktury i kultury wielokrotnego
wykorzystywania jakościowego materiału empirycznego.
Otwiera się tu szerokie pole do badań i działalności, także dla praktyków i teoretyków
bibliotekoznawstwa i nauki o informacji. Po pierwsze, interesujące są wymienione już
kwestie związane z aspektami informacyjnym i organizacyjnym tworzenia repozytoriów
danych jakościowych. Po drugie, można sprawdzić, czy w istniejących archiwach danych nie
ma materiałów, które dałoby się wykorzystać również i w dociekaniach bibliologicznych i
informatologicznych, zamiast, powiedzmy, przeprowadzać kolejną standardową ankietę. Po
trzecie, archiwa danych badawczych to rodzaj naukowych źródeł informacji, należy więc
włączyć je do treści kształcenia z zakresu informacji naukowej, zarządzania informacją itp.
Po czwarte wreszcie, w literaturze przedmiotu nie ma publikacji poświęconych
użytkownikom archiwów / repozytoriów danych jakościowych, ich zachowaniom
informacyjnym itd., a warto byłoby to zbadać.
To tylko kilka propozycji, zapewne interesujących możliwości jest więcej.
Bibliografia
1. Archiwum Danych Jakościowych. Instytut Filozofii i Socjologii Polskiej Akademii Nauk
(2014). http://www.ifispan.waw.pl/index.php?lang=pl&m=page&pg_id=55 [odczyt:
06.07.2014].
2. Bednarek-Michalska, Bożena (2012). Repozytoria surowych danych – dlaczego biblioteki
powinny je znać? [dok. elektr.] Biuletyn EBIB nr 8 (135).
http://open.ebib.pl/ojs/index.php/ebib/article/view/152/292 [odczyt: 02.07.2014].
3. Bishop, Libby (2014). An invitation to secondary analysis of qualitative data. Secondary
analysis of qualitative data: an advanced course, University of Essex, 22–23 May 2014
[dok. elektr.]. http://ukdataservice.ac.uk/media/440302/secondaryanalysis2223may14.pdf [odczyt: 11.07.2014].
4. Brady, Angela (2006). Qualitative data archives. W: The SAGE Dictionary of Social
Research Methods [dok. elektr.]. http://srmo.sagepub.com/view/the-sage-dictionary-ofsocial-research-methods/n164.xml [odczyt: 08.07.2014].
5. Cisek, Sabina (2013). Metodologia jakościowa we współczesnej informatologii. Wybrane
aspekty. Przegląd Biblioteczny R. 81, z. 3, s. 299–310.
6. Corti, Louise (2011). The European Landscape of Qualitative Social Research Archives:
Methodological and Practical Issues [dok.elektr.]. Forum: Qualitative Social Research
Vol. 12, Issue 3. http://nbn-resolving.de/urn:nbn:de:0114-fqs1103117 [odczyt:
06.07.2014].
7. Filipkowski, Piotr (2005). Po co archiwizować dane jakościowe i jak robią to inni. ASK nr
14, s. 31–52.
8. IASSIST Quarterly Vol. 34, No. 3–4; Vol. 35., No. 1–2. Special Issue: Qualitative and
Qualitative Longitudinal Resources in Europe. Mapping the field and exploring strategies
for development (2010 / 2011) [dok. elektr.].
http://www.iassistdata.org/downloads/iqvol34_35.pdf,
http://www.iassistdata.org/iq/issue/34/3 [odczyt: 02.07.2014].
9. Identifying Repositories for Data Sharing (2014). [dok. elektr.]
http://research.library.gsu.edu/content.php?pid=348991&sid=2855062 [odczyt:
10.07.2014].
10. Kościański, Artur (2005). Archiwum społecznych danych jakościowych: potrzeby,
kontrowersje, propozycje praktyczne. ASK nr 14, s. 19–29.
11. Kowalczyk, Stacy; Shankar, Kalpana (2011). Data sharing in the sciences. Annual Review
of Information Science and Technology Vol. 45, Issue 1, p. 247–294.
12. Kuula, Arja (2010 / 2011). Methodological and Ethical Dilemmas of Archiving
Qualitative Data [dok. elektr.]. IASSIST Quarterly Vol. 34–35, p. 12–17.
http://www.iassistdata.org/iq/methodological-and-ethical-dilemmas-archiving-qualitativedata [odczyt: 06.07.2014].
13. Obwieszczenie Marszałka Sejmu Rzeczypospolitej Polskiej z dnia 14 kwietnia 2014 r. w
sprawie ogłoszenia jednolitego tekstu ustawy o dostępie do informacji publicznej.
Dziennik Ustaw 2014 poz. 782 [dok. elektr.].
http://www.dziennikustaw.gov.pl/du/2014/782/1 [odczyt: 01.09.2014].
14. Palska, Hanna (2005). O potrzebie ochrony danych jakościowych. Z doświadczeń
socjologa-humanisty. ASK nr 14, s. 7–17.
15. Pampel, Heinz (2013). How to find an appropriate research data repository? PLOS Tech
Blog [dok. elektr.]. http://blogs.plos.org/tech/how-to-find-an-appropriate-research-datarepository/ [odczyt: 02.07.2014].
16. Pampel, Heinz et al. (2013). Making Research Data Repositories Visible: The re3data.org
Registry [dok. elektr.]. PLOS ONE Vol. 8 (11).
http://www.plosone.org/article/info%3Adoi%2F10.1371%2Fjournal.pone.0078080
[odczyt: 02.07.2014].
17. Panton Principles. Principles for Open Data in Science (2010) [dok. elektr.].
http://pantonprinciples.org [odczyt: 07.07.2014].
18. Perez-Hernandez, Danya (2014). New Repository Offers a Home for Data That Aren’t
Numbers [dok. elektr.]. http://chronicle.com/blogs/wiredcampus/new-repository-offers-ahome-for-data-that-arent-numbers/50865 [odczyt: 10.07.2014].
19. Rapley, Tim (2010). Analiza konwersacji, dyskursu i dokumentów. Warszawa:
Wydawnictwo Naukowe PWN, 238 s.
20. re3data.org team (2014). DataCite, re3data.org, and Databib announce Collaboration [dok.
elektr.]. http://www.re3data.org/2014/03/datacite-re3data-org-databib-collaboration/
[odczyt: 12.07.2014].
21. Secondary Qualitative Data Sources and How to Find Them (2014) [dok. elektr.].
http://medanth.wikispaces.com/Secondary+Qualitative+Data+Sources+and+How+to+Fin
d+Them [odczyt: 06.07.2014].
22. What is DataCite? (2014) [dok. elektr.]. http://www.datacite.org/whatisdatacite [odczyt:
10.07.2014].

Podobne dokumenty