Zostałeś zalogowany. Za X sek. strona zostanie przeładowana.

Na naszej stronie stosujemy pliki cookies. Korzystanie z witryny bez zmian ustawień oznacza, że akceptują Państwo otrzymywanie tych plików. Wyłącz komunikat
Logo NInA
fot. opensourceway, Flickr, CC BY-SA
Powrót

Digitalizacja i crowdsourcing

Duże, żmudne projekty digitalizacyjne można podzielić na setki tysięcy mikrozadań, które wykonywane są online przez wolontariuszy. Jest to znacznie tańsze i mniej skomplikowane niż zatrudnianie wielu specjalistów.

Przy obecnym zaawansowaniu technologicznym proces masowej digitalizacji przebiega coraz szybciej. Wpływa na to daleko idąca automatyzacja i ciągły rozwój skanerów, konwerterów, kamer itp. Jednak w sieci przede wszystkim liczy się możliwość wygodnego wyszukiwania, filtrowania i porządkowania treści udostępnionych online. Dlatego surowe skany pozbawione metadanych, czyli dokładnych opisów, są dla większości użytkowników zupełnie bezużyteczne. Im materiały są dokładniej opisane, tym lepiej można je wyszukiwać, zawężając coraz bardziej ilość wyników. Stworzenie dokładnych opisów jest niezwykle żmudną, czasochłonną pracą, którą muszą wykonywać dobrze wykwalifikowani eksperci z różnych dziedzin.

Potęga społeczności

Zatrudnienie tak wielu osób jest praktycznie niemożliwe. Byłoby to niezwykle kosztowne i trudne w organizacji. Rozwiązanie tego problemu przyszło wraz z rozwojem technologii telekomunikacyjnych. Okazało się, że duże, żmudne projekty można podzielić na setki tysięcy mikrozadań, które wykonywane są online przez wolontariuszy. Jest to znacznie tańsze i mniej skomplikowane niż zatrudnianie wielu specjalistów. O ile sama digitalizacja wymaga kosztownego sprzętu, szkoleń oprogramowania itp., o tyle do opracowania, ewidencji i indeksacji treści w większości wypadków wystarczy komputer podłączony do Internetu.

Crowdsourcing, czyli oddanie sterów merytorycznego opisu w ręce internetowej społeczności, wydaje się być naturalnym skutkiem digitalizacji. Przynosi widoczne, wymierne efekty. Czołowym przykładem jest 1940 Census Community Project. W kwietniu 2011 r. amerykańskie archiwa narodowe udostępniły online skany dokumentów wytworzonych podczas przeprowadzonego w 1940 r. spisu powszechnego. W ciągu czterech miesięcy 160 tysięcy wolontariuszy zindeksowało przy użyciu specjalnie przygotowanej aplikacji wszystkie karty zawierające 132 miliony nazwisk. Są one dostępne na portalach genealogicznych, m.in. Family Search

Inny ciekawy przykład projektu wykorzystującego społeczność to projekt Digitalkoot prowadzony przez fińską Bibliotekę Narodową. Celem jego twórców było utworzenie w pełni przeszukiwalnej bazy zawierającej wszystkie zgromadzone w bibliotece artykuły prasowe. Skany zostały poddane obróbce OCR (optyczne rozpoznawanie tekstu). Efekt wymagał w tym przypadku dużej korekty – stuletnie gazety są mocno zniszczone i niekiedy słabo czytelne, a programy OCR nie do końca radziły sobie z dziewiętnastowiecznymi czcionkami. Profesjonalnych korektorów stale wspierają internauci, którzy sprawdzają skany przy okazji grania w dwie zabawne gry dostępne na stronach projektu. Aby osiągnąć cel gry – przeprowadzić kreta bezpiecznie przez całą planszę, trzeba przepisać odpowiednio szybko słowa wyświetlone w ich pierwotnej formie ze skanu. Przepisane słowa budują most, po którym kret bezpiecznie trafia do celu. Jak dotąd, wolontariusze sprawdzili ponad osiem milionów słów, co odpowiada mniej więcej 20 tysiącom artykułów zbliżonych do niniejszego. W grze wzięło udział dotąd prawie 110 tysięcy graczy, była ona szeroko opisywana przez media, a cały projekt pozytywnie wpłynął pozytywnie na rozpoznawalność i wizerunek biblioteki.

Trudności

W praktyce projekty crowdsourcingowe wymagają oczywiście pewnych nakładów pracy. Trzeba przeprowadzić akcję promocyjną, przygotować narzędzia do opracowania danych itp. Jednak trudności nastręcza nie tyle techniczna strona takich działań, co raczej sama istota crowdsourcingu. Oznacza on bowiem przekazanie użytkownikom roli, którą pełniły dotąd instytucje i reprezentujące je jednostki, ręczące swoim autorytetem za poprawność badań i wysoką jakość merytoryczną opracowań. Crowdsourcing w skrajnej postaci oznacza merytokrację i służebną rolę instytucji wobec obywateli. Czy jesteśmy gotowi na takie nowe otwarcie? 

 

Autor: Bartłomiej Kuczyński, kierownik Oddziału Udostępniania Zasobu w Narodowym Archiwum Cyfrowym.

Zobacz również