Ar pāvesta svētību: Vatikāna bibliotēkas digitālais maratons

vatican_manuscriptPar atsevišķām interesantām digitālajām kolekcijām šajā blogā ir rakstīts jau iepriekš, taču šoreiz uzmanību vēlētos pievērst kādai kolekcijai, kas, lai arī  šobrīd vēl ir tapšanas stadijā, nākotnē solās kļūt par vienu no visvarenākajām seno un kultūrvēsturiski nozīmīgo dokumentu elektroniskajām krātuvēm globālajā tīmeklī. Sakāmvārds par mazo cinīti un lielo vezumu šeit ir gluži vietā, jo nebijuši vērienīgā digitalizācijas projektā ir iesaistījusies pasaulē mazākā valsts — Vatikāns. Precizāk — Vatikāna bibliotēka.

Lai arī pirmās ziņas par Vatikāna bibliotēkas iecerēm digitalizēt savu apjomīgo manuskriptu krājumu parādījās jau 2010. gadā, tomēr, kā izskatās, ar pilnu jaudu digitalizācijas process “ieskrējies” tikai samērā nesen. Sākotnējie plāni paredzēja, ka 10 gadus ilgstošā projekta ietvaros tiktu digitalizēti vairāk nekā 80 000 bibliotēkas krājumā esošie manuskripti. Aptuveni aprēķinātie skaitļi bija iespaidīgi — 80 miljoni lappušu un datu apjoms, kas aizņemtu 45 petabaitus (viens petabaits ir vienlīdzīgs 1024 terabaitiem).

Digitalizācija tika sākta 2011. gadā (2010. gadā izmēģinājumam jau gan tika ieskenēti 23 manuskripti), un šo gadu laikā bibliotēka ir digitalizējusi un tiešsaistē publicējusi gandrīz 400 manuskriptus (kas gan, protams, ir tikai neliela daļa).

Tomēr plašāku publicitāti šis projekts ieguva pirms apmēram mēneša. Iespējams, saprotot, ka, veicot digitalizāciju tikai pašas spēkiem, darbs uz priekšu nevirzās tik ātri kā ieplānots, 2014. gada 20. martā Vatikāna bibliotēka parakstīja vienošanos ar Japānas informācijas tehnoloģiju kompāniju “NTT DATA”, kas nākamo četru gadu laikā paredz 3000 manuskriptu digitalizāciju. Un tam noteikti būs arī turpinājums.

Varētu jautāt — kas gan šajā visā ir tik ievērības cienīgs? Daudzas pasaules bibliotēkas, kurām nav slinkums un ir tehniskās iespējas, digitalizē savas kolekcijas un piedāvā tās publiskai apskatei tiešsaistē. Jā, taisnība, tomēr Vatikāna bibliotēkai ir īpašs statuss, leģendāra vēsture, kā arī gadsimtu laikā izveidojusies pat zināma noslēpumainības aura. 1475. gadā dibinātā bibliotēka (šis ir oficiālais tās dibināšanas datums, taču pastāv uzskats, ka bibliotēka ir vēl senāka) nav pieejama apmeklētājiem no malas; to pētnieciskajam darbam drīkst apmeklēt tikai zinātnieki un, saprotams, arī pāvests. Lai arī tā ir pāvesta bibliotēka, tomēr tās krājumā nav tikai reliģiska satura materiāli — tas sniedz plašu ieskatu par Rietumu civilizāciju kopumā. Un tāpēc, pateicoties šim vērienīgajam digitalizācijas projektam, plašāka sabiedrība tuvākā vai tālākā nākotnē būs priviliģēta iepazīt kvalitatīvas digitālās reprodukcijas tādiem unikāliem dokumentiem, ko nekad nebūs iespējas skatīt klātienē. Galu galā par šī projekta pamatīgo atvēzienu liecina arī tā provizoriskās izmaksas — 14 miljoni eiro (citviet minēti pat 18 miljoni).

Vatikāna bibliotekārs Žans-Luī Brudžess atklāj, ka “digitalizētie manuskripti būs no pirmskoloniālās ēras Amerikā līdz pat Ķīnai, Japānai un tālajiem austrumiem, iekļaujot visas valodas un kultūras, kas ietekmējušas Eiropas kultūru”[1].

Bet, kamēr daudzi no šiem manuskriptiem vēl tikai gaida savu pārtapšanu digitālā formā, Vatikāna bibliotēkas interneta vietne mums ļauj ielūkoties jau līdz šim paveiktajā — apskatei šobrīd pieejami 393 manuskripti: http://www.mss.vatlib.it/guii/scan/link.jsp

…un šeit — digitalizētās inkunābulas (arī gluži ievērojams daudzums): http://www.vatlib.it/home.php?pag=inc_digitalizzati

 

1) Vatikāns digitalizēs baznīcas arhīvus  [tiešsaiste]. Pieejams: http://nra.lv/pasaule/113789-vatikans-digitalizes-baznicas-arhivus.htm

*Attēls no interneta vietnes http://www.interaksyon.com

Vēl par dažām saistošām digitālajām kolekcijām

Novērojumi liecina, ka aukstajos ziemas vakaros cilvēki visbiežāk mēdz sildīties pie datoriem. Protams, var strīdēties par to, vai sērfošana internetā ir adekvāta alternatīva slēpošanai, tomēr, ja jau cilvēks ir iegrimis virtuālajā pasaulē gluži kā sniega kupenā, būtu prātīgi, ja pie monitora pavadītais laiks būtu ne tikai izklaidējošs, bet arī izglītojošs. Tāpēc piedāvājam iepazīties ar vairākām ārzemju digitālajām kolekcijām, kas varētu šādu funkciju veikt un, ja ne gluži mudināt uz aktīvu pētniecisko darbu, tad vismaz ieinteresēt un paplašināt redzesloku.


University of Wisconsin Digital Collections

http://uwdc.library.wisc.edu

Kopš 2000. gada Viskonsīnas Universitātes (ASV) paspārnē darbojas Digitālo kolekciju centrs, kas, sadarbojoties ar akadēmisku personālu un bibliotekāriem, veido dažādas digitālās kolekcijas – ar mērķi piedāvāt materiālus pētniecībai un studijām, dokumentēt gan universitātes, gan Viskonsīnas štata vēsturi, kā arī nodrošināt piekļuvi reto vai sliktā fiziskajā stāvoklī esošo dokumentu elektroniskajām versijām. Līdz šim izveidota 61 digitālā kolekcija, un ar ikvienu no tām bez maksas vai reģistrēšanās tiešsaistē var iepazīties jebkurš interesents. Kolekciju tematiskā apmplitūda variē robežās no mākslas līdz eksaktajām zinātnēm, un, ņemot vērā, ka kolekcijas galvenokārt veidotas, balstoties uz Viskonsīnas Universitātes vai tās bibliotēkas īpašumā esošajiem materiāliem, dažas no tām veltītas samērā specifiskām tēmām, piemēram, kolekcijas ar nosaukumiem “U.S. Forest Products Lab Centennial Oral History Project” (ko varētu tulkot kā “Savienoto Valstu Meža produktu laboratorijas simtgades mutvārdu vēstures projekts”) un “The University of Wisconsin Board of Regents Collection” (Viskonsīnas Universitātes valdes locekļu kolekcija). Taču ir arī kolekcijas ar plašāku tematisko un ģeogrāfisko tvērumu, piemēram, tādas, kas veltītas dažādu pasaules reģionu studijām, ekoloģijai un vēsturei.

Arī digitālajās kolekcijās iekļauto materiālu veidi ir diezgan dažādi – grāmatas, manuskripti, kartes, fotogrāfijas, audioieraksti u.c. dokumenti. Ērtākai pārskatāmībai kolekcijas šajā vietnē sakārtotas alfabētiskā secībā (pēc to nosaukumiem); katra no tām piedāvā arī meklēšanas un/vai pārlūkošanas iespējas, tomēr šķiet, ka orientēšanos to saturā atvieglotu vienkāršākas, lietotājam saprotamākas saskarnes izmantošana (turklāt ne visās kolekcijās tā ir identiska). Tomēr nevar noliegt, ka piedāvāto materiālu klāsts ir daudzveidīgs, un, izsakoties aktiera Edgara Liepiņa vārdiem, – vajag tikai rakt!


The Digital Collections of Harvard College Library

http://hcl.harvard.edu/collections/digital_collections

Savu pienesumu digitālo kolekciju jomā ir devusi arī Hārvarda koledžas bibliotēka. Lai paplašinātu un uzlabotu piekļuvi saviem krājumiem, ir tikuši digitalizēti vairāki tūkstoši bibliotēkas īpašumā esoši dokumenti – vēsturiskas fotogrāfijas, manuskripti, grāmatas, kartes un citi reti un unikāli materiāli, no kuriem lielākā daļa brīvi apskatāmi tiešsaistē. Bibliotekāru un tehnisko darbinieku sadarbībā veiktā digitalizācija un digitālo kolekciju veidošanu Hārvarda koledžas bibliotēkā notiek jau vairāk kā desmit gadu, un neliels pārskats par šo procesu lasāms šajā interneta vietnē.

Arī šeit, līdzīgi iepriekš apskatītajam Viskonsīnas Universitātes Digitālo kolekciju centra veidotajam resursam, atrodamas gan specifiskākas kolekcijas, gan tādas, kas ieinteresēs plašāku lietotāju loku. Kā redzams, kolekcijas aptver dažādus pasaules reģionus un tautas, un mums ir iespēja apskatīt ķīniešu zīmējumus, senas japāņu fotogrāfijas, Anglijas ainavu fotoattēlus, latīņamerikāņu pamfletus, krievu teātra dizaina objektu skices, irāņu mutvārdu vēstures liecības (audiomateriāli) un dažādus citus digitalizētos materiālus.

Viena no kolekcijām, kas varētu būt saistoša tieši mūsu reģiona iedzīvotājiem, ir “Harvard Project on the Soviet Social System” (Hārvarda projekts par padomju sociālo sistēmu). Lai gan kolekcija nevar piesaistīt ar izteiksmīgiem un laikmetu raksturojošiem vizuālajiem materiāliem (fotogrāfijas tajā nav iekļautas), kā pētnieciskās izziņas resurss tā savu funkciju pilda labi. Tā pamatā koncentrējas uz Padomju Savienības pastāvēšanas agrīno posmu, galvenokārt piedāvājot stenogrammas no intervijām ar cilvēkiem, kas Aukstā kara sākuma gados emigrēja no PSRS.

Šobrīd kopumā pieejamas 29 digitālās kolekcijas, sagatavošanā ir vēl četras.


Digital Scriptorium

http://bancroft.berkeley.edu/digitalscriptorium/|

Zināšanu nodošana un rakstiskās informācijas izplatīšana viduslaikos prasīja neatlaidīgu darbu un ārkārtīgu pacietību. Mūkus, kas tolaik nodarbojās ar manuskriptu pavairošanu (tas ir, pārrakstīšanu – jo citas iespējas izveidot kopiju nebija), var apbrīnot, bet ne apskaust – diez vai viņiem atlika daudz laika citām nodarbēm. Pateicoties tolaik ieguldītajām pūlēm, vēl joprojām dažādu pasaules valstu bibliotēku krājumos atrodamas šī nozīmīgās rakstiskās laikmeta liecības, un, lai arī mums, informācijas tehnoloģiju paaudzes pārstāvjiem, būtu iespēja iepazīties ar šiem senajiem dokumentiem, tie tiek padarīti pieejami digitālā formā. Viena no šādām digitālajām kolekcijām ir “Digitālais skriptorijs” (Digital scriptorium) (par skriptorijiem viduslaikos sauca tās telpas, kurās notika jau pieminētā grāmatu pārrakstīšana). Kolekcijā iekļautas viduslaikos un renesanses laikā tapušo manuskriptu digitālās kopijas, un tās satura veidošanā ar savos krājumos esošajiem materiāliem piedalās dažādas institūcijas – universitātes, bibliotēkas, muzeji (jāpiezīmē, ka lielākā daļa šo institūciju atrodas ASV).

Kolekcijā iekļautos materiālus iespējams meklēt pēc atslēgvārdiem, izmantojot vienkāršo vai paplašināto meklēšanu, kā arī pārlūkot pēc to oriģinālu atrašanās vietas vai valodas. Manuskripti pēc izvēles skatāmi mazā, vidējā vai lielā izmērā, turklāt tie papildināti ar iespējami detalizētiem aprakstiem – informējot ne tikai manuskriptu izcelsmi un tapšanas laiku, bet norādot arī materiāla fizisko raksturojumu (manuskriptam izmantotā pergamenta izskats, izmērs, kvalitāte) un citas ziņas, kas varētu interesēt aizrautīgākos grāmatniecības vēstures interesentus – izmantotais burtu šrifts, izmantotie dekoratīvie elementi u.tml.

Šobrīd kolekcijā iekļauti vairāk kā 6500 manuskripti.

Starptautiskā semināra “Piektā digitalizācijas skola” apmeklējums (28.05.2013.–30.05.2013.)

Laikā no 28. līdz 30. maijam Saulkrastos notika starptautiskais seminārs “Piektā digitalizācijas skola”, kas, kā jau var noprast pēc nosaukuma, bija veltīts visdažādākajiem tieši ar digitalizāciju saistītiem jautājumiem. Lai sajustu jaunākās vēsmas digitalizācijas pasaulē un iepazītos ar citu ciparošanas speciālistu pieredzes stāstiem, šī semināra apmeklējumam tika norīkoti arī LU Bibliotēkas digitalizācijas grupas pārstāvji Māris Melderis un Zintis Gūts. Ņemot vērā, ka iepriekšējās digitalizācijas skolas bija norisinājušās citās valstīs, šogad noteikti bija jāizmanto iespēja apmeklēt to tepat, Latvijā. Tas norisinājās Saulkrastos esošajā atpūtas kompleksā “Minhauzena unda”, kas bija arī no citām valstīm atbraukušo semināra dalībnieku apmetnes vieta un naktsmājas.

Semināra rīkotāji – LU Akadēmiskā bibliotēka un Krievijas Valsts publiskā vēsturiskā bibliotēka – bija izveidojuši daudzpusīgu un piesātinātu programmu, tāpēc bija visai loģiski, ka seminārs tika izvērsts trīs dienu garumā – jo viena diena visām Latvijas, Lietuvas, Krievijas, Baltkrievijas un Ukrainas referentu prezentācijām noteiktu būtu bijusi krietni par īsu. Attiecīgo valstu pārstāvēto semināra dalībnieku vidū bija gan bibliotēku, arhīvu un muzeju darbinieki, gan arī digitalizācijas ārpakalpojuma uzņēmumu speciālisti. Lai arī saturiski prezentācijas pievērsās dažādiem digitalizācijas aspektiem, tomēr varētu sacīt, ka tās visas lielākoties bija kā pieredzes stāsti; mazāk tika iztirzāti teorētiski jautājumi, vairāk apskatīti pašu institūciju praktiskajā darbā sasniegtie rezultāti un gūtās atziņas.

Seminārs 28. maijā tika atklāts ar LU Akadēmiskās bibliotēkas direktores Ventas Koceres un Krievijas Valsts publiskās vēsturiskās bibliotēkas direktora vietnieces Oksanas Dinejevas ievadvārdiem, un tūdaļ pēc tam kā pirmais referents zāles priekšā vietu ieņēma LNB Digitālās bibliotēkas vadītājs Artūrs Žogla, kurš stāstīja par vienu no visapjomīgākajiem LNB veiktajiem digitalizācijas projektiem – periodisko izdevumu digitalizāciju. Šis darbs, ar kura augļiem var iepazīties arī interneta portālā periodika.lv, ir prasījis daudz laika un resursu, un tā īstenošanā LNB piesaistīja arī vairākus partnerus, kas veica gan pašu digitalizāciju, gan digitalizēto izdevumu segmentēšanu, gan arī portāla veidošanu. Viens no šādiem partneriem bija informācijas tehnoloģiju uzņēmums SIA “Datakom”, un nākamajā prezentācijā šī uzņēmuma produktu attīstības projektu vadītāja Zane Vītoliņa īsumā pastāstīja gan par pašu kompāniju, kurai ir jau 20 gadu pieredze, gan pievērsās tēmai par jauniešu piesaisti bibliotēkām ar atraktīvām metodēm – tādām, kas varētu ieinteresēt arī mūsdienu jaunieti, kurš lielākoties “dzīvo” internetā”, piemēram, aktīvāk izmantot sociālo portālu iespējas, kā arī piedāvāt atraktīvākus meklēšanas rīkus digitālajās bibliotēkās.

Latvijas Nacionālā Arhīva Dokumentu preventīvās saglabāšanas departamenta pārstāvji Inga Šteingolde un Anatolijs Ļvovs sniedza ieskatu arhīva darbā ar dokumentu saglabāšanu un digitalizēšanu, īpaši pievēršot uzmanību specifiska materiāla – mikrofilmu – skenēšanai, kā arī sliktas kvalitātes dokumentu digitālajai apstrādei un fotogrāfiju restaurācijai, kas prasa īpašu uzmanību un rūpību.

Pirmo Latvijas pārstāvju prezentāciju sesiju noslēdza LNB Lietišķo uzziņu nodaļas vadītāja Ginta Zalcmane, informējot par LNB elektronisko projektu “Zudusī Latvija”, kurā apkopoti vizuālie materiāli, kas atspoguļo dažādus Latvijas kultūrvēsturiskos un dabas objektus sākot no 19. gadsimta beigām. Šo tiešsaistes resursu lielā mērā palīdzējuši veidot arī paši Latvijas iedzīvotāji, kuri gan iesūtījuši savas fotogrāfijas, gan dažkārt palīdzējuši ar informācijas precizēšanu un papildināšanu jau iekļauto attēlu aprakstiem.

Pēc kafijas pauzes vārds tika dots ciemiņiem. Vispirms uzstājās Ukrainas Nacionālās vēsturiskās bibliotēkas ģenerāldirektore Alla Skorohvatova, kura deva ieskatu savas bibliotēkas vēsturē, kā arī pastāstīja par tās fondiem, kuros ir ievērojams daudzums reto izdevumu, tāpēc pirmie digitalizācijas projekti saistīti tieši ar senāko materiālu digitalizāciju un publiskošanu bibliotēkas interneta vietnē. Papildus tiem tikusi praktizēta arī bibliotēkas kataloga kartīšu skenēšana.

Savukārt Krievijas Valsts publiskās vēsturiskās bibliotēkas direktora vietniece Oksana Dinejeva pievērsās elektronisko resursu popularizēšanai bibliotēkas lietotājiem. Lai uzlabotu lietotāju prasmes, svarīgi ir gādāt par to, lai arī paši bibliotēkas darbinieki būtu zinoši, un tādēļ šī bibliotēka ir praktizējusi sava personāla atestāciju – veicot testus, lai noskaidrotu prasmju līmeni e-resursu izmantošanā, kā arī organizējot apmācības.

Baltkrieviju pārstāvēja Baltkrievijas Nacionālās Zinātņu akadēmijas Jakuba Kolasa Centrālās Zinātniskās bibliotēkas mārketinga pētijumu nodaļas vadītāja Inna Jurika. Viņa uzsvēra elektronisko resursu nozīmīgumu, uzskatot, ka virtuālo servisu esamība ir būtisks pamatnosacījums, lai piesaistītu lasītājus un atvieglotu tiem ceļu līdz informācijas iegūšanai. Viņas pārstāvētā bibliotēka gādā gan par daudzveidīgu brīvpieejas resursu pieejamību interneta vietnē, gan arī izstrādā elektronisko servisu, kas reģistrētiem lietotājiem ļautu pieslēgties sistēmai izmantojot internetbanku. Arī šajā prezentācijā tika akcentēta sociālo portālu nozīme bibliotēkas pakalpojumu popularizēšanā.

Pēc sātīgajām pusdienām semināra pirmās dienas programmu atsāka referente no Ukrainas – V. Karazina Harkovas Nacionālās universitātes Centrālās Zinātniskās bibliotēkas direktora vietniece Jeļena Babičeva. Viņa prezentēja savā universitātes elektronisko resursu repozitāriju, stāstot par tā veidošanu un izmantošanu. Tajā ir iekļauti dažādu veidu informācijas avoti, to skaitā arī mācību procesam paredzētie materiāli, studentu darbi un materiāli par universitātes vēsturi.

Jeļeņas Babičevas prezentāciju tematiski līdzīgā virzienā turpināja LU Informācijas tehnoloģiju departamenta pārstāvis Aivars Liepa, kurš iepazīstināja ar mums jau labi pazīstamo LU e-resursu repozitāriju (kas veidots uz DSpace sistēmas). Viņš demonstrēja tā uzbūvi, struktūru, un prezentācijas noslēgumā no ārzemju viesiem saņēma arī vairākus ieinteresētus jautājumus (par ko mums, protams, īpašs prieks). Kā arī drīzumā solīja LU e-repozitārija pāriešanu uz uzlabotāku DSpace versiju (arī par to prieks).

Ivana Franko Ļvovas Nacionālās universitātes Zinātniskās bibliotēkas direktora Vasīlija Kmeta sagatavotā prezentācija, lai arī digitalizācijas jautājumiem pievērsās netieši, bija saistoša ar tajā piedāvāto gandrīz filozofisko skatījumu uz attiecīgās bibliotēkas vēsturi un tās dažādajiem posmiem. Katrā no šiem posmiem (no bibliotēkas pirmsākumiem līdz mūsdienām) Vasīlijs Kmets saskatīja atšķirīgas bibliotēkas identitātes, kas veidojušās konkrētu vēsturisko periodu un informācijas izmantošanas paradumu ietekmē un kontekstā. Viņa kolēģis (šīs pašas bibliotēkas direktora vietnieks informācijas tehnoloģiju jautājumos) Igors Ogura vairāk pievērsās tieši mūsdienu situācijai (t.s. elektroniskajam posmam bibliotēkā), pozicionējot sevis pārstāvēto bibliotēku kā tautas mantojuma saglabāšanas institūtu un mūsdienīgu informācijas centru, kurā studenti tiek mudināti izmantot elektroniskos resursus (piemēram, bibliotēkā abonēto žurnālu drukāto versiju vietā lasīt to elektroniskās versijas).

Vienīgā viešņa, kas ieradusies no brālīgās kaimiņvalsts Lietuvas, bija Giedre Miknene, un viņa ikdienā ir Vrubļevsku Lietuvas Zinātņu akadēmijas bibliotēkas Informācijas tehnoloģiju nodaļas vadītāja. Uzzinājām, ka šai bibliotēkai jau ir samērā ilgstoša pieredze dažādu digitalizācijas projektu veidošanā. Bibliotēka galvenokārt fokusējusies uz senu un retu izdevumu digitalizāciju, un viens no pirmajiem projektiem bija pergamentu digitalizācija. To turpināja senu manuskriptu, nošu materiālu u.c. unikālu dokumentu digitalizācija. Daļa no materiāliem tiek piedāvāti apskatei virtuālajās izstādēs vai digitālās kolekcijās. Šī bibliotēka ir arī viena no projekta e-paveldas dalībniecēm. Šis projekts, kurā iesaistītas bibliotēkas, arhīvi un muzeji, apkopo un tiešsaistē sniedz pieeju dažādu Lietuvas kultūras mantojumam piederīgu materiālu elektroniskajām versijām.

Pirmās dienas noslēdzošo prezentāciju bloku iesāka V. Karazina Harkovas Nacionālās universitātes Zinātniskās bibliotēkas direktore Irīna Žuravļova, kura dalījās pieredzē par elektronisko resursu komplektēšanu bibliotēkā, e-kolekciju veidošanas principiem un elektronisko resursu piedāvāšanu bibliotēkas lietotājiem. Turklāt arī šī bibliotēka izmanto uz DSpace platformas veidotu elektronisko resursu repozitāriju.

Pēc vairākām prezentācijām, kurās stāstīts par galvenokārt senu informācijas resursu digitalizēšanu un saglabāšanu, mazliet atšķirīga šķiet Krievijas Valsts publiskās vēsturiskās bibliotēkas Netradicionālo izdevumu nodaļas vadītājas Jeļenas Strukovas prezentācija. Tajā tika aplūkots jautājums par digitālās ēras vēsturisko mantojumu – vai nepieciešams saglabāt nākotnei tos digitālos objektus, kuri ir radīti publicēšanai internetā, iegūst īslaicīgu popularitāti, bet pēcāk pazūd. Lai arī lielākajai daļai no tiem tiešām nav nekādas vērtības, tomēr daži ir zīmīgi ar to, ka nereti raksturo kādu attiecīgajā mirklī sabiedrībā populāru notikumu vai fenomenu (piemēram, interneta lietotāju veidotās fotokolāžas vai citi radošie darbi par aktuālām tēmām), tāpēc, iespējams, nākamajām paaudzēm varētu būt saistoši. Jeļena Strukova atklāj, ka iespēju robežās viņas pārstāvētā bibliotēka dažkārt šādus materiālus mēdz saglabāt.

Marina Filipova, kura ir iepriekšminētās bibliotēkas Pasniedzēju apkalpošanas nodaļas vadītāja, savā stāstījumā pievērsās virtuālo izstāžu veidošanai, izceļot to priekšrocības un trūkumus, skatot salīdzinājumā ar tradicionālajām izstādēm, kā arī izdala virtuālo izstāžu tipus pēc to uzbūves sarežģītības. Atskatoties uz virtuālo izstāžu veidošanu Krievijas Valsts publiskajā vēsturiskajā bibliotēkā, viņa atklāja, kā pakāpeniski mainījušies priekšstati par to, kas ir īsta, kvalitatīva virtuālā izstāde, jo sākotnēji tās nebija strukturētas dažādos līmeņos un nereti saturēja tikai vienkārši ievietotus attēlus ar parakstiem (lai gan te lielā mērā vainojama arī toreizējā tehnoloģisko iespēju ierobežotība, nevis tikai virtuālo izstāžu veidotāju ierobežotās prasmes).

* * *

Trešdienas (29. maija) programmu atkal ievadīja Latvijas pārstāvju prezentācijas. Kā pirmais uzstājās LNB Stratēģiskās attīstības nodaļas vadītājs Uldis Zariņš, kurš digitalizāciju skatīja valstiskā līmenī, pievēršoties nacionālajai stratēģijai digitalizācijas jomā un iezīmējot nākotnes vīziju, kurā svarīgi būtu veikt gan digitalizēto resursu agregāciju, gan pieturēties pie vienotiem digitalizācijas principiem un standartiem un, kas ir īpaši būtiski, nodrošināt ne tikai šo resursu saglabāšanu, bet arī pieejamību pēc iespējas plašākam cilvēku lokam. Lai nacionālā līmenī šie procesi attīstītos sekmīgi, irnepieciešama ciešāka sadarbība un partnerība starp institūcijām, kas veic digitalizāciju.

Semināru turpināja LU Akadēmiskās bibliotēkas dokumentālists Valdis Mazulis, sniedza ieskatu digitalizācijas etapos Latvijā un vēstīja arī par pieredzi saistībā ar periodikas masu digitalizāciju, aplūkojot tās gaitu un norādot, kādiem jautājumiem šajā procesā jāpievērš uzmanība (piemēram, ciešs laikrakstu mapju iesējums, labākā eksemplāra izvēle, restaurācija).

LNB Digitalizācijas nodaļas vadītāja Marika Karlsone atskatījās uz tām praktiskajām izmaiņām, kas piedzīvotas LNB digitalizācijas gaitā kopš tās pirmsākumiem – kā gadu gaitā mainījusies pati skenēšana, kā notikušas pārejas uz citiem attēlu failu formātiem un kā meklēti labākie nosaukumu veidošanas principi ieskenēto materiālu arhīvdatnēm un lietojumdatnēm.

Par situāciju ar periodikas digitalizāciju Ukrainā savā prezentācijā stāstīja Kijevā esošā informācijas tehnoloģiju uzņēmuma “Arhīvu informācijas tehnoloģijas” direktors Kirils Vislobokovs. Viņa vadītajai kompānijai ir pieredze sadarbībā ar vairākām Ukrainas bibliotēkām – ir bijuši (un turpinās) dažādi digitalizācijas projekti, kuru rezultātā tapušas arī vairākas digitālās kolekcijas. Viņš pievērsa uzmanību gan gluži praktiskām lietām, gan arī nedaudz ieskicēja kopējo digitalizācijas ainavu Ukrainā, norādot  uz vienotas valstiskas koncepcijas trūkumu šajā jomā.

Digitalizācijas ārpakalpojumu piedāvā arī Latvijas kompānija LETA, ko gan vairāk, protams, pazīstam kā ziņu aģentūru. Bet, kā izrādās, tai pat ir sava digitalizācijas nodaļa, kas labprāt piedāvā savus pakalpojumus satura digitalizācijā uzņēmumiem un bibliotēkām. Par to pastāstīja šīs nodaļas projektu vadītājs Mārtiņš Presis, uzskatāmi un secīgi prezentējot visus piedāvāto pakalpojumu procesa posmus, kas ietver gan rūpīgu digitalizējamo materiālu uzskaiti un aprakstīšanu, gan arī teksta laukumu segmentēšanu (periodiskajiem izdevumiem) un teksta atpazīšanas (OCR) veikšanu.

Vēl dziļāk skenēšanas praktiskajos jautājumos mūs ieveda LNB Digitalizācijas nodaļas galvenā bibliotekāre Lāsma Timma. Viņa, it kā savā ziņā turpinot un papildinot savas kolēģes Marikas Karlsones stāstīto, pavēstīja par skenēšanas aparatūru, kāda LNB digitalizācijas darbā tikusi izmantota agrāk un tiek izmantota šobrīd, kā arī nedaudz pievērsās jautājumam par attēlu failu formātiem, izmēriem un izšķirtspēju.

Šī bija trešdienas pēdējā prezentācija, pēc kuras semināra dalībnieki iestiprinājās ar pusdienām, lai uzņemtu spēkus dienas otrajai pusei, kas tika atvēlēta kaut kam pavisam citam – Minhauzena muzeja apmeklējumam.

* * *

30. maijs, semināra noslēdzošā diena, sākās ar Baltkrievijas Nacionālās Zinātņu akadēmijas Jakuba Kolasa Centrālās Zinātniskās bibliotēkas Zinātnisko pētījumu programmas un tehniskā nodrošinājuma nodaļas vadītājas (ak, šie garie nosaukumi…) Žannas Molčanas prezentāciju par e-bibliotēkas ieviešanu viņas pārstāvētajā institūcijā. Tika parādīta e-bibliotēkas struktūra, raksturots tās saturs un pastāstīts par tās izmantošanas iespējām. Prezentācijas noslēgumā tika demonstrēta arī videoprezentācija, kas gan vairāk bija veltīta pašai bibliotēkai un tās piedāvātajiem pakalpojumiem kopumā.

Arī nākamais referents – Krievijas Valsts publiskās vēsturiskās bibliotēkas Krājuma saglabāšanas nodaļas vadītājs Aleksandrs Vjars – mūs informēja par e-bibliotēkas sistēmu savā bibliotēkā. Tā satur vairākas kolekcijas, un tur atrodami gan periodiskie izdevumi, gan retie izdevumi, gan uzziņu literatūra. Papildus tam viņš stāstīja arī par to, kā bibliotēkā tiek veikta elektronisko resursu komplektēšana.

LNB informācijas tehnoloģiju speciālists Ivars Indāns dalījās savās zināšanās par Web 2.0 tehnoloģiju izmantošanu bibliotēku darbā, demonstrējot un rekomendējot arī vairākus interesantus un noderīgus interaktīvos tiešsaistes resursus. Viņš arī ieteica (un to iepriekš jau pieminēja arī citi semināra dalībnieki) bibliotēkām būt aktīvām interneta sociālajos tīklos, veidot tajos profesionālās grupas un veicināt komunikāciju gan bibliotēku profesionāļu starpā, gan ar bibliotēkas lietotājiem.

Par to, kā notiek Krievijas Valsts publiskās vēsturiskās bibliotēkas pāreja uz jauno tehnoloģisko platformu, uzzinājām no šīs bibliotēkas Elektronisko un digitālo resursu nodaļas galvenās bibliotekāres Jeļenas Severjakovas. Raksturojot masu digitalizācijas praktisko pusi, viņa pastāstīja par šajā bibliotēkā izmantotajiem skeneru modeļiem (vien no tiem ir arī skeneris “Bookeye”, ko lietojam arī mēs, LU Bibliotēkas digitalizācijas grupa) un dažādiem skenēšanas režīmiem, kuri tiek izvēlēti atkarībā no skenējamā objekta tipa.

Arī V. Koroļenko Harkovas Valsts zinātniskās bibliotēkas direktora vietnieces Ludmila Glazunova dalījās pieredzē par digitalizāciju savā bibliotēkā – par tās aizsākumiem un esošo darba organizāciju. Šobrīd visaktīvāk notiek retumu digitalizēšana, un daļai materiālu pilno tekstu tiek nodrošināta arī piekļuve tiešsaistē. Interesanti, ka šajā bibliotēkā ir tikusi praktizēta ne tikai materiālu skenēšana, bet arī fotografēšana.

Mazliet nostāk no digitalizācijas mūs aizveda Krievijas Valsts publiskās vēsturiskās bibliotēkas uzziņu un bibliogrāfiskās nodaļas vadītājs Kirils Šapošņikovs, pastāstot par to, kā tika nodrošināta bibliotēkas 150. jubilejai veltītā publicinātes kampaņa sociālajos tīklos. Tās rezultāti esot bijuši pārsteidzoši labi, un no interneta lietotājiem tika saņemta pozitīva atgriezeniskā saite.

Un tad jau bija arī pienācis laiks ne tikai ceturtdienas, bet arī visa semināra prezentāciju noslēgumam, kurā kā pēdējais dalībnieks uzstājās LU Akadēmiskās bibliotēkas Ukrainas literatūras nodaļas vadītājs, kurš bija sagatavojis informāciju par Latvijas – Ukrainas trimdas organizāciju veidotajiem elektroniskajiem resursiem.

Pēc tam visi klātesošie, kas bija godam izturējuši diezgan intensīvo, taču nenoliedzami informatīvi bagātīgo semināra programmu, tika aicināti uz semināra kopsavilkumu pie apaļā galda – lai pārspriestu uzzināto, uzdotu jautājumus, saņemtu atbildes un pēc tam šķirtos, lai pēc laika, iespējams, no jauna atkal tiktos jau sestajā digitalizācijas skolā.

Kā digitalizācijas grupa LU Bibliotēkas nedēļā piedalījās

“Atklāj vēl nezināmo!” – ar šādu rosinošu saukli šogad tika aizvadīta LU Bibliotēkas nedēļa, kas notika jau trešo reizi. Tās laikā (no 22. līdz 28. aprīlim) ikviens ieinteresētais varēja ielūkoties bibliotekāru darba aizkulisēs, iepazīties ar viņu jaunākajiem veikumiem, kā arī piedalīties konkursos.

LU Bibliotēkas digitalizācijas grupa Bibliotēkas nedēļā iesaistījās otro reizi, un šogad mēs tās ietvaros organizējām gan loteriju, gan aicinajām ciemos LU pasniedzējus, pētniekus un studentus.

Skaidri apzinoties, ka ieskatīties studenta galvā mums neizdosies, izlēmām ielūkoties vismaz studenta somā, tāpēc neilgi pēc Lieldienām izsludinātajā loterijā “Student, kas Tavā somā?” aicinājām piedalīties un radoši izpausties tos studentus, kas būtu gatavi savu somu saturu nofotografēt vai ieskenēt un šo fotogrāfiju nosūtīt uz mūsu e-pastu. Lai pārliecinātos, ka students ir apzinīga un motivēta būtne, lūdzām šim foto pievienot klāt arī savu moto – paša izdomātu, kādas ievērojamas personas izteiktu vai no tautas gudrības lādes paņemtu. Tādu, kas kalpo kā vadmotīvs studiju procesam vai raksturo studenta attieksmi pret dzīvi vispār. Loterijas norises laikā uz digitalizācijas grupas e-pasta kastīti atceļoja dažādu LU fakultāšu studentu uzņemtās fotogrāfijas, un starp tām bija vairāki patiešām asprātīgi un kompozicionāli interesanti darbi. Atbilstoši loterijas nolikumam uzvarētājs tika noskaidrots izlozē, un lapiņu ar balvas (LU Bibliotēkas sagatavotajiem suvenīriem) ieguvējas Kristīnes Grīnbergas vārdu 25. aprīlī notiekošajā pasākumā LU Bibliotēkas Daudznozaru bibliotēkā izvilka LU zinātņu prorektora Indriķa Muižnieka roka. Savukārt LU Bibliotēkas simpātiju balvu nominācijā “Efektīvākais studenta moto” saņēma Ēriks Lapiņš, kurš bija izvēlējies angliskotu Alberta Einšteina prātulu – “Creativity is intelligence having fun”.

Pērn pirmoreiz LU Bibliotēkas nedēļas laikā norisinājās pasākums “Bibliotekāram pa pēdām”, un tas itin veiksmīgi tika īstenots arī šogad. Tā mērķis ir iepazīstināt LU studentus ar bibliotekārā darba aizkulisēm, aicinot viņus apmeklēt dažādas LU Bibliotēkas nodaļas un nozaru bibliotēkas. Bijām gandarīti, ka tika izrādīta vēlme iepazīties arī ar digitalizācijas grupas darbu – pie mums viesojās pieci Sociālo zinātņu fakultātes bakalaura programmas “Informācijas pārvaldība” pirmā kursa studenti, kā arī digitalizācijas jautājumos īpaši ieinteresēts students no Juridiskās fakultātes. Savukārt LU pasniedzējiem un pētniekiem digitalizācijas grupas apmeklējums tika piedāvāts pasākuma “Digitalizē pētījumu 10 minūtēs!” ietvaros, un šim mūsu aicinājumam atsaucās divi asociētie profesori no Humanitāro zinātņu fakultātes un Datorikas fakultātes, divas pārstāves no LU Ģeodēzijas un ģeoinformātikas institūta, kā arī arhivārs no Latvijas Valsts vēstures arhīva (par ko bijām patīkami pārsteigti, jo šis arhīvs nav LU struktūrvienība). Visiem, kas bija mērojuši ceļu līdz digitalizācijas grupas mājvietai Lielvārdes ielas 24. nama otrajā stāvā, sniedzām izklāstu par mūsu darba virzieniem un pienākumiem, praktiski demonstrējām digitalizācijas procesa posmus, ļāvām studentiem “iemēģināt roku” darbā ar mūsu lielo skeneri, kā arī atbildējām uz profesoru uzdotajiem jautājumiem.

Savukārt nedēļas noslēgumā koleģiāli uzņēmām ciemiņus no Rīgas Tehniskās Universitātes Bibliotēkas – bibliotēkas direktores vietnieku automatizācijas darbā Juri Pavlovski un sistēmbibliotekāri Lāsmu Zariņu. Arī viņi izrādīja profesionālu interesi par digitalizācijas gaitu LU Bibliotēkā un, cerams, uzzināja ko noderīgu.

Lai gan LU Bibliotēkas nedēļas laikā mēs, bibliotēkas darbinieki, sevi lielākoties parādījām no profesionālās puses, bija arī iespējams nedaudz ielūkoties mūsu ārpusdarba pasaulē. Iespaidojoties no samērā nesen aizsāktā rīdzinieku veidotā projekta “Liktens lietu muzejs”, LU Bibliotēkas direktorei Ivetai Gudakovskai radās ideja apkopot un prezentēt arī bibliotēkas darbinieku liktenīgās vai vienkārši tuvās lietas un nodarbes. Rezultātā tapa virtuālā izstāde “Mūsu liktens lietas”, kas LU Bibliotēkas nedēļas sākumā tika svinīgi atklāta renovētajā bibliotēkas ēkā Kalpaka bulvārī 4. Tajā iekļautas arī lappuses ar digitalizācijas grupas darbinieku stāstiem – Gita sevi parāda kā īstenu latviešu tautumeitu, kas dzīvei cauri gājusi dejas soļiem, savukārt Zintis atklāj, kā ieguvis savu vārdu (izrādās, tam ir bijusi saistība ar bobsleju).

Galerijā redzami redzami daži no loterijai “Student, kas Tavā somā?” iesūtītajiem attēliem

 

Komiksi, marksisti, reklāmas… Par dažām saistošām digitālajām kolekcijām

Protams, ir patīkami, ja pēc ilgiem un izmisīgiem klejojumiem globālajā tīmeklī izdodas atrast meklēto, taču bieži vien prakstiski noderīgiem vai vienkārši interesantiem resursiem izdodas “uzdurties” nejauši. Tāpēc šoreiz gribu iepazīstināt ar dažām šādām nejauši uzietām digitālajām kolekcijām, kas ar kaut ko piesaistīja manu uzmanību.

The Digital Comic Museum
http://www.digitalcomicmuseum.com
Lai arī Latvijas iedzīvotāji komiksus tā pa īstam iepazina tikai 90. gadu sākumā, kad jaunākās paaudzes tika iepriecinātas ar latviski adaptētiem Disneja varoņu piedzīvojumiem, Amerikā šai populārās kultūras formai ir visai senas tradīcijas. Turklāt eksistē apzīmējums “komiksu grāmatu zelta laikmets”, kas attiecināms uz laika periodu no 20. gs. 30. gadu beigām līdz 50. gadu sākumam. The Digital Comic Museum (Digitālo komiksu muzejs) apkopo un piedāvā iepazīties ar galvenokārt šajā laika posmā radītajiem dažādu izdevniecību komiksiem. Tos brīvi iespējams skatīt tiešsaistē, taču, lai veiktu lejupielādi, nepieciešams reģistrēties. Kolekcijā iekļauti tie izdevumi, kuri klasificējami kā sabiedriskais īpašums (public domain), tādējādi to publiskošanu neierobežo autortiesību saistības.
Ir iespējams visu kolekciju pārlūkot pēc komiksu izdevniecībām (to ietvaros – arī pēc izdotajām sērijām), kā arī uzzināt, kuri komiksi ir tikuši lejupielādēti visbiežāk un kuri ieguvuši visaugstāko lietotāju novērtējuma reitingu.
Redzams, ka šī resursa veidotāji ir atvērti sadarbībai ar lietotājiem – ir izteikts aicinājums iesniegt šeit vēl nepublicētus komiksus, veikt naudas ziedojumus kolekcijas uzturēšanas vajadzībām, kā arī kļūt par kolekcijas moderatoriem. Kā apliecinājums lietotāju atsaucībai ir vietnē esošais forums, kurā komiksu fani diskutē par tehniskajiem jautājumiem, kas saistīti ar reģistrāciju, materiālu lejupielādi un augšupielādi, norāda uz kļūdām (nepareizi ierakstītiem komiksu nosaukumiem, nestrādājošām saitēm, trūkstošām lappusēm u.tml.), kā arī cenšas rast atbildi uz pasaulē grūtāko jautājumu – kurš komiksu varonis galu galā ir visnepārspējamākais?

Marxists Internet Archive
www.marxists.org
Tiem “laimīgajiem”, kuri lielu daļu sava mūža nodzīvoja kādā no Padomju Savienības brālīgajām republikām, Marksa un Engelsa pieminēšana šodien visdrīzāk izsauc riebumu; tiem, kas to nepiedzīvoja – iespējams, smīnu vai pat ziņkāri. Neskatoties uz to, ka vienkāršam padomju cilvēkam reti kad par marksismu bija pastiprināta zinātniska interese, Marksa un Engelsa sociālistiskā mācība tomēr ieguva arī atsevišķus kaismīgus piekritējus un sekotājus. Laika gaitā marksisma teorijas turpinātāji “saražoja” ievērojamu daudzumu attiecīgās literatūras, un tagad liela daļa no viņu pienesuma ir skatāma  un lasāma interneta vietnē Marxsists Internet Archive (Marksistu interneta arhīvs). Šeit var gūt vispārīgu priekšstatu par marksisma vēsturi, uzzināt par ievērojamākajiem marksistiem (turklāt tie grupēti pēc to piederības kādam no daudzajiem marksisma apakšvirzieniem vai kustībām), iepazīt viņu biogrāfijas, kā arī tiešsaistē lasīt viņu sarakstītās publikācijas (dažiem autoriem pieejamas arī lejupielādējamas e-grāmatas). Ir iekļauta arī marksisma enciklopēdija, kas būs noderīga gadījumā, ja nepieciešams kāds termina skaidrojums, un, ja ar to vēl nav pietiekami, tad papildus gandarījumu var sniegt vairāki publicētie audioieraksti, kuros fiksētas arī Ļeņina un Če Gevaras balsis.
Materiālu apkopošana plānotajam interneta arhīvam aizsākusies jau 90. gadu sākumā, un, ja var ticēt norādītajiem datiem, tad mēneša laikā to apmeklē aptuveni miljons lietotāju. Arhīvā, kura uzturēšanā iesaistīts ievērojams skaits brīvprātīgo darbinieku, šobrīd ir pieejami gandrīz 600 autoru darbi 45 valodās, un nav iemesla apšaubīt, ka šis ir vispilnīgākais tiešsaistē pieejamais marksismam veltītais digitālais resurss.

The Advertising Archives
http://www.advertisingarchives.co.uk
Lai arī dažādu drukāto reklāmas materiālu klātbūtne mūsu iekdienā ir tik pierasta, ka mēs pat esam iemācījušies tos nepamanīt, tomēr jāatzīst, ka vizuālā reklāma un tās tendences ļoti daudz ko pasaka par mūsu patērētājsabiedrības iezīmēm un paradumiem. Tāpēc jo īpaši interesanti uzzināt, kā izskatījās tā reklāma, kas cilvēkus no plakātiem un žurnāliem uzrunāja pirms divdesmit, piecdesmit un simts gadiem.
Apjomīgā kolekcija The Advertising Archives šādu iespēju sniedz – tajā iekļauti reklāmas materiāli, kas radīti laikā no 19. gadsimta beigām līdz pat mūsdienām (galvenokārt no Lielbritānijas un ASV). Tie pamatā kārtoti grupās pēc to hronoloģiskās piederības, taču ir izdalītas arī atsevišķas tematiskās apakškolekcijas. Turklāt līdzās komerciāla rakstura reklāmām šeit atrodami arī, piemēram, politiskie plakāti, žurnālu vāku attēli u.c. vizuāli informatīvi materiāli.
Ikvienam nereģistrētam lietotājam ļauts brīvi pārlūkot kolekciju un skatīt objektu sīktēlus; reģistrētie lietotāji papildus tam var attēlus aplūkot arī lielākā izmērā, saglabāt meklējumu vēsturi, kā arī saņemt citas priekšrocības.
Par The Advertising Archives dzimšanu galvenokārt atbildīgi divi cilvēki – Lerijs un Sjūzena Vaineri, kuri kolekcijas veidošanu iesāka jau 1990. gadā – sākotnēji, protams, vēl bez konkrētām iecerēm par digitalizāciju un publiskas pieejamības nodrošināšanu. Tomēr šāda iespēja vēlāk radās, un šobrīd tiešsaistē jau pieejami vairāk kā 100 tūkstoši attēlu, taču, kā norāda kolekcijas veidotāji, viņu rīcībā ir liels skaits resursu, kas pagaidām vēl nav tikuši publiskoti (kopā – apmēram viens miljons kataloģizētu attēlu).
Šīs kolekcijas ietvaros ceļojot cauri reklāmas vēstures desmitgadēm, nākas atzīt, ka, lai arī šie materiāli lielākoties radīti ar konkrētiem nolūkiem (pārdod preci, aicināt izmantot noteiktus pakalpojumus, popularizēt kādu ideju u.tml.), daudzi no tiem iepriecina ar savām mākslinieciskajām kvalitātēm un pārliecinošiem radošajiem risinājumiem. Turklāt tajos ir lieliski jūtams konkrētā laikmeta gars.

Nākotne piezogas negaidīti. Digitālās novecošanās neizbēgamība

Image

Sabiedrības informatīvais mantojums daudzu gadsimtu laikā ir ticis fiksēts uz dažādiem materiāliem (informācijas nesējiem) – šādiem nolūkiem izmantoja akmeni, māla plāksnītes, zīdu, pergamentu un, protams, papīru. Tieši papīrs ir tas materiāls, kas tika atzīts par visoptimālāko informācijas nesēju pirms-digitālajā laikmetā. Grāmatas, avīzes, vēstules, plakāti, fotogrāfijas, dokumenti utt. – milzīgi informācijas apjomi, kas izplatīti izmantojot papīru. Papīrs ilgstoši bija pārliecinošs līderis informācijas nesēju vidū, un neviens pat nespēja iedomāties, ka tā stabilās pozīcijas kādreiz varētu tikt apdraudētas.

Runājot par papīra materiālu uzglabāšanu, aktuāls ir bijis jautājums par pieaugošu fiziskās telpas nepieciešamību; mazāk raižu bija par to, vai un kā šī informācija būs pieejama lietotājam nākotnē. Pieredze rādīja, ka papīrs, ja vien tam ir piemēroti klimatiskie glabāšanas apstākļi, ir uzskatāms par pietiekami stabilu informācijas nesēju. Nebija iemesla apšaubīt, ka atvilktnē rūpīgi noglabāta vēstule vai plauktā ievietota grāmata pēc piecdesmit vai simts gadiem varētu nebūt apskatāma un izlasāma. Iestājoties digitālajai ērai, kas, protams, radīja milzīgu elektroniski lasāmu dokumentu gūzmu, informācijas resursu fiziskās uzglabāšanas vietas trūkums daļēji atrisinājās – daudziem no šiem digitāli radītajiem dokumentiem nemaz nebija nepieciešami fiziskie analogi. Mazākas fiziskās telpas aizņemšanas un lietošanas ērtuma dēļ elektronisko resursu izmantošana un uzglabāšana izskatījās progresīva un daudzsološa. Nevar noliegt, ka tas tiešām bija tehnoloģisks sasniegums, kas veicināja gan informācijas izplatību un pieejamību, gan būtiski mainīja arī sabiedrības informācijas meklēšanas un lietošanas paradumus.

Pasaulē ir visai ierasti, ka vispārēja pirmā jūsma par kāda jaunieveduma kvalitātēm sākotnēji liedz saskatīt tās problēmas, kas varētu būt aktuālas tālākā nākotnē. Daļēji tas tā ir noticis arī ar digitālo resursu ilgtermiņa uzglabāšanu –  reti kurš uzreiz aizdomājās par to pieejamības un izmantojamības potenciālajām problēmām nākotnē. Šo problēmu cēlonis ir tajā, ka, pretēji uz papīra fiksētas informācijas resursiem, digitālā formātā izplatītās informācijas izguvei ir nepieciešami dažādi tehnoloģiski palīglīdzekļi. Iespiesto dokumentu lasīšanai ir nepieciešamas tikai acis vai vajadzības gadījumā arī brilles, taču tos bez īpašām grūtībām var lasīt tagad, varēja lasīt pirms 25 gadiem un varēs lasīt arī pēc 25 gadiem. Taču cik daudzos no šobrīd pasaulē ražotajiem datoriem ir iespējams atvērt un izlasīt, piemēram, 1991. gadā ar jau sen neeksistējošu teksta programmu veidota dokumenta failu? Šo situāciju labi ilustrē arī piemērs ar disketēm – 2003. gadā datoru ražotājs Dell Computer paziņoja, ka galda datoru modeļu standarta aprīkojumā vairs neiekļaus diskešu lasītāju (tiesa, pirmais ražotājs, kas no tā atteicās, bija Apple ar 1998. gadā izlaisto datoru iMac). Un tiešām – nemaz nepagāja tik ilgs laiks, kad datoru lietotāji sāka izmantot drošākās un daudz ietilpīgākās USB zibatmiņas, un disketes kā datu nesējs savas pozīcijas zaudēja.  Droši vien daudziem no mums vēl joprojām dziļā plauktā aizmirstībā guļ kāda vairākus gadus neizmantota diskete ar MS Word dokumentiem.

Tehnoloģijas attīstās tik strauji, ka ir grūti precīzi pateikt, cik gadus mēs vēl lietosim tās datorprogrammas, kas šobrīd atrodamas mūsu datoros. Dažādi vispārpieņemtie un izplatītie tehnoloģiskie standarti (piemēram, failu formāti) ir standarti tikai uz noteiktu laiku. To vietā nāk citi, uzlabotāki, un iepriekšējie tiek pasludināti par novecojušiem. Šo problēmu angļu valodā apzīmē ar terminu digital obsolescence, ko varētu latviskot kā digitālo novecošanos, un šī jautājuma risināšanai pasaulē pat ir izveidotas darba grupas, kas izstrādā stratēģijas digitālo objektu mūzšaglabāšanai. Tiek norādīts, ka tā nav tikai pasīva datu uzglabāšana – tā ir arī plānošana, resursu apzināšana un izmantošana, pareizo tehnoloģisko risinājumu un saglabāšanas metožu izvēle. Šo veikto aktivitāšu kopumam vajadzētu nodrošināt digitālās informācijas ilglaicīgumu un pieejamību neatkarīgi no tā, kā laika gaitā ir nomainījušies datu nesēji un citas tehnoloģiskās ierīces vai programmatūras, kas nepieciešamas informācijas izguvei. Ja neliela digitālo objektu daudzuma uzturēšana īstermiņā milzīgas pūles neprasa, tad milzīga datu apjoma ilglaicīgai saglabāšanai ir būtisks arī finansiālais ieguldījums. Institūcijām, kuru pārvaldībā ir šādi lieli digitālo objektu krājumi, tiek ieteikts izvērtēt riskus, kas varētu rasties digitālā satura zaudēšanā tehnoloģiju novecošanas rezultātā, lietot pazīstamas un plaši izmantotas datorprogrammas, kas atbalsta vispārpieņemtos failu tipu formātus (lai gan, kā jau iepriekš minēts, arī vispārizplatītie pasaules standarti laika gaitā var mainīties) un rūpēties, lai digitālajam saturam būtu nodrošinātas regulāras piekļuves iespējas. Sekojot līdzi tehnoloģiju attīstībai, jāsaprot, vai un kad ir nepieciešams veikt failu konvertēšanu uz aktuālāku, populārāku formātu, kā arī jāizlemj, vai ir vajadzība veikt fundamentālākas izmaiņas, piemēram, datoru programmatūras vai operētājsistēmas nomaiņu. Protams, nedrīkst aizmirst arī par tehnikas fizisko nolietošanos – jāņem vērā, ka, piemēram, ārējais cietais disks datu glabāšanai nekalpos mūžīgi, un būs nepieciešams veikt datu migrāciju uz jaunāku datu nesēju.  

Lai arī digitālās novecošanās procesa norise ir šķietami lēna un ikdienā praktiski nejūtama, pēc noteikta laika tomēr ar pārsteigumu var nākties secināt, ka tas, kas agrāk bijis pieejams, nu vairs tāds nav. Ir skumji iztēloties tādu 2065. gada ainu, kad mūsdienu jaunietis, kurš tad jau kļuvis par vectēvu, ar nožēlu konstatē, ka nespēj parādīt mazbērniem savas jaunības dienu digitālās fotogrāfijas, kas 2010. gadā ierakstītas CD matricā – jo kompaktdisks kā datu nesējs vairs netiek izmantots, un modernajiem datoriem kompaktdisku nolasīšanas ierīču vairs nav. Bet vēl skumjāk ir iedomāties, ka digitālās novecošanās un nepareizi plānotas saglabāšanas politikas dēļ nākotnē varētu tiktu apgrūtināta piekļuve iepriekšējo paaudžu atstātajam digitālajam mantojumam – bibliotēku digitālajām kolekcijām, arhīvu materiāliem un citiem elektroniskajiem resursiem. Lai šādas pesimistiskas prognozes nepiepildītos, atliek cerēt, ka būsim prātīgi un domāsim tālredzīgi, lai nesagādātu grūtības mūsu pēctečiem. 

 

Izmantotie avoti:

1. Digital preservation [tiešsaiste].
Pieejams: http://en.wikipedia.org/wiki/Digital_preservation
2. Digital obsolescence [tiešsaiste].
Pieejams: http://en.wikipedia.org/wiki/Digital_obsolescence
3. Vai disketes dienas ir skaitītas? [tiešsaiste].
Pieejams: http://www.delfi.lv/tehnika/dazadi/vai-disketes-dienas-ir-skaititas.d?id=4761653
4. Managing Digital Obsolescence Risks [tiešsaiste].
Pieejams: http://www.nationalarchives.gov.uk/documents/information-management/siro-guidance-on-the-risk-of-digital-obsolescence.pdf

Digitālā bibliotēka Europeana – Eiropas kultūras mantojuma apkopotāja

Laiks, kad bibliotēkas un citas atmiņas institūcijas savus krājumus digitalizēja tāpēc, lai saglabātu  tikai savām vajadzībām, nu jau ir pagājis. Tendece digitalizētos materiālus piedāvāt aplūkošanai pēc iespējas plašākai auditorijai visā pasaulē ir pieņēmusies spēkā, un jaunas digitālās kolekcijas tiek radītas un papildinātas ar pieaugošu intensitāti. Šīs kolekcijas – lielākas un mazākas – ir izkaisītas pa visu globālo tīmekli, un tāpēc joprojām bieži vien pavisam necerēti izdodas uziet ko jaunu un vēl neredzētu. Šādā digitalizēto materiālu pārbagātībā būtu visai loģiski vēlēties, lai tiem varētu piekļūt no vienas platformas, nevis ik reizi maldīties interneta meklētāju piedāvātajos līkločos, cerot tur atrast nepieciešamo. Labs veids kā apkopot digitālās kolekcijas, ir veidot plašākus digitālo dokumentu resursus – digitālās bibliotēkas. Arī tās pēc saviem apjomiem mēdz būt dažādas, tomēr atsevišķas no tām sava nozīmīguma dēļ noteikti pelnījušas lielāku uzmanību.

Viena no lielākajām digitālajām bibliotēkām (vienlaicīgi – arī digitālais arhīvs un muzejs) ir Europeana. Šķietami ambiciozais nosaukums šajā gadījumā nemelo – tā no vienota portāla ļauj piekļūt vairāk kā 20 miljoniem digitālo objektu (gleznām, grāmatām, audioierakstiem, fotogrāfijām), ko piegādājušas vairāk kā 2000 dažādas institūcijas no visas Eiropas. To vidū ir gan plašāk pazīstami kolekciju glabātāji (piemēram, Amsterdamas Rijksmuzejs, Britu bibliotēka un Luvra), gan arī dažādu Eiropas Savienības dalībvalstu reģionālie arhīvi un lokālie muzeji. Europeana ir dibinājusi Eiropas komisija, un tās mērķis ir dot cilvēkiem iespēju iepazīt Eiropas kultūras mantojumu no aizvēstures līdz pat mūsdienām. Europeana ir Eiropas Komisijas un Eiropas Savienības dalībvalstu atbalstīts projekts – tas tapis sadarbībā ar valstu nacionālajām bibliotēkām un citām kultūras, vēstures un zinātnes institūcijām. Līdzfinansējot pētījumus un veicinot labāku sadarbību starp Eiropas Savienības dalībvalstīm, Eiropas Komosija centusies bagātīgo kultūras mantojumu padarīt pieejamu tiešsaistē. Europeana tika atklāta 2008. gada 20. novembrī, taču tās izveidi rosināja kāda jau 2005. gada aprīlī tapusi vēstule, ko toreizējais Francijas prezidents Žakš Širaks kopā ar Vācijas, Spānijas, Itālijas, Polijas un Ungārijas premjerministriem nosūtīja Eiropas Komisijas prezidentam Žozē Manuelam Borrozo. Šajā vēstulē tika izteikts ierosinājums izveidot ikvienam pieejamu virtuālu Eiropas mēroga bibliotēku.

Jau minētajā 2008. gada 20. novembrī, kad Europeana plaši atvēra savas virtuālās durvis ikvienam interneta lietotājam, cilvēku interese bija necerēti liela. Pārsniedzot apmeklētības prognozes, jau pirmajās darbības stundās tika veikti vairāk kā 10 miljoni klikšķu stundā. Serveri, nespējot izturēt šādu negaidītu slodzi, atsacījās pildīt savas funkcijas, un Europeana darbība uz laiku tika apturēta, lai pēc veiktajiem tehnoloģiskajiem uzlabojumiem atkal atsāktu darboties ar jaunu sparu. Interesanti, ka sistēmas uzkāršanos lielā mērā veicināja vairāku tūkstošu cilvēku vienlaicīgā vēlme aplūkot Leonardo da Vinči gleznas Mona Liza digitālo reprodukciju. Tiesa, pieņemot, ka tas, iespējams, ir vispopulārākais mākslas darbs pasaulē, šāds fakts tik pārsteidzošs nemaz nešķiet.

Uzreiz pēc atklāšanas Europeana piedāvājumā jau bija apmēram 4,5 miljonu digitālo objektu no vairāk kā 1000 dalīborganizācijām. Te gan jānorāda, ka, lai arī Europeana portāls nodrošina piekļuvi visiem šiem objektiem, fiziski tie netiek glabāti vienā centrālajā organizācijas serverī, bet gan to institūciju serveros, kas šos objektus piegādā. Europeana apkopo objektu metadatus un sīktēlus, taču pilnā apjomā objekti aplūkojami attiecīgo institūciju tīmekļa vietnēs. Turklāt, pamatojoties uz Creative Commons jeb Publiskā domēna licenci, ir iespēja brīvi izmantot šo objektu metadatus jebkādiem mērķiem – jaunradei, izglītībai un pat komercnolūkiem. Lai arī Europeana gādā par to, lai objektu metadati būtu veidoti pēc vienota standarta, tā nepieņem lēmumus par pašu digitalizāciju – tas, kādi objekti tiks digitalizēti, ir pašu atmiņas institūciju ziņā.

Pievēršoties praktiskajai Europeana tīmekļa vietnes izmantošanai un ievadot interneta pārlūkprogrammā adresi http://www.europeana.eu, mēs nonākam sākumlapā, kas, ņemot vērā šī resursa vērienīgumu, patīkami iepriecina ar ērtu pārskatāmību; tā nav pārblīvēta ar informāciju un lietotāju nebiedē ar neskaitāmām izvēlnēm. Lai informācijas meklēšana būtu vienkārši paveicama arī lietotājam, kurš ikdienā informācijas meklēšanai izmanto tikai resursu Google, sākumlapas augšpusē atrodams viens meklēšanas lodziņš, virs kura redzams uzraksts Explore Europe’s cultural collections. Lai arī pēc noklusējuma visas norādes un izvēlnes šajā vietnē ir angļu valodā, šo valodu neprotošajiem eiropiešiem nav iemesla saskumt, jo sadaļa Izvēlēties valodu piedāvā pārslēgties uz kādu no citām Eiropas Savienības valstu valodām, tajā skaitā arī uz latviešu valodu.

Lai arī viens meklēšanas lodziņš šķietami nevarētu garantēt detalizētu informācijas atlases iespēju, sadaļā Palīdzība varam uzzināt par to, kā precizēt meklēšanu, izmantojot piedāvātos atslēgjautājumus kurš, kas, kur un kad. Papildus tam iespējama meklēšana arī frāzes meklēšana, Būla operatoru AND un NOT izmantošana, kā arī sākotnējo meklēšanas rezultātu filtrēšana. Tiek piedāvāta arī pārlūkošana, kurā var atlasīt pašas jaunākās kolekcijas, skatīt objektus pēc to piesaistes kādai ģeogrāfiskajai vietai, pēc hronoloģiskās piederības vai pēc institūcijas, kura tos iesniegusi Europeana.

Visi digitālajā bibliotēkā esošie objekti ir piederīgi kādai no četrām dokumentu pamatkategorijām: teksti, attēli, video, skaņa. Katrai no šīm kategorijām ir sava atpazīstamības ikona, kas ir pievienota ikvienam objektam, tādējādi rezultātu sarakstā uzreiz redzams, kurai no tām katrs atrastais objekts ir piederīgs.Clipboard01

Protams, Europeana joprojām visbiežāk tiek meklēti tieši pasaulē atpazīstamākie un nozīmīgākie kultūrvēsturiskie meistardarbi, taču ļoti lielu daļu no milzīgās kolekcijas satura veido tieši tie objekti, kas ir saistoši mazākām, specifiskākām lietotāju grupām. Varētu gan padomāt par to, vai latviešus drīkst vai nedrīkst uzskatīt par mazu un specifisku grupu, tomēr godīgi jāatzīst, ka diez vai lietotāju tūkstoši visā Eiropā pēkšņi sāks cītīgi meklēt, piemēram, senu Gaiziņkalna torņa vai Talsu pilskalna fotogrāfiju, taču notiekti atradīsies interesenti, kas būs gandarīti par to, ka varēs atrast tieši šos digitalizētos objektus.  Tāpēc ir patīkami apzināties, ka šādas fotogrāfijas un vēl daudzus citus ar Latviju saistītus materiālus mēs šajā resursā  varam diezgan ērti atrast un aplūkot. Šobrīd, ierakstot meklēšanas lodziņā pieprasījumu Latvija, iegūstam vairāk kā 30 tūkstošus rezultātu; izteikti lielākā daļa no tiem ir attēli.  Tas apliecina to, ka arī mums ir savas kultūrvēsturiski nozīmīgas vērtības, un tikmēr, kamēr mēs ar tām visdažādākajos veidos spēsim iepazīstināt arī citus, bažām par to, ka uz Eiropas kartes mūsu nelielā valsts nebūs pamanāma, nav pamata.

 

Izmantotie avoti:

1. Digitālās bibliotēkas Europeana dati tagad atvērti brīvai izmantošanai [tiešsaiste]. Pieejams: http://www.biblioteka.lv/Libraries/latvijas-nacionala-biblioteka/News/ArticleItem.aspx?article=19589&type=0
2. Europeana [tiešsaiste]. Pieejams: http://en.wikipedia.org/wiki/Europeana
3. Europeana: About us [tiešsaiste]. Pieejams: http://pro.europeana.eu/about?utm_source=portalmenu&utm_medium=portal&utm_campaign=Portal%2Bmenu

Skenera trīsdimensionālā redze

Jau esam pieraduši, ka mainīgajā un vienmēr attīstībā esošajā tehnoloģiju vidē ik pa laikam parādās kāds revolucionārs jauninājums jeb „modes kliedziens”, kas sākotnēji šķiet kas aizraujošs un pārsteidzošs, taču vēlāk kļūst ierasts un pašsaprotams. Šķiet, ka vēl pat samērā nesenā pagātnē elektronisko ierīču pasaulē sevi diezgan skaļi pieteica jauna tehnoloģija, kuru mēs iepazinām un joprojām atpazīstam ar apzīmējumu „3D”. 3D ir trīsdimensiju attēlveidošanas princips, kas pats par sevi nav nekas pilnīgi jauns, taču tieši pēdējo gadu laikā šī tehnoloģija ir piedzīvojusi īpaši strauju izplatību un lieliem soļiem ienākusi arī komerciālajā apritē.

Visredzamāk 3D tehnoloģijas ienāca izklaides industrijā – populāras kļuva 3D kinofilmas un videospēles, elektrotehnikas veikalos pārdošanā parādījās televizori ar 3D skatīšanās funkciju. Taču šī tehnoloģija tika atzinīgi novērtēta arī citās svarīgās jomās – 3D modelēšanas iespējas sāka izmantot rūpnieciskajā dizainā, protezēšanā, medicīnā, inženierzinātnēs u.c.

Viena no iespējām, kā izveidot digitālu trīsdimensionālu modeli, ir izmantot datoru ar šim nolūkam paredzētu programmatūru, otra iespēja – trīs dimensijās digitalizēt kādu reālu priekšmetu. Un to ir iespējams veikt ar 3D skenera palīdzību.

3D skeneris ir ierīce, kas analizē reālajā pasaulē eksistējošu objektu ar nolūku iegūt datus par tā formu, lai pēc tam konstruētu šī objekta trīsdimensionālu digitālo modeli. Datus par objektu skeneris fiksē ar zemas jaudas lāzera stara un kameras palīdzību, precīzi izmērot objekta virsmu (bez jebkāda fiziska kontakta ar to).

Tradicionālajiem jeb „parastajiem” skeneriem, kas skenē tikai vienu objekta plakni, šīs darbības veikšanai nepieciešams veikt tikai vienu skenējumu, savukārt 3D skenerim objektu nepieciešams skenēt no dažādām tā pusēm, tāpēc arī veikto skenējumu skaits ir lielāks, turklāt process, kurā visi šie skenējumi tiek sakombinēti vienā digitālā trīsdimensiju modelī, ir arī ļoti komplicēts.

Kā jau gandrīz visām elektroniskajām ierīcēm, arī 3D skeneriem ir dažādu ražotāju dažādi modeļi, kuri atšķiras ar savām tehniskajām kvalitātēm, priekšrocībām un cenām. Nozīmīgi 3D skeneru parametri ir precizitāte un attālums, no kāda skeneris ir spējīgs veikt skenēšanu. Turklāt šie abi rādītāji ir savstarpēji saistīti – jo tuvāk skenējamais objekts atrodas, jo labāku attēla precizitāti iespējams iegūt.

Ja līdz šim bijām pieraduši, ka skenēt iespējams tikai grāmatas vai, ja skenera virsma ir pietiekami liela, arī plakātus un ģeogrāfiskās kartes, tad tagad ar 3D skeneru palīdzību iespējams digitalizēt daudz lielākus objektus – skulptūras, pieminekļus, arheoloģiskos izrakumus. Ņemot vērā, ka bibliotēku kolekcijās visbiežāk iekļautie objekti joprojām ir grāmatas, žurnāli un citi iespieddarbi, 3D skeneru priekšrocības vairāk novērtē muzeji, kuri tos veiksmīgi sākuši izmantot savu eksponātu digitalizēšanai. Agrāk šis process bija dārgs un nepraktisks, taču, tehnoloģijām kļūstot pieejamākām, atsevišķi pasaules muzeji ir uzsākuši sava kultūras mantojuma digitalizēšanas projektus, kuru rezultātā tapuši daudzu eksponātu 3D modeļi, no kuriem daļu interneta lietotājiem ir iespēja aplūkot tiešsaistē muzeju tīmekļa vietnēs. Tā, piemēram, Krievijā mākslas objektu skenēšanu atbalsta un finansē Kultūras ministrija, un līdz šim ir tikuši digitalizēti vairāki Ermitāžas muzeja (Sanktpēterburga) kolekcijās esošie objekti. Šādas muzeju eksponātu 3D modeļu digitālās kolekcijas interesentiem ļauj mākslas darbus aplūkot no dažādiem skatpunktiem (nevis kā agrāk – tikai vienā plaknē), tādējādi sniedzot daudz precīzāku priekšstatu par to, kā šie darbi izskatās dabā. Tas ir lielisks veids, kā pievērst uzmanību muzeja kolekcijās esošajām vērtībām un ļaut tās datora monitorā saskatīt vēl nebijušā kvalitātē.

Lai gan 3D skenēšanas tehnoloģiju attīstība jau ir sasniegusi pietiekami augstu līmeni, joprojām eksistē dažas līdz galam vēl neatrisinātas problēmas. Piemēram, 3D skeneriem rodas grūtības, ja nepieciešams skenēt caurspīdīgus, mirdzošus objektus, kā arī tādus, kam ir neierasta, neviendabīga struktūra (spalvas, mati, atsevišķi audumu veidi u.tml.), izteikti asi stūri vai kustīgas detaļas. Svarīgs ir arī apgaismojums, jo tikai pienācīgi apgaismota objekta trīsdimensiju attēls būs kvalitatīvs, un krāsas tajā būs attēlotas precīzi.  Turklāt pati skenēšana ir tikai viens posms – lielu trīs dimensijās ieskenētu objektu apstrādei un arī apskatei nepieciešama speciāla programmatūra, kas ērti ļauj veikt attēlu rotēšanu un skatīšanu no dažādiem leņķiem. Datoriem, kuros paredzēts uzglabāt lielu daudzumu šādu 3D modeļu, jābūt jaudīgiem, ātriem un ar lielu cietā diska ietilpību.

Nav šaubu, ka nākotnē 3D skeneru izmantošanas intensitāte pieaugs – tie kļūs gan lētāki, gan parocīgāki (tirgū jau tagad ir pieejami neliela izmēra 3D rokas skeneri). Visdrīzāk, ka ar šo skenēšanas veidu vēl aktīvāk nodarbosies muzeji un citas par kultūrvēsturiskā mantojuma saglabāšanu atbildīgas institūcijas, taču nav izslēgta iespējamība, ka jau visai drīz arī ar modernajām tehnoloģijām aizrautīgi pārņemtie skolēni vēlēsies trīs dimensijās digitalizēt savu piemigušo jūrascūciņu.

 

Dažas no tiešsaistē piedāvātajām muzeju 3D kolekcijām apskatāmas šeit:

The Virtual Hampson Museum
http://hampson.cast.uark.edu/

Smithsonian National Museum of Natural History
http://humanorigins.si.edu/evidence/3d-collection

Amarna Virtual 3D Museum
http://amarna.cast.uark.edu/index.html

 

Materiāla sagatavošanā izmantoti šādi avoti:

  1. 3-D Effects to Help Preserve Art [tiešsaiste]. Pieejams: http://rt.com/art-and-culture/news/3d-technology-scanner-art-976/
  2. 3D Scanner [tiešsaiste]. Pieejams: http://en.wikipedia.org/wiki/3D_scanner
  3. Wachowiak, Melvin J. 3D Scanning and Replication for Museum and Cultural Heritage Applications / Melvin J. Wachowiak, Vicky Karas [tiešsaiste]. Pieejams: http://www.si.edu/mci/imagingstudio/papers/scanning_paper.pdf

Ievads OCR jeb teksta atpazīšanas smalkumi

Lai gan var uzskatīt, ka digitalizēt iespējams gandrīz jebko uz šīs pasaules (ja vien tas ir fizisks objekts, ko iespējams ievietot skenerī vai fiksēt ar digitālo fotokameru), tomēr nav šaubu – visvairāk līdz šim digitalizēti tieši tradicionālie teksta un attēlu dokumenti (iedomāsimies visus pasaulē digitalizētos grāmatu un fotogrāfiju miljonus!). Digitalizācijas procesa rezultātā tiek iegūts digitāla attēla fails – neatkarīgi no tā, vai tiek skenēta ilustrācija vai teksta dokuments. Jaunākās paaudzes  datora un interneta lietotājs ir diezgan prasīgs – viņš vēlas saņemt digitalizācijas galaproduktu, kas būtu kvalitatīvs un ar augstu izmantojamības pakāpi. Atzinīgi tiek novērtēti digitalizētie attēli ar augstu izšķirtspēju, savukārt jau gandrīz par pašsaprotamu tiek uzskatīts tas, ka ikvienu elektroniski lasāmu tekstu ar datora peles kursoru iespējams iezīmēt un pēcāk pārkopēt ar opcijas “Copy–Paste” palīdzību. Tāpēc teksts, kurš ir “tikai” lasāms, nereti tiek uzskatīts par materiālu ar mazāku pievienoto vērtību.  Šādu teksta dokumentu, kas ir kļuvis par digitālu attēlu, nav iespējams apstrādāt ar teksta apstrādes līdzekļiem – tekstu nav iespējams iezīmēt un iekopēt kādā teksta redaktorā, kur varētu veikt tā rediģēšanu.

Risinājumu šādā gadījumā spēj piedāvāt OCR programmatūra. Ar šo triju burtu abreviatūru angļu valodā apzīmē Optical Character Recognition (latviešu valodā šo procesu varētu tulkot kā optisko rakstzīmju atpazīšanu), un šīs programmatūras mērķis ir, atpazīstot ieskenētajā tekstā iekļautās rakstzīmes, digitāli atdalīt tekstu no attēlu faila, un konvertēt to tā, lai tas kļūtu rediģējams, kā arī tiktu nodrošināta iespēja veikt teksta satura meklējumus.

Lai arī šobrīd vispopulārākās “parastajam” lietotājam pieejamās OCR datorprogrammas ir pazīstamas relatīvi neilgu laiku, paša rakstzīmju atpazīšanas un konvertēšanas principa aizmetņi radušies jau 20. gadsimta sākumā. Sākotnējas ar to saistītās aktivitātes izpaudās divos virzienos – telegrāfijas iespēju paplašināšanā un lasīšanas ierīču izstrādē neredzīgo cilvēku vajadzībām. 1914. gadā Emanuels Goldbers izstrādāja iekārtu, kas spēja lasīt rakstu zīmes un konvertēt tās standarta telegrāfa kodā. Ap to pašu laiku Edmunds Furnjē d’Albe izgudroja optofonu – rokā turamu skeneri, kas, pārbīdīts pāri lapai ar iespiestu tekstu, radīja dažādus, konkrētām zīmēm atbilstošus skaņu signālus.  Vēlākajos gados OCR izmantošanas iespēju pētīšana turpinājās, un šīs tehnoloģijas jomā tika radīti vairāki patenti dažādās pasaules valstīs. Gluži saprotams, ka līdz ar datortehnoloģiju progresu OCR jomā kļuva iespējams veikt arvien būtiskākus uzlabojumus un jaunievedumus. Tika radītas gan ierīces, kas iespiestu tekstu pārveidoja mašīnlasāmā formātā, gan pirmās tehnoloģijas, kas teksta zīmes spēja arī atskaņot, tekstu pārvēršot runā.

Šobrīd OCR tehnoloģija skenētu teksta dokumentu rakstzīmju atpazīšanai ir kļuvusi daudz pieejamāka un tiek izmantota arvien plašāk. OCR programmas piedāvā dažādi ražotāji, nereti tās jau ir iekļautas skenera programmatūrā. Kad programma attēla failā ir atpazinusi tur fiksētās rakstzīmes, tās tiek pārveidotas ASCII kodā (American Standart Code for Information Inerchange – Amerikas Informācijas apmaiņas standarta kods), līdz teksta attēls tiek ierakstīts kā teksta fails, un teksta apstrādes programma var to nolasīt. Būtiskākais parametrs, pēc kura vērtē OCR programmas efektivitāti, ir atpazīto rakstzīmju atpazīšanas precizitāte. Kvalitatīva teksta materiāla (drukāta teksta dokumenti ar latīņu rakstzīmēm) gadījumos precizitāte var būt ļoti augsta – pat līdz 99%. Precizitāte var mazināties, ja tekstā iekļautas retāk izmantotas rakstzīmes (tiesa, dažām programmām var “iemācīt” papildus rakstzīmes, ko tās vēlāk spēs atpazīt), kā arī tad, ja digitalizējamajam materiālam ir zema fiziskā kvalitāte – kļūdu iespējamību palielina dažādi plankumi, smērējumi, papīra burzījumi, izbalējis un slikti salasāms teksts u.tml. Piemēram, OCR programmu nereti spēj “samulsināt” arī teksts kursīvā jeb slīprakstā.

Kādā pētījumā, kurā tika testētas dažādas komerciālajā apritē esošās OCR programmas, tika noskaidrots, ka, apstrādājot 19. gadsimta un 20. gadsimta sākumā iespiestos laikrakstus, teksta atpazīšanas precizitāte variēja no 71% līdz 98% procentiem. Labākās OCR programmas spēj atpazīt arī rakstzīmes rokrakstā, taču, protams, arī šādā gadījumā precizitāte, salīdzinot ar drukātu, tekstu ir zemāka. Tāpat ir pieejamas arī programmas, kas spēj atpazīt teksta elementus vecajā drukā – tā saucamajā gotiskajā rakstā.

Kā redzams, neviens no OCR programmatūras ražotājiem pat izcila izejmateriāla gadījumā nepiedāvā 100% teksta atpazīšanu, tāpēc, lai būtu garantija, ka rezultāts ir izcils, pēc teksta konvertēšanas vienmēr nepieciešams veikt pārbaudi arī ar cilvēka aci un nepieciešamības gadījuma koriģēt neprecīzi atpazītās rakstzīmes.

Neiedziļinoties specifiskos matemātiskos algoritmos, teksta atpazīšanas pamatprincipu var raksturot diezgan vienkārši. Vispirms OCR programma izanalizē dokumenta struktūru un sadala lappusi elementos – tekstu blokos, tabulās, zīmējumos u.c. Teksta līnijas tiek sadalītas vārdos, bet pēc tam – rakstzīmēs. Programma grafiski atpazīst rakstzīmes (burtus, ciparus, interpunkcijas zīmes) un salīdzina ar savā atmiņā esošajiem paraugiem, analizējot līnijas un līknes, kas raksturīgas noteiktiem teksta elementiem. Jo labāka, kvalitātīvāka programma – jo vairāk rakstzīmju tā atpazīst. Lielā daļā pasaulē lietoto valodu tiek izmantotas latīņu alfabēta zīmes, tomēr atsevišķās valodās šiem latīņu alfabēta burtiem ir pievienotas dažādas diakritiskās (garumzīmes, mīkstinājuma) zīmes, tādējādi veidojot jau citu (kaut ļoti līdzīgu) rakstzīmi. Taču ir arī valodas, kuras izmanto pavisam citu rakstzīmju alfabētus, piemēram, krievu un grieķu valoda. Jā, un neaizmirsīsim arī japāņu, ķīniešu, korejiešu rakstību… Labākās šībrīža OCR programmas atpazīst jau gandrīz 200 valodu, līdz ar to atmiņā glabājot informāciju par visām šajās valodās izmantotajām rakstzīmēm. Protams, ir ļoti svarīgi, lai programma spētu atpazīt arī pēc iespējas vairāk teksta fontu veidu.

Nu jau kādu laiku arī mēs, LU Bibliotēkas digitalizācijas grupa, atsevišķos gadījumos izmantojam OCR programmatūras sniegtās iespējas. Šobrīd, lietojot programmu Readiris Pro 11, teksta atpazīšanas process tiek veikts tām digitalizētajām disertācijām, kuras ikvienam pieejamas LU e-resursu repozitārijā. Tie ir PDF formāta faili, kuros pēc teksta atpazīšanas veikšanas tiek nodrošināta tā kopēšanas un satura meklēšanas iespēja (t.i., izmantojot opciju Find, pārbaudīt kāda vārda vai termina atrašanās vietu un lietošanas biežumu attiecīgajā tekstā). Teksta pārveidošanu rediģējamā formātā (piemēram, Microsoft Word failā) digitalizācijas procesā saprotamu iemeslu dēļ gan neveicam.

Lai gan teksta atpazīšanu ir vajadzība veikt drukāta teksta materiāliem, tomēr tā ne visos gadījumos dod vienlīdz labus rezultātus. Te lielākoties vainojama skenētā materiāla fiziskā kvalitāte. Līdz pat pagājušā gadsimta 90. gadu sākumam Latvijā publicēto disertāciju teksts tika rakstīts mašīnrakstā, tādējādi tas vizuāli atšķiras no mums pierastajiem datoros izmantotajiem teksta fontiem, tāpēc arī OCR programmai ne vienmēr izdodas to pilnvērtīgi atpazīt. Turklāt mašīnraksts, atšķirībā no tipogrāfiski iespiesta vai ar printeri drukāta teksta, ir ar zemāku kontrastu, pelēcīgs, dažiem darbiem laika gaitā arī manāmi izbalējis. Problemātisks teksta materiāls mēdz būt arī tajās disertācijās, kas ir veidotas kā publikāciju kopas – šajos darbos lielākoties ir iekļautas dažādu autora publikāciju kserokopijas, kas bieži vien nav sevišķi kvalitatīvas. Visi šie apstākļi ietekmē OCR programmas veiktspēju un precizitāti.

Raksta veidošanā palīdzēja šādi informācijas resursi:

  1. Pakalpojumi – OCR jeb teksta atpazīšana [tiešsaiste]. Pieejams: http://www.keelekoda.ee/lat-ocr-teksta-atpazisana
  2. Optical Character Recognition [tiešsaiste]. Pieejams: http://en.wikipedia.org/wiki/Optical_character_recognition
  3. ABBYY FineReader 11 Professional Edition [tiešsaiste]. Pieejams: http://finereader.abbyy.com/about_ocr/whatis_ocr/
  4. Best Practices for Optical Character Recognition [tiešsaiste]. Pieejams: http://www.library.illinois.edu/dcc/pdfs/best_practicespdfs/05_best_practices_for_ocr_opt.pdf

P.S. Turpmāk šeit centīsimies aplūkot arī citus ar digitalizāciju saistītus jautājumus.

Teksta atpazīšanas programma Readiris Pro 11 darbībā

Teksta atpazīšanas programma Readiris Pro 11 darbībā

Digitalizācijas grupa iesaistās LU Bibliotēkas nedēļā

Vērīgākie studenti un citi mūsu bibliotēkas draugi noteikti bija pamanījuši, ka laikā no 23. līdz 27. aprīlim LU Bibliotēkā norisinājās ikgadējā Bibliotēkas nedēļa, kurā šogad pirmoreiz piedalījāmies arī mēs – LU Bibliotēkas digitalizācijas grupa (pirmoreiz tāpēc, ka pērnā gada LU Bibliotēkas nedēļas laikā mūsu grupa nemaz vēl nebija dzimusi). Digitalizācijas grupas piedāvājumu groziņā bija divas akcijas. Viena no tām bija lasošo studentu (mēs ceram, ka nelasošu studentu LU nemaz nav!) auditorijai paredzētā loterija “Rādi, ko Tu lasi!”, kuras norises laikā aicinājām studentus mums ar e-pasta palīdzību atsūtīt ieskenētus vai nofotografētus vāciņus no šobrīd lasītajām grāmatām. Un solījām, ka godīgas izlozes rezultātā viens no vāciņa bildes sūtītājiem balvā iegūs brīnumjaukos LU Bibliotēkas suvenīrus – zilu krūzīti rīta kafijas vai tējas baudīšanai, kā arī auduma maisiņu, kas izmantojams biezo un smago grāmatu transportēšanai no bibliotēkas uz mājām (un otrādi).
Neskatoties uz to, ka detalizētu statistisko analīzi par loterijas dalībniekiem un viņu lasītajām grāmatām neveicām, tomēr nevarējām nepamanīt, ka no 36 censoņiem visaktīvākie bija Ģeogrāfijas un Zemes zinātņu fakultātes studenti, kuri galvenokārt lasa savas mācību nozares literatūru. Jāteic, ka mācību literatūras lasītāju kopumā bija gandrīz četras reizes vairāk nekā to, kas par savu lasāmvielu bija izvēlējušies daiļliteratūru. Taču abās no šīm kategorijām bija pārstāvētas grāmatas ne tikai latviešu valodā, bet arī kādā no svešvalodām – lielākoties angļu valodā.
Lai arī sākotnēji kā pašsaprotamu bijām iedomājušies variantu, kad katrs loterijas dalībnieks mums atsūtīs tikai vienu digitalizēto grāmatas vāku (un pārsvarā tā arī bija), pāris sūtītāju mūs informēja par visām mācību kursā vai aktuālā pētnieciskā darba gatavošanā tobrīd izmantotajām grāmatām (vispārliecinošākā bija kāda medicīnas studente, kura atsūtīja 17 savas nozares mācību grāmatu vāciņus).
Tātad, 26. aprīlī LU Bibliotēkas Daudznozaru bibliotēkā pēc konkursa “Ko tu zini par LU Bibliotēku?” laureātu sumināšanas ar LU Bibliotēkas direktores Mārītes Savičas roku tika izlozēts arī mūsu organizētās loterijas “Rādi, ko Tu lasi!” uzvarētājs – tā bija Lūcija Roziņa, kura izlozē piedalījās ar mums nosūtīto Fransuā Rablē grāmatas “Gargantija un Pantagriels” apvāka fotoattēlu. Interesanti, ka Lūcija attēlu mūsu loterijai no visiem dalībniekiem atsūtīja pati pēdējā.
Lūk, šeit iespējams skatīt konkursa un loterijas noslēguma pasākuma videoierakstu:
http://www.youtube.com/watch?feature=player_embedded&v=l7CqrNYIjm4

LU Bibliotēkas nedēļas laikā norisinājās arī akcija  “Bibliotekāram pa pēdām”, kuras ietvaros LU Sociālo zinātņu fakultātes Informācijas un bibliotēku studiju nodaļas studenti tika aicināti pēc izvēles viesoties kādā no LU Bibliotēkas nodaļām vai nozaru bibliotēkām un ielūkoties bibliotekāra ikdienas darbā. Vairākas studentu grupiņas izvēlējās apciemot arī Lielvārdes ielā 24 izmitinātās bibliotēkas nodaļas, tajā skaitā arī mūs – digitalizācijas grupu. Protams, mēs bijām pretinākoši un izklaidējām viesus ar stāstījumu par mūsu grupas darbības virzieniem, demonstrējām dažādus digitalizācijas posmus un procesus, ļaujot arī viņiem pašiem tajos praktiski iesaistīties. Noslēgumā nedaudz sagurušos viesus aicinājām iestiprināties ar sulu un cepumiem, kā arī lūdzām aizpildīt anketas – ar to palīdzību centāmies noskaidrot viņu iespaidus un uzzināt, vai šāda ciemošanās bijusi vērtīga un noderīga. Savus patiku, nepatiku un vēlējumus ciemiņi rakstiski varēja izpaust arī uz krāsainām no kartona izgrieztām pēdiņām. Atsauksmes galvenokārt bija pozitīvas un uzmundrinošas (jo mēs taču tiešām centāmies!).
Lai gan akcijai piesaistītā pamatauditorija bija studenti, labprāt kā ciemiņus uzņēmām arī savus kolēģus, kuri bija ieinteresēti noskaidrot, ar ko mēs īsti nodarbojamies. Mūs ar savu ierašanos pagodināja blakus telpā strādājošie kataloģizācijas un komplektēšanas speciālisti, Informācijas un bibliogrāfijas nodaļas darbinieces, kā arī bibliotekāres no LU Bibliotēkas Ekonomikas zinātņu bibliotēkas.

Un noslēgumā – galerija ar dažiem fotomirkļiem: