i
u:
u:
n. dj.
Digitalizacija hrvatskih latinista: prijedlog projekta
Digitalizacija hrvatskih latinista: prijedlog projekta
Neven Jovanović
Abstract
Digitization of Croatian Writers in Latin
1 Plan, postupci i metode istraživanja
1.1 Pretpostavka
Objedinjavanje građe vezane uz hrvatske književnike koji su pisali na latinskom
olakšat će pristup rijetkoj i osjetljivoj izvornoj građi i, istovremeno, povećati
vjerojatnost očuvanja i iskoristivosti te građe u budućnosti; također, privući će
znanstvenike i omogućiti im da dođu do novih i dubljih spoznaja o ovoj dionici
hrvatske književnosti, kulture i intelektualne povijesti, kao i da iskušaju i
razvijaju nove istraživačke pristupe. Napokon, promišljanje samog postupka - što
radimo dok digitaliziramo književnu građu? što radimo drugačije u odnosu na
pripremu građe za objavljivanje tiskom? - dovest će do novih spoznaja o disciplini
koja se upravo rađa: o humanističkoj informatici. Stečena će iskustva pomoći
očuvanju i iskoristivosti digitalizirane hrvatske baštine.
1.2 Postupci, protokol i plan istraživanja
- Računalni unos tekstova i druge građe (OCR, skeniranje, prijepis, korekture)
- Osnova projekta; traje tijekom čitavog projekta.
- Unose se već objavljeni tekstovi, ali i oni nastali na drugim projektima
programa, kao i oni koje prikupe i otkriju sami suradnici na projektu.
- Svaki tekst mora, prije početka označavanja, radi provjere točnosti proći
barem jednu korekturu koju izvode dvije osobe (jedna čita prijepis, druga kontrolira
izvornik).
- Označavanje (kodiranje) građe
- Osnova projekta; traje tijekom čitavog projekta, prati unos tekstova.
- Koristi se već postojeći, internacionalni TEI XML standard, otvoreni
(nevlasnički) sustav označavanja elektronskih tekstova; ovaj standard jamči bazi
postojanost, neovisnost o specifičnim računalnim programima, te, samim time,
mogućnost nadogradnje čak i na duži vremenski rok
- Redoslijed kodiranja: a) "metapodaci" - bibliografski podaci o izvoru
i provedenom kodiranju; b) struktura teksta (knjige, dijelovi, poglavlja, stihovi,
odjeljci); c) tekstualne varijante (ako postoje; ovamo ulaze i priređivačke
intervencije); d) imena
- Izrada računalno pretraživog korpusa, tj. baze podataka (s različitim
mogućnostima pretraživanja, snimanja rezultata, kreiranja posebnih zbirki)
- Pošto se dosegne "kritična masa" (20 autora, barem 200.000 riječi; u drugoj
godini projekta); traje paralelno s daljnjim unosom i označavanjem tekstova.
- Baza podataka mora omogućiti sljedeće vrste pretraživanja:
- Po riječima (ili "stringovima");
- Po autorima i naslovima;
- Po razdobljima (stoljećima);
- Po književnim vrstama (proza / poezija; ep, elegija, epigram itd;
historiografija, govori, pisma, znanstvena djela itd);
- Po temama (teologija, povijest, prijateljska komunikacija, satira itd);
- Po imenima (osoba, mjesta, ustanova)
- Uključiti statističke podatke o čitavom korpusu
- U sljedećoj fazi (v. "usavršavanje korisničkog sučelja") baza mora
korisnicima maksimalno olakšati dugotrajan i intenzivan rad, dajući im mogućnost
da formiraju i bilježe vlastite zbirke tekstova u okviru baze, da tekstovima
dodaju vlastite oznake i bilješke (sukladno osobnim interesima i istraživanjima),
da, ako žele, imaju uvid u zbirke, oznake i bilješke drugih korisnika
- Objavljivanje baze podataka na mreži
- Čim bude dovršen prototip baze podataka (krajem druge godine projekta)
- Uključuje praćenje rada korisnika (U koje svrhe koriste bazu? Što
pretražuju? Koliko se lako snalaze?) radi usavršavanja sučelja
- Baza je dinamična, tj. nova se građa uključuje kako bude dovršeno njezino digitaliziranje
- Usavršavanje korisničkog sučelja, podrška korisnicima, stvaranje istraživačke
zajednice
- Nakon objavljivanja prototipa baze; do završetka projekta i nakon njega
- Olakšati korištenje baze što je više moguće
- Prirediti i objaviti detaljne upute za korištenje baze
- Odgovarati na korisnička pitanja, bilježiti primjedbe
- O objavljivanju baze obavijestiti domaće i inozemne znanstvene forume - a)
istraživača hrvatske književnosti i hrvatskog jezika; b) istraživača
novolatinskog jezika i književnosti; c) humanističke informatike
- Osigurati prostor za objavljivanje sekundarne literature proizašle iz
istraživanja i korištenja baze
- Osigurati prostor za razmjenu iskustava vezanih uz korištenje baze
- Usavršavanje uključenih tekstova
- Nakon objavljivanja prototipa baze; do završetka projekta i kasnije
- Ispravljati zapažene greške
- Proširivati metapodatke
- Dodavati daljnje tipove oznaka (usp. gore "redoslijed kodiranja")
- Širenje baze: dodavanje novih tekstova, dodavanje sekundarne bio-bibliografske
i interpretativne građe, dodavanje slikovnog materijala (snimke rukopisa i starih
tiskanih izdanja), te prijevoda
- Nakon objavljivanja prototipa baze; do završetka projekta i nakon toga
- Tempo rada: dodavati tekstove oko 20-40 novih autora godišnje
- Cilj: nakon 5 godina obuhvatiti 200 hrvatskih latinista, uključiti barem 5
cjelovitih opusa, prvi od kojih je latinski opus Marka Marulića
- Objaviti u okviru baze leksikonske natuknice o autorima tekstova, povezujući bilješke
sa samim tekstovima (putem hiperveza)
- Objaviti nekoliko interpretacija pojedinih autora ili žanrova (osobito onih
čije bi detaljno ilustriranje u tisku zauzelo previše prostora; takve je moguće
povezati sa svim potvrdama koje postoje u bazi)
- Posebno upozoriti na prezentiranu digitaliziranu baštinu koja je (iz
ekonomskih razloga ili zbog konvencija) neobjavljiva tiskom (npr. Marulićeve
marginalije u knjigama drugih autora, "paralelno kodirana" kritička izdanja),
i problematizirati postupanje s takvom baštinom
- Objaviti barem jednu lingvističku studiju, kao put prema leksikografskom
korištenju baze
- Odabir djela (osobito rukopisnih - posebno autografa -, te onih u
rijetkim tiskanim izdanjima) popratiti snimkama izvorne građe
- Odabir djela (značajnih, ili uzornih) povezati s dobrim prijevodima na
hrvatski - bilo već postojećima, ili novima
- Pritom osobitu pažnju pokloniti samoprijevodima (isti autor piše isto djelo u
dvije inačice, na dva jezika) i tekstovima koji su prijevod s hrvatskog (npr. Ferićevi prijevodi narodnih pjesama, Vlaha Getaldića prepjev "Osmana")
- Prezentiranje i evaluacija rezultata
- U završnoj godini projekta i po njegovu završetku
- Upozoriti znanstvenu javnost (domaću i inozemnu) na postojanje baze
- Poticati korištenje baze i prikupljati podatke o korištenju
- Prezentirati podatke o korištenju baze u različitim fazama njezina razvoja
- Brižljivo dokumentirati postupke u svim fazama rada; učiniti tu dokumentaciju
javno dostupnom
- Promišljati razlike ovakvog rada u odnosu na pripremu i objavljivanje građe
tiskom, razlike ovakvih istraživanja u odnosu na istraživanja tiskom objavljene
građe
1.3 Svrha i ciljevi predloženog istraživanja
Stvoriti prostor za objedinjavanje sada rasute građe vezane uz hrvatske latiniste.
Mogućnostima računalno pretraživog korpusa stvoriti uvjete kako za detaljnija
dubinska istraživanja (do dosad nezamislive razine preciznosti), tako i za sintetičke
ocjene i interpretacije prikupljene građe (opet, preciznije nego što se dosad moglo
zamisliti). Uključivanjem likovnog materijala (snimke rukopisa, starih izdanja)
upozoriti na materijalni aspekt tekstova. Otvoriti zbirku za istraživanja drugih -
kako međunarodne znanstvene zajednice, tako i hrvatskih istraživača drugih struka
(povjesničara, povjesničara umjetnosti, antropologa itd.)
1.4 Primjena istraživanja
Osnova i podrška za daljnja istraživanja s područja znanosti o književnosti,
lingvistike, povijesti (uključujući i pravnu i crkvenu povijest, te
bio-bibliografije), filozofije, leksikografije, prijevodnih studija, ali i
humanističke informatike. Daljnja istraživanja mogu biti vezana uz Hrvatsku, ali i
uz međunarodnu "književnu republiku" (latinski je bio internacionalno sredstvo
sporazumijevanja, novolatinska je kultura nad-nacionalna). Razvijeni model i stečena
iskustva (adekvatno dokumentirani) pomoći će novim projektima digitalizacije stare
hrvatske književnosti i hrvatske kulturne baštine, ili, internacionalno, projektima
općenito namijenjenim digitalnom očuvanju jezičnih i tekstualnih baština. Zajednički
radni okvir olakšat će i potaknuti komunikaciju znanstvenika angažiranih na
istraživanju hrvatske i svjetske latinističke baštine.
1.5 Očekivani rezultati
- Prva godina: digitaliziranje tekstova 20 autora;
digitaliziranje cjelokupnog sačuvanog latinskog opusa Marka Marulića.
- Druga godina: digitaliziranje daljnjih 30 autora; cjelovit opus Jurja Šižgorića;
izrada baze podataka sa sučeljem za pretraživanje; objavljivanje prototipa baze na internetu.
- Treća godina: digitaliziranje još 40 autora; cjelovit opus Ludovika Paskalića;
usavršavanje baze prema iskustvima probnog rada.
- Četvrta godina: digitaliziranje 50 novih autora; cjelovit opus Damjana Beneše;
proširivanje baze slikovnim materijalom (vezanim uz Marka Marulića); daljnje
usavršavanje tekstova i baze.
- Peta godina: digitaliziranje 60 autora; cjelovit opus Karla Pucića i Jakova
Bunića; dodavanje novog slikovnog materijala; evaluacija projekta i publiciranje
evaluacije. Baza podataka ostaje trajno dostupna na Mreži, proširiva kako opsegom,
tako i vrstama označavanja.
2 Sadašnje stanje, doprinos i osposobljenost istraživača
2.1 Dosadašnje spoznaje
(Razvitak jezicnih tehnologija za hrvatski jezik) unutar kojeg se nalazi
projekt "Hrvatski jezicni resursi i njihovo obiljezavanje". Jesi li
zainteresiran za suradnicko mjesto u tom projektu u kojem ce se, osim
daljnjega razvitka HNK, sastavljati citav niz paralelnih korpusa
(hrvatsko-inojezicnih) unutar kojih bi se mogao naci i latinsko-hrvatski
paralelni korpus? Nadam se da ti ne moram objasnjavati korisnost paralelnih
korpusa za npr. kontrastivnu lingvistiku, dvojezicnu leksikografiju,
prijevodne studije itd. Svi ce paralelni korpus, kad se sastave, biti
dostupni za razne vrste pretrazivanja i preko Interneta.
2.2 Nastavak prethodnih istraživanja
2.3 Odjek i utjecaj prethodnih istraživanja
2.4 Uključenost znanstvenih novaka
2.5 Popis do 30 najvažnijih znanstvenih radova svih suradnika u posljednjih 5 godina
3 Napomena
3.1 Napomena i popis priloga
File translated from
TEX
by
TTH,
version 3.72.
On 20 Feb 2006, 09:49.