Program delavnice XML-TEI
PROGRAM
Uvod v XML in TEI
Tomaž Erjavec: 60 minut
V predavanju bomo najprej spoznali osnove standarda za označevanje XML. Ogledali si bomo zgradbo dokumentov in model označevanja v XML, na kratko pa bomo obravnavali tudi kodiranje znakov s poudarkom na standardu Unikod. Nato bodo predstavljene sheme XML, ki omogočajo formalno definicijo gramatike in nabora oznak za določen tip dokumentov. V drugem delu predavanja bomo spoznali Iniciativo za zapis besedil TEI (Text Encoding Initiative). Smernice definirajo sistem za izgradnjo shem XML in podrobno dokumentirajo preko 500 elementov, ki jih TEI predvideva za označevanje zelo raznorodnih tipov besedil in za raznovrstne analitične obravnave. Podali bomo motivacijo za ustanovitev in zgodovinski pregled TEI ter glavne prednosti uporabe Smernic TEI za zapis in označevanje besedil.
Uvod v TEI
Matija Ogrin: 30 minut
Smernice konzorcija TEI skušajo ustreči raznolikim potrebam humanistov, katerih glavni predmet preučevanja so besedila. Smernice določajo obsežen nabor oznak XML, s katerimi je moč označiti (kodirati) raznolike strukture humanističnih besedil. Oznake so združene v module za razna področja dela z besedili. V predavanju bomo spoznali splošno strukturo, predpisano za dokumente TEI, in najpomembnejše module, ki jih humanisti uporabljamo pri delu z besedili.
Odmor, 15 minut
Primer uporabe: znanstvene izdaje primarnih virov
Matija Ogrin: 30 minut
Eno od temeljnih delovnih področij v vseh historičnih in filoloških vedah je izdajanje znanstvenih edicij primarnih virov (starejših tiskov, rokopisov). Temu delu je namenjen eden od modulov TEI in pripadajoče poglavje Smernic. V predavanju bomo orisali najbolj pogoste strukture in označevalne prakse, relevantne za pripravo izdaje (starejših) besedil.
Primer uporabe: opis rokopisov
Matija Ogrin: 30 minut
Rokopisi predstavljajo enega najpomembnejših segmentov kulturne, zlasti slovstvene dediščine, zato po svetu in pri nas nastajajo elektronske zbirke, ki predstavljajo podrobne opise rokopisov skupaj z digitalnimi faksimili izvirnika. Smernice TEI so temu področju namenile poseben modul, ki bo v predavanju predstavljen v raznih možnostih od manj do bolj kompleksnega označevanja.
Odmor, 30 minut
Primer uporabe: biografski in prozopografski podatki
Petra Vide Ogrin: 30 minut
Smernice TEI poseben modul biografskim in prozopografskim podatkom, ki jih srečujemo v arhivskih regestah, prozopografijah in predvsem v leksikografskih publikacijah. Na te smernice je bilo oprto označevanje biografskih podatkov v spletnem portalu Slovenska biografija, ki obsega tri leksikone: Slovenski biografski leksikon (1925-1991), Primorski slovenski biografski leksikon (1974-1994) in Novi Slovenski biografski leksikon (2013). V predstavitvi bomo nakazali, kako so nam oznake TEI omogočile podrobno označevanje osebnih in variantnih imen, nazivov in plemiških predikatov, krajevnih imen, datumov, poklicev oz. dejavnosti in sorodstvenih vezi ter njihovih posebnosti.
Primer uporabe: izvorno digitalni podatki in strukturirani podatki
Andrej Pančur: 30 minut
Smernice TEI so bile prvotno sicer narejene za označevanje digitaliziranih tiskanih besedil analognih besedil, toda v zadnjih letih se vedno pogosteje uporabljajo pri označevanju raznovrstnih izvorno digitalnih besedil, med drugim tudi znanstvenih publikacij. V predavanju bomo obravnavali prednosti in pomanjkljivosti elektronskega založništva v humanistiki po Smernicah TEI v primerjavi z nekaterimi drugimi v založništvu splošno razširjenimi označevalnimi jeziki (DocBook, XHTML, HTML5). Poleg tega bomo prikazali, kako je mogoče v izvorno digitalna besedila vključiti strukturirane podatke iz tabel in relacijskih baz podatkov.
Primer uporabe: jezikoslovno označeni korpusi in slovarji
Tomaž Erjavec: 30 minut
Računalniški korpusi besedil predstavljajo osnovo za empirične raziskave jezika, tako pri temeljnih jezikoslovnih raziskavah kot pri uporabnem jezikoslovju, predvsem slovaropisju. Smernice TEI imajo poseben modul za zapis korpusov, dodaten modul pa za jezikoslovne oznake, ki jih lahko dodajamo besedilom, s čimer naredimo korpus bistveno bolj uporaben. V predavanju bomo pogledali nekaj primerov jezikoslovno označenih korpusov slovenskega jezika, nato pa še primere zapisa slovarskih podatkov, za katere Smernice tudi ponujajo samostojen modul.