Dolnoserbska digitalna biblioteka

Informacije

Slězyna

Toś ten internetowy bok z how prezentěrowanymi tekstami jo se naźěłał wót oktobera 2019 do kóńca lěta 2021 we wobłuku projekta »Koncepcija a wuźěłanje na korpusowych tekstach bazěrujuceje dolnoserbskeje biblioteki« z tśeśich srědkow. Teksty, kótarež su do digitalneje biblioteki zapśimjete, reprezentěruju wjeliki źěł dolnoserbskego pismojstwa do 1945 a stakim wažny źěł serbskego kulturnego derbstwa.

Korpusowe teksty z wusokeju kwalitu, kótarež su zakład za cytaŕske wersije, su nastali we wěcej kšacach kompleksnego digitalizaciskego a wobźěłowańskego procesa. Wopisanje procedury a cełkowneje koncepcije za pśigótowanje korpusowych tekstow jo wótśišćane w nastawku „Das niedersorbische Globalkorpus als Ziel einer ganzheitlichen Konzeption zum Aufbau von Textkorpora“ (Bartels 2020 w Lětopisu 67, zešywk 2, b. 4–44).

Projekt jo se spěchował wót Logo der Beauftragten der Bundesregierung für Kultur und MedienZagroniteje Zwězkowego kněžaŕstwa za kulturu a medije a to ako modul kooperatiwnego ned-projekta we wobłuku strukturneje změny Walorizacija serbskego kulturnego derbstwa w nimsko-słowjańskem konteksće.

Wopśimjeśe

Za dolnoserbsku digitalnu biblioteku je se wuzwólił šyroki spektrum korpusowych tekstow, kótarež wótbłyšćuju na swój part historiske dolnoserbske pismojstwo: Na jadnom boce pśistupni se de facto ceła dolnoserbska publicistika (w šyrokem zmysle) do Drugeje swětoweje wójny (Casnik, Pratyja, Wósadnik), na drugem boce jo wordowało wuzwólonych něźi 200 knigłow ze wšakim wopśimjeśim.

Specifikum pśedwójnskego (njepublicistiskego) dolnoserbskego pismojstwa jo, až wóno jo było do dalokeje měry nabóžninski wusměrjone a až teke w beletristiskich tekstach se kněže póbóžne motiwy. Snadny późěł njenabóžninskich tekstow w bibliotece rezultěrujo stakim z realnego stawa pismojstwa a njejo wuslědk wědobnego wuzwólowanja.

Biblija z lěta 1868 jo pśistupna na wósebnem boce kótaryž zmóžnja teke specifiske wobchadanje z toś teju sortu teksta, rozmjej wósebnje nawigěrowanje pó wósebnych bibliskich strukturelnych jadnotkach (knigły/kapitel/werš). Perspektiwiski mógu se tomu bokoju dalšne wudaśa dolnoserbskeje biblije pśidaś.

Comy na to pokazaś, až jadna se wó historiske teksty. Jich wopśimjeśe jo ze źinsajšnego wiźenja młogi raz na wšaku wašnju problematiske a reflektěrujo mysli a měnjenje něgajšnych awtorow.

Pśigótowanje a prezentacija

Na bokach digitalneje biblioteki prezentěrowane teksty su se spśigótowali pśez dosć kompleksny proces digitalizacije, w kótaremž su byli głowne kšace slědujuce:

  • Scannowanje originala resp. wobstaranje južo eksistěrujucego digitalnego wobraza.
  • Profesionelne wótpisanje teksta, nejcesćej z pomocu tak pomjenjoneje metody double keying, źož se pśirownuju wótpise žednych wósobow, aby se zmólki namakali a skorigěrowali. Taki proces pomina se relatiwnje wjele źěła, w pśirownanju z awtomatiskim procesom OCR pak zarucyjo wusoku dokradnosć wótpisa.
  • Wótpisany tekst se zjadnośijo a pó pśedwiźonych standardach koděrujo. W paźe dolnoserbskego tekstowego korpusa stej se wužywałej Unicode (UTF-8) za koděrowanje pismikow a TEI P5 za meta-pódaśa a anotaciju semantiskeje struktury dokumenta. Z pomocu strukturelneje anotacije markěruju se elementy ako na pś. zachopjeńk a kóńc kapitla, artikla abo rubriki, title, mjazytitle, zaměstnjenje bildkow a pódpise spózy nich, štucki basnjow, wuzwignjone citaty, cele tabelow, nožki, cysła bokow a wjele dalšnych elementow, ako se w śišću zwuraznjuju z pomocu wšakich konwencionalnych grafiskich a typografiskich srědkow.
  • Wopśimjeśe, rozmjej serbski tekst, se dalej analyzěrujo, pó źěłach awtomatiski, pó źěłach manuelnje. Tak nastawa rěcna anotacija, kótaraž kuždemu z milionow słow pśirědujo norměrowane a zakładne formy, ako zmóžniju napšašowanje pśez system komfortnego pytanja.
  • Z dokumentami su zwězane pódrobne meta-pódaśa: titel, awtor, redaktor, lěto wudaśa. Wóni se dalej wobźěłaju, norměruju a koděruju. Toś te daty zestajaju se w originalnej formje a w źinsajšnem pisanju w katalogu biblioteki a su z tym zakład za pśeglědanje a pśistup k jeje wopśimjeśu.
  • Na zakłaźe konsistentneje strukturelneje anotacije generěrujo se internetowe wudaśe. Elementy teksta ako title, štucki, lisćiny, wótstawki atd. rozeznawaju se z pomocu unificěrowanych typografiskich srědkow. Wóni prezentěruju se pótakem we wšyknych dokumentach biblioteki pó samskej wašni a njemakaju se stakim ze stawnje rozdźělnymi rozwězanjami w originalnych wudaśach. Hierarchiska struktura dokumenta, kótaraž wobstoj na pś. z knigłowych kapitlow abo casnikowych artiklow a rubrikow a žednych drugich elementow, zestaja se wušej togo w zapisku wopśimjeśa. Tak wólažcyjo se dodatnje droga ku konkretnym fragmentam.
  • Mimo direktnje w browserje pśistupnego wudaśa (HTML) dajo warianty za download a stakim na pś. za pśeglědanje off-line. Toś te wudaśa su se generěrowali na zakłaźe samskego žrědła. Póbituju se formaty PDF, ePUB a jadnory tekstowy format. Glědajucy na typografisku wšakorakosć žrědłowych tekstow a na pótrjebu pó móžnosći zjadnośonego grafiskego formata digitalnego wudaśa, njejo se tekst mógał we wěstych padach optimalnje stajaś; źo pśede wšym wó wobšyrne tabele. Někotare rědy mógu měś śěžkosći z pšawym pokazanim žednych znamuškow a diakritikumow, ako w staršych serbskich tekstach wustupuju.
  • Dodatnje dajo pśi prezentěrowanych dokumentach pokazku na digitalny faksimile, jolic až taki eksistěrujo. Nejcesćej namakaju se wótpowědne daty na portalu Sachsen.digital abo na bokach Serbskeje centralneje biblioteki. To zmóžnijo pśijazny doglěd do originalneje grafiskeje formy.

Projektowa kupka

Cełkowne nawjedowanje
Hauke Bartels
Koordinacija projekta
Joanna Szczepańska
Koncepcija boka
Hauke Bartels, Fabian Kaulfürst, Joanna Szczepańska, Marcin Szczepański
Zastojanje tekstowego korpusa
Marcin Szczepański
Zestajenje a zastojanje leksikaliskeje datoweje banki
Marcin Szczepański
Wersije z modernizěrowanym pisanim
Fabian Kaulfürst
Awtomatiska lematizacija tekstow
Marek Slodička
Manuelne normalizěrowanje resp. lematizěrowanje tekstow (wubrane publikacije)
Katja Atanasowa, Joanna Szczepańska, Marcin Szczepański
Strukturěrowanje tekstow
Měrćin Bałcar, Regina Kindermanowa, Joanna Szczepańska, Marcin Szczepański, Beata Zyndźic
Napóranje digitalnych wobrazow a pśistupnjenje online
Wito Bejmak / Serbska centralna biblioteka (pó źěłach w kooperaciji ze SLUB w ramiku sakskego krajnego programa digitalizacije)
Scannowanje a rědowanje digitalnych wobrazow
Josefina Rachelic
Stajanje digitalnych wudaśow a techniske realizěrowanje boka
Marcin Szczepański
Źěł Komfortne pytanje
Marek Slodička

Wuměnjenja za wužywanje

Wšykne połne teksty dolnoserbskeje digitalneje biblioteki stoje – tak daloko ako njejo se to hynac wóznamjeniło – pód licencu Creative Commons (CC BY-SA 4.0) k dispoziciji a mógu se mimo wobgranicowanja wužywaś. Pśi dalšnem wužywanju tekstow dej se na to pokazaś, až Serbski institut jo stwóriśel elektroniskeje wersije, wušej togo dej se wužywaś samska licenca.

Cysta tekstowa wersija jadneje twóŕby njejo wót pódaneje licence pótrjefjona. To groni: Wersija z lutnym tekstom twóŕby (mimo anotacijow XMLowych abo HTMLowych wersijow) móžo se w zmysle zjawnego wobsejźeństwa (public domain) wužywaś mimo kuždegožkuli wobgranicowanja.

Wuwiśe boka

2022-01-31
spśistupnjenje prědneje wersije w interneśe