Dolnoserbski tekstowy korpus

(Komfortne pytanje w nowem korpusu)

Pokazki

Powšykne informacije

Komfortne pytanje jo mócny a lažko pśistupny rěd, kótaryž pśewzejo za zajmowany lajski a interdisciplinarny fachowy publikum formulěrowanje kompleksnych wótpšašowanjow a dowólujo stakim wobšyrne rešerše w dolnoserbskich tekstach z pomocu jadnorych pytańskich wurazow. Stakim njejsu notne dokradne znaśa pšawopisneje wšakorakosći wósebnje staršych tekstow (ortografiska warianca) a młogorakosći formow dolnoserbskich słow (morfologiska paradigma) kaž teke techniskego formulěrowanja wótpšašowanjow (regularne wuraze).

Ze źěłow cełkownego Dolnoserbskego tekstowego korpusa jo se specielnje za toś tu móžnosć rešeršěrowanja zestajił a intensiwnje spśigótował nowy korpus, kótaryž wopśimjejo pismojstwo we wobměrje tuchylu něźi 18 milionow tokenow (běžecych słownych formow) a kótaregož tekstowa baza se sukcesiwnje rozšyrja.

Spěchowane ze srědkami Ministaŕstwa za wědomnosć, slěźenje a kulturu kraja Bramborskeje.

Wužywanje

Korpusowe teksty za komfortne pytanje su se tak wobźěłali, až wopśimjeju informacije wó zakładnych formach (lemach) a wó aktualizěrowanem pšawopisu (normalizěrowanje) w nich wustupujucych słow (tokenow).

Pytanje za wón (normalizěrowana zakładna forma) namakajo stakim teke wuslědki za won, njen, jogo, jomu atd.

Pytanje za won (zestarjeta forma tokena) namakajo won, njenamakajo pak wuslědki za wón.

Pytanje za jomu (normalizěrowana forma tokena) namakajo jomu, njenamakajo pak wuslědki za wón, jogo atd.

Nejwobšyrnjejše pytanje póbitujo stakim pytanje za lemami (zakładnymi formami słowa w aktualnem pisanju). Źož dowólijo w teksće dokłaźona forma wěcej interpretacijow (homonymija), źož móžo se wóna pótakem mašinelnje slědk wjasć na wšake zakładne formy, su wšykne potencielne zakładne formy zapisane, rowno až móžo za konkretne słowo stawnje jano jadna zakładna forma korektna byś.

Pytanje za lětaś producěrujo toś teke take wuslědki typa lěta, w kótarychž jo z konteksta póznaś, až jadna se pla lěta wó dekliněrowanu formu substantiwowu lět abo lěto.

Za slědom słow (kolokaciju) móžo se pytaś z tym, až zwězuju se jadnotliwe pytańske wuraze z proznotami.

Pytanje za wón byś generěrujo na pśikład wuslědki ako jomu było.

Pó standarźe pyta se w cełem korpusu. W pytańskich nastajenjach pak jo móžno, pytanje na wěste źělne korpuse wobgranicowaś. Zestajenje pódkorpusow namakajośo pód dypkom Žrědła.

Póchada-lic korpusowy dokład z teksta, za kótaryž dajo teke cytaŕsku wersiju, pokazujo se na pšawem boce dokłada symbol . Pśez kliknjenje na ten symbol wócynijo se cytaŕska wersija w Dolnoserbskej digitalnej bibliotece.