Inštitut za slovenski jezik Frana Ramovša ZRC SAZU
Laboratorij za korpus slovenskega jezika

Besedne leme, oblikoslovne oznake in frekvence
v zbranih delih Cirila Kosmača

Primeri:telj- besede, ki vsebujejo niz "telj".
 fr>999- besede, ki imajo skupno frekvenco vsaj 1000.
 le=miza- beseda miza.
 oo=A* in le=b*- besede, ki se začnejo na b- in so tudi prislovi.
 le=*nik- besede, ki končajo na -nik.
 le=m???en- besede na m-, ki so dolge 6 črk in se končajo z -en.

V splošnem ima iskalni izraz obliko
operand   logični operator   operand   logični operator ..., kjer sta logična operatorja
           in, ta je lahko pisan tudi s simbolom & in
           ali, ki je lahko pisan tudi z vejico.
Najprej se izvrši in, potem ali, kadar pa želimo vrstni red izvajanja spremeniti, uporabimo oklepaje.

Operand ima obliko:   oznaka polja   relacijski operator   opis.

Relacijski operatorji so:
           :  vsebuje,
           !: ne vsebuje,
           =  je enako,
           != ni enako,
           <  manj kot,
           >  več kot,
           %< dolžina polja manjša kot,
           %= dolžina polja enaka,
           %> dolžina polja več kot.

Vsak zapis v zbirki ima tri podatkovna polja z naslednjimi oznakami:
           le  lema (osnovna besedna oblika)
           fr  frekvenca (skupno število pojavitev vseh besednih oblik te leme)
           oo  oblikoslovne oznake te leme (s frekvencami)

Iskalni izraz sme biti dolg do 74 znakov, število zadetkov pa je omejeno na 150.



Oblikoslovne oznake v besedilih je preverila Aleksandra Bizjak. Stran je bila postavljena 31. avgusta 2000 in nazadnje spremenjena 19. decembra 2011.

Naslov strani: http://bos.zrc-sazu.si/ckb.html                 Obiskov po 31.8.2000