Inštitut za slovenski jezik Frana Ramovša ZRC SAZU
Laboratorij za korpus slovenskega jezika

O'beseda - označena besedila z lemami

Konkordančnik
 
//zanimivost- vse pojavitve leme "zanimivost".
*neverjet*- besedne oblike vsebujejo niz "neverjet".
/Psd6- primeri pridevnikov srednjega spola v dvojini in mestniku
/Smp*/mož- samostalniki moškega spola v množini pri lemi "mož"
oblika/oznaka/lema- pojavitve kombinacij besednih oblik, oznak in lem
Oblikoslovne oznake
 
*sd*- oznake, ki vsebujejo srednji spol in dvojino.
PIZ*- oznake pridevnikov iz zemljepisnih imen
*- seznam vseh oblikoslovnih oznak
fr>2000- oblikoslovne oznake s pogostnostjo nad 2000
Leme
 
svetlob- vse pojavitve niza "svetlob" v lemah.
le=tabla- lema "tabla"
le=a*- leme na črko a-
fr>300- lema s pogostnostjo nad 300
Besedne oblike
 
bo=*ima- besedne oblike na "-ima"
bo=imenova*- besedne oblike na "imenova-"


        Oblikoslovno označena, lematizirana in preverjena besedilna zbirka obsega skupaj 1.300.000 besed:
  1. Zbrana dela Cirila Kosmača - 408.000 besed
  2. Tomo Križnar: O iskanju ljubezni - 132.000 besed
  3. George Orwell: 1984 - 91.000 besed
  4. Platon: Država - 93.000 besed
  5. Sveto pismo Nove zaveze - 149.000 besed
  6. Gustave Flaubert: Bouvard in Pécuchet - 86.000 besed
  7. Časopis DELO na internetu (vzorec iz leta 1997) - 52.000 besed
  8. Marko Uršič: Štirje časi - 171.000 besed
  9. Dobesedni zapis 29. redne seje DZ RS, zasedanje 1. 10. 2003 - 47.000 besed
  10. Časopis DELO za 3. 1. 2004 - 75.000 besed
        Iskalni izraz sme biti dolg do 74 znakov, število prikazanih zadetkov pa je omejeno na 5.000.



Stran je bila postavljena 12. decembra 2011 in nazadnje spremenjena 4. januarja 2012.

Naslov strani: http://bos.zrc-sazu.si/O_beseda.html