nova beseda iz Slovenije

DELO, leto 1998, poved v sobesedilu:

Ker je predhodno oblikoslovno označenje besedila (angl. tagging) zaradi velikega števila istozvočnic v slovenščini zelo zamudno, je najbolje, da programi, ki iščejo konkordance v slovenščini, pravilno obliko vsake besede (vrsto, spol, sklon, čas itd.) v besedilu določijo, kot pravimo, kar »v preletu« - to je, med samo obdelavo teksta. S tem dosežemo dvoje: prvič, izognemo se zamudni »ročni« predobdelavi besedila in drugič, morebitne dvopomenske konkordance, ki jih računalnik ne zmore ločiti, so vse zbrane na enem samem mestu skupaj s celovitim besedilom izbrane konkordančne širine in z oznako mesta na katerem se v izvirnem besedilu nahajajo.

Če vemo, da ima vsaka samostalniška beseda 18 oblik (za 6 sklonov v vsakem od treh časov), vsaka pridevniška pa še trikrat toliko (54 oblik - po 18 za vsako od treh osebnih oblik) in da o raznolikosti glagolskih oblik sploh ne govorim, potem si lahko mislimo, kaj pomeni za vsako besedo teksta, pregledati cel besednjak, ki vsebuje okoli 160.000 gesel ali nekaj čez 6 milijonov besednih oblik.



  Nova poizvedba      Pripombe      Na vrh strani


Strežnik Inštituta za slov. jezik Fr. Ramovša ZRC SAZU Iskalnik: NEVA