nova beseda iz Slovenije

DELO, leto 2002, poved v sobesedilu:



Zato pa smo ob boku govorcem svetovnih jezikov pri sestavljanju jezikovnih korpusov: na Inštitutu za slovenski jezik nastajata Nova beseda, zbirka 76 milijonov besed iz časopisja, slovenskega in prevedenega leposlovja, ter Beseda, zbirka 3 milijonov besed slovenskega leposlovja. Odlika slovenskega korpusa je, da je »očiščen smeti«, napačno napisanih besed - zato se pri nas ne bi moglo zgoditi kot v angleščini, kjer se v korpusu Bank of English pri iskanju »hte« (kar ni nič drugega kot zatipkani določni člen) izpiše 4000 zadetkov. Sicer pa v korpusih različnih jezikov ponavadi mrgoli lastnih imen, saj vrhunski športniki in druge slavne osebnosti ne poznajo jezikovnih meja in jih je najti tako v slovenskih kot v švedskih besedilih.



  Nova poizvedba      Pripombe      Na vrh strani


Strežnik Inštituta za slov. jezik Fr. Ramovša ZRC SAZU Iskalnik: NEVA