Keeleminutid. Mida korpusest saab ja mida ei saa

-

Keelekorpusteks nimetatakse suuri tekstikogumeid, mida kasutatakse keele uurimiseks ja keeletehnoloogia arendamiseks. Tänapäeval on nende maht eesti keeles juba miljardeid sõnu, mõnes keeles lausa sadu miljardeid. Seda on palju rohkem, kui üks inimene oma elu jooksul lugeda ja kuulata jõuab. Mida neist siis leida võib? Ja kas on asju, mida väga tahaks sealt leida, aga ei leia, küsis EKI direktor Arvi Tavast “Keeleminutises”.

Täismahus link: err.ee

Exit mobile version