Katedra za

Računarstvo i informatiku

Grupa za jezičke tehnologije:

Grupa za jezičke tehnologije bavi se kreiranjem i održavanjem resursa i alata za obradu srpskog jezika. U svojim pristupima objedinjuje lingvistička znanja i statističke analize kako bi što bolje i verodostojnije odgovorila na specifičnosti jezika i domena primene. Među raspoloživim resursima posebno treba izdvojiti elektronski morfološki rečnik (oko 3,5 miliona oblika reči), korpus savremenog srpskog jezika (oko 122 miliona reči) i srpski WordNet (približno 21.000 sinsetova), najpoznatiju semantičku mrežu. Tu su i paralelni korpusi englesko-srpskog i francusko-srpskog jezika, a izvesni napori se ulažu i u kreiranje prve banke sintaksnih stabala. Grupa aktivno radi na prepoznavanju imenovanih entiteta i ekstrakciji informacija iz različitih domena, analizi sentimenata, tematskoj klasifikaciji, pretraživanju informacija i mašinskom prevođenju. U novembru prošle godine grupa je proslavila 35 godina postojanja. Tokom ovog perioda organizovani su mnogobrojni seminari, održane su mnoge važne konferencije i realizovani projekti od međunarodnog značaja. Grupa aktivno sarađuje sa kolegama sa Filološkog fakulteta, Rudarskog fakulteta i Poljoprivrednog fakulteta Univerziteta u Beogradu.

Neke informacije o radu ove grupe dostupne su na adresi