Katedra za

Računarstvo i informatiku

Grupa za jezičke tehnologije

Grupa za jezičke tehnologije bavi se kreiranjem i održavanjem resursa i alata za obradu srpskog jezika. U svojim pristupima objedinjuje lingvistička znanja i statističke analize kako bi što bolje i verodostojnije odgovorila na specifičnosti jezika i domena primene. Među raspoloživim resursima posebno treba izdvojiti elektronski morfološki rečnik (oko 3,5 miliona oblika reči), korpus savremenog srpskog jezika (oko 122 miliona reči) i srpski WordNet (približno 21.000 sinsetova), najpoznatiju semantičku mrežu. Tu su i paralelni korpusi englesko-srpskog i francusko-srpskog jezika, a izvesni napori se ulažu i u kreiranje prve banke sintaksnih stabala. Grupa aktivno radi na prepoznavanju imenovanih entiteta i ekstrakciji informacija iz različitih domena, analizi sentimenata, tematskoj klasifikaciji, pronalaženju i pretraživanju informacija i mašinskom prevođenju. U oktobru 2024. godine grupa će proslaviti 45 godina postojanja. Tokom ovog perioda organizovani su mnogobrojni seminari, održane su mnoge važne konferencije i realizovani projekti od međunarodnog značaja. Grupa aktivno sarađuje sa kolegama sa Filološkog fakulteta, Rudarsko-geološkog fakulteta i Poljoprivrednog fakulteta Univerziteta u Beogradu sa kojima je 2014. godine osnovala Društvo za jezičke tehnologije - JeRTeh.

Više informacija o radu ove grupe i JeRTeh društva dostupne su na adresi: