Катедра за

Рачунарство и информатику

Група за језичке технологије

Група за језичке технологије бави се креирањем и одржавањем ресурса и алата за обраду српског језика. У својим приступима обједињује лингвистичка знања и статистичке анализе како би што боље и веродостојније одговорила на специфичности језика и домена примене. Међу расположивим ресурсима посебно треба издвојити електронски морфолошки речник (око 3,5 милиона облика речи), корпус савременог српског језика (око 122 милиона речи) и српски WordNet (приближно 21.000 синсетова), најпознатију семантичку мрежу. Ту су и паралелни корпуси енглеско-српског и француско-српског језика, а извесни напори се улажу и у креирање прве банке синтаксних стабала. Група активно ради на препознавању именованих ентитета и екстракцији информација из различитих домена, анализи сентимената, тематској класификацији, проналажењу и претраживању информација и машинском превођењу. У октобру 2024. године група ће прославити 45 година постојања. Током овог периода организовани су многобројни семинари, одржане су многе важне конференције и реализовани пројекти од међународног значаја. Група активно сарађује са колегама са Филолошког факултета, Рударско-геолошког факултета и Пољопривредног факултета Универзитета у Београду са којима је 2014. године основала Друштво за језичке технологије - JeRTeh.

Више информација о раду ове групе и JeRTeh друштва доступне су на адреси: