ТРОЈЦА МАКЕДОНСКИ СТУДЕНТИ ИМАА НАЈДОБАР ТРУД ЗА ВЕШТАЧКА ИНТЕЛИГЕНЦИЈА Прва отворена инфраструктура за развој на големи јазични модели и апликации
Стефан Крстески, Борјан Саздов и Матеа Ташковска, под менторство на професорите Бранислав Геразов и Христијан Ѓорески, со својот труд направија значаен придонес кон дигитализацијата и технолошкиот развој на македонскиот јазик и на вештачката интелигенција (ВИ) во Македонија.
Студенти и истражувачи од Факултетот за електротехника и информациски технологии (ФЕИТ) при Универзитетот „Кирил и Методиј“ освоија награда за најдобар научен труд со наслов „Towards Open Foundation Language Model and Corpus for Macedonian: A Low-Resource Language“ на меѓународната конференција „Slavic NLP Workshop“, одржана во рамки на 63 издание на една од најпрестижните светски конференции за обработка на јазик – ACL (Association for Computational Linguistics) во Виена, Австрија.
Стефан Крстески, Борјан Саздов и Матеа Ташковска, под менторство на професорите Бранислав Геразов и Христијан Ѓорески, со овој труд направија значаен придонес кон дигитализацијата и технолошкиот развој на македонскиот јазик и на вештачката интелигенција (ВИ) во Македонија.
Во рамки на истражувањето беа развиени четири клучни ресурси: голем јазичен ВИ модел (анг. LLM) специјализиран за македонски јазик најдобар во својата категорија – domestic-yak-8B, потоа најголемиот јавно достапен текстуален корпус за македонски јазик, множество инструкции на македонски јазик за развој на големи јазични модели и систем за евалуација на перформансите на јазичните модели на македонски јазик.
Овие ресурси се јавно достапни на веб-страницата www.lvstck.org и претставуваат прва отворена инфраструктура за развој на големи јазични модели и апликации базирани на вештачка интелигенција на македонски јазик. Овие ресурси може да се користат како основа за понатамошни истражувања, развој на македонски јазични алатки и нивна примена во различни сфери и апликации.
Овој успех претставува меѓународно признание за македонските истражувачи и чекор кон дигитална иднина во која македонскиот јазик добива поддршка и видливост во глобалниот развој на јазични технологии и вештачка интелигенција.
ACL е водечка глобална конференција во областа на обработка на природен јазик, со традиција од 63 години. „Slavic NLP“ Workshop, која оваа година го одбележа своето десетто издание, е посветена на истражувања од областа на обработка на сите словенски јазици.