Skaitmeniniai kalbos duomenys ir intelektinės technologijos

Tyrimų kryptys

Šio klasterio mokslininkų atliekami tyrimai, projektai ir publikacijos yra tarpdisciplininio pobūdžio, jungiantys lingvistų ir informatikų pajėgas, čia kryžiuojasi kompiuterinės lingvistikos, dirbtinio intelekto ir skaitmeninės humanitarikos temos. Klasteryje bendradarbiauja Humanitarinių mokslų fakulteto Kompiuterinės lingvistikos centro (https://klc.vdu.lt) ir Informatikos fakulteto (http://if.vdu.lt/) mokslininkai.

Klasterio moksliniai tyrimai būtini kalbai skaitmeninti ir lietuvių kalbos technologijoms kurti. Ryškiausios tyrimų kryptys: lietuvių kalbos terminologija ir pastoviųjų žodžių junginių analizė, lietuvių kalbos morfologijos ir sintaksės tyrimai, teksto analizė ir vertimas, lietuvių šnekos anotavimas ir atpažinimo tyrimai, lietuvių kalbos fonetinių ypatybių ir fonotaktikos tyrimai ir kt.

Vienas iš klasterio prioritetų yra kalbos duomenų ruošyba ir jų atviroji prieiga, nes daugeliui šiuolaikinių statistinių ir mašininio mokymosi tyrimų reikia daug kokybiškai parengtų kalbos duomenų. Kompiuterinės lingvistikos centras koordinuoja Lietuvos atstovavimą tarptautinėje mokslo infrastruktūroje CLARIN ERIC, tam tikslui įkurtas CLARIN-LT centras (https://clarin-lt.lt) ir mokslo ir studijų institucijų konsorciumas.  CLARIN-LT centras ir saugykla užtikrina lietuvių kalbos duomenų kūrimą ir atvėrimą.

Klasteryje vykdama intensyvi projektinė veikla. Daugelis klasteriui priklausančių mokslininkų dalyvavo vykdant tokius projektus kaip pirmasis anglų–lietuvių mašininis vertimas (IIVP, http://vertimas.vdu.lt), Resilience for Survivability (ReSIST), „Švietimo ir mokslo terminų automatinis identifikavimas (ŠIMTAI 2)“, „Lietuvių kalbos pastoviųjų junginių automatinis atpažinimas (PASTOVU)“, „Užsienio baltistikos centrų ir Lietuvos mokslo ir studijų institucijų bendradarbiavimo skatinimas“, SEMANTIKA, SEMANTIKA-2 ir daugelį kitų.

Klasterio nariai

Doktorantai

Apgintos daktaro disertacijos klasterio tematika

  • Danguolė Kalinauskaitė. Lietuvių kalbos tekstų informatyvumo nustatymas. Kaunas: VDU, 2019.
  • Danguolė Valančė. Pabrėžiamųjų dalelyčių funkcijos ir vartosena dabartinėje lietuvių rašytinėje kalboje. Kaunas: VDU, 2017.
  • Viltė Drūlienė. Lietuvių kalbos apibendrinamieji daiktavardžiai: leksinė reikšmė ir pragmatinės funkcijos. Kaunas: VDU, 2014.
  • Vidas Daudaravičius. Teksto skaidymas pastoviųjų junginių segmentais. Kaunas: VDU, 2013.
  • Jolanta Kovalevskaitė. Lietuvių kalbos samplaikos. Kaunas: VDU, 2012.
  • Giedrius Norkevičius. Garsų trukmių modelių kūrimo metodas,naudojant didelės apimties daugelio kalbėtojų garsyną. Kaunas: VDU, 2011.
  • Agnė Bielinskienė. Sujungiamojo ryšio semantika, pragmatika ir vartosenos ypatumai. Kaunas: VDU, 2010.
  • Erika Rimkutė. Morfologinio daugiareikšmingumo ribojimas kompiuteriniame tekstyne. Kaunas: VDU, 2006.