Dabartinės lietuvių kalbos tekstynas: naujesnis, didesnis, inovatyvesnis

2224

Vytauto Didžiojo universiteto Kompiuterinės lingvistikos centras pristato naująją Dabartinės lietuvių kalbos tekstyno paieškos versiją. Tekstynas gali būti naudojamas ne tik kaip enciklopedinis arba kontekstinis žodynas, bet ir kaip praktinė lietuvių kalbos mokymo ar mokymosi priemonė, ieškantiems gausių autentiškos lietuvių kalbos pavyzdžių.

„Dabartinės lietuvių kalbos tekstynas – elektroninių tekstų bazė, kurią galima naudoti kalbinei, statistinei, sociologinei ar kitokiai kalbos vienetų vartosenos analizei. Plačias jo pritaikymo galimybes lemia tekstyno dydis, žanrų ir temų įvairovė. Tai visuotinai pripažintas įvairialypis duomenų šaltinis, kuriuo naudojasi įvairių sričių mokslininkai ir praktikai“, – teigia tekstynų lingvistikos Lietuvoje pradininkė prof. Rūta Marcinkevičienė.

Šis tekstynas yra didžiausias lietuvių kalbos tekstynas, kuriamas nuo 1992 m. Dabar internete prieinamą tekstyną sudaro beveik 136 mln. žodžių ir jis nuolat papildomas naujais tekstais. Dabartinės lietuvių kalbos tekstynas nuo kitų lietuvių kalbos tekstynų skiriasi tuo, kad yra bendrojo pobūdžio; į tekstyną įeina tiek sakytinės, tiek rašytinės kalbos tekstai. Maždaug du trečdalius tekstyno sudaro publicistika; apie trečdalį sudaro negrožinė (mokslinė, mokomoji, pažintinė, mokslo populiarinimo), grožinė (romanai, apysakos, novelės, dramos), administracinė literatūra ir sakytinės kalbos tekstai.

Tekstyne galima ieškoti konkrečių žodžių, žodžių formų, žodžių junginių, kurie pateikiami kontekste. Galima matyti, kokiuose šaltiniuose pavartoti ieškomi vienetai. Lyginant su ankstesniąja tekstyno paieškos versija, naujoji pranašesnė tuo, kad žodžių galima ieškoti pasirinkto laikotarpio, tam tikro autoriaus tekstuose.

Pagrindinė Kompiuterinės lingvistikos centro veiklos kryptis yra teksto ir garso skaitmeniniai tyrimai, kalbos išteklių ir technologijų kūrimas bei taikymas.

Tekstyno rengimą 1998–2005 m. rėmė Valstybinė lietuvių kalbos komisija, 2005–2008 m. Valstybinis mokslo ir studijų fondas.

Daugiau informacijos:
VDU Kompiuterinės lingvistikos centro vadovas, vienas iš tekstyno sudarytojų
Andrius Utka
Tel. 8 688 71853
El. paštas: a.utka@hmf.vdu.lt

Parašykite komentarą

El. pašto adresas nebus skelbiamas.

This site uses Akismet to reduce spam. Learn how your comment data is processed.