Vilkaitė-Lozdienė, Laura |
Lietuvių kalbos pastoviųjų žodžių junginių (PŽJ) duomenų bazė nuo 2019 m. prieinama internete https://resursai.pastovu.vdu.lt/paieska/paprastoji. Joje pateikti dvižodžiai ir trižodžiai PŽJ, nustatyti iš DELFI.lt tekstyno (https://klc.vdu.lt/pastovuSearch.html). Jame pateikti įvairios tematikos žiniasklaidos tekstai. Pirmiausia 12000 PŽJ (daugiausia kolokacijos, šiek tiek yra frazeologizmų) buvo įtraukta į duomenų bazę. 2022 m. bazė atnaujinta ir papildyta naujomis DELFI.lt tekstyne nustatytomis arbitraliosiomis kolokacijomis; taip pat atsirado galimybė išsifiltruoti arbitraliąsias kolokacijas. Iš maždaug 19000 kolokacijų apie 9000 yra arbitraliųjų kolokacijų, t. y. kolokacijų, kurioms būdingi leksiniai apribojimai. Duomenų bazėje pateikiama išsami informacija apie kolokacijas: lema, kaitybinės formos, dažnumas (DELFI.lt tekstyne), morfologinė informacija, sintaksiniai ryšiai, gramatiniai variantai, pavyzdžiai. Taip pat pateikiama informacija apie tai, ar keičiasi žodžių tvarka, ar tarp kolokacijos dėmenų gali įsiterpti kitų žodžių.
The Database of Lithuanian multiword expressions (MWEs) is freely accessible for online search at: https://resursai.pastovu.vdu.lt/paieska/paprastoji from 2019. It contains two-word and three-word MWEs extracted from the DELFI.lt corpus representing news texts on the various topics (https://klc.vdu.lt/pastovuSearch.html). First, 12,000 MWEs (mostly collocations, a few idioms) were included in the database. In 2022, the database was updated adding new collocations from the same corpus and filtering arbitrary collocations: out of appr. 19,000 collocations appr. 9000 are marked as arbitrary collocations, i.e., having lexical collocability restrictions. The database provides rich information about the usage of collocations: lemma, word forms, frequencies (in the DELFI.lt corpus), morphological information, syntactic relations, grammatical variants, text genres, and usage examples. Usage variation cases are also illustrated, for example, word order changes or insertions between collocation constituents.