Please use this identifier to cite or link to this item:https://hdl.handle.net/20.500.12259/35939
Type of publication: Straipsnis kituose recenzuojamuose leidiniuose (S5);Article in other peer-reviewed editions (S5)
Field of Science: Filologija (H004);Philology (H004)
Author(s): Kamandulytė-Merfeldienė, Laura
Title: Sakytinės lietuvių kalbos tekstynas ‒ natūralios vartosenos tyrimų šaltinis
Other Title: The Corpus of spoken Lithuanian as a research source of natural usage
Is part of: Taikomoji kalbotyra: mokslo žurnalas [elektroninis išteklius]. Vilnius : Vilniaus universitetas, 2017, nr. 9
Extent: p. 176-198
Date: 2017
Keywords: Tekstynas;Sakytinė kalba;Spontaninė kalba;Morfologinis anotavimas;Lietuvių kalba;Corpus;Spoken language;Spontanous speech;Morphological annotation;Lithuanian
Abstract: Straipsnyje pristatomas Sakytinės lietuvių kalbos tekstynas, skirtas spontaninės ir parengtos kalbos analizei. Šiuo metu (2017 m.) Sakytinės lietuvių kalbos tekstyną sudaro 265 pokalbiai, apimantys daugiau nei 380 000 žodžių. Tekstynas yra subalansuotas ir apima pokalbius, kauptus atsižvelgiant į sakytinės kalbos pobūdį ir struktūrą, ryšį tarp pašnekovų, demografinius rodiklius, socialinius pašnekovų santykius. Straipsnyje išamiai aptariami šie kriterijai, aprašoma tekstyno struktūra ir jo kūrimo etapai (įrašų kaupimas, transkribavimas, gramatinis transkripcijų anotavimas), duomenų kaupimo ir skaitmeninimo metodika, taip pat aptariamos tekstyno panaudojimo natūralios vartosenos tyrimuose galimybės, trumpai pristatomi jau atlikti tekstyno duomenimis paremti tyrimai. Šiuo metu vykdant LMT finansuojamą projektą pagal Valstybinę lituanistinių tyrimų ir sklaidos 2016–2024 metų programą „Šiuolaikinė sakytinė lietuvių kalba: leksikos ir gramatikos tyrimas tekstynų lingvistikos metodu“ (LIP-085/2016) atliekami tekstyno analize paremti tyrimai, kuriama nauja internetinė prieiga. Tikimasi, kad 2018 m. vartotojams suteikus daugiau tekstyno duomenų analizės galimybių internete, sakytinės kalbos tyrimų padaugės ir jie apims įvairias leksikos ir gramatikos sritis
The article describes the Corpus of Spoken Lithuanian, its structure, compilation stages (collection of the recordings, transcription, and grammatical annotation), and the methodology of data collection and digitalization; in addition, it discusses the possibilities of corpus application in the research of natural language usage and the research, which has already been carried out, using the corpus data. At present (2017), the corpus, which is freely accessible for internet users, contains 226,174 word forms. The users of the online corpus version can perform search of a word or a word form and obtain data on the frequency of the form in the whole corpus or its part as well as see grammatical information about it. In 2016-2017, the Corpus of Spoken Lithuanian was supplemented by new data resulting from the implementation of the project “Contemporary Spoken Lithuanian: A Corpus-based Analysis of Grammar and Lexis” (LIP-085/2016) financed by the Research Council of Lithuania under the programme of the State Lithuanian Studies and Dissemination Programme for 2016–2024. The project will also create a new internet access, which will provide more possibilities for the users. The updated corpus consists of 256 conversations (383,587 words) produced by 1,086 speakers (659 females and 427 males), whose age ranges from 3 to 81 years. When developing the Corpus of Spoken Lithuanian, much attention was paid to its composition, i.e. the proportions of the corpus. In order to improve the universality and suitability of the corpus for a more varied analysis, the principle of a balanced corpus was maintained; therefore, several criteria were taken into consideration when collecting the data: the nature of spoken language (private vs public speech) and structure (dialogues vs polilogues), different communication situations (direct vs indirect (e.g. a telephone conversation), demographic indicators, and social relations among the interlocutors. [...]
Internet: https://hdl.handle.net/20.500.12259/35939
https://eltalpykla.vdu.lt/handle/1/35939
Affiliation(s): Humanitarinių mokslų fakultetas
Lituanistikos katedra
Vytauto Didžiojo universitetas
Appears in Collections:1. Straipsniai / Articles
Universiteto mokslo publikacijos / University Research Publications

Files in This Item:
marc.xml9.66 kBXMLView/Open

MARC21 XML metadata

Show full item record

Page view(s)

106
checked on Aug 15, 2019

Download(s)

24
checked on Aug 15, 2019

Google ScholarTM

Check


Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.