Please use this identifier to cite or link to this item:https://hdl.handle.net/20.500.12259/53848
Type of publication: Straipsnis Clarivate Analytics Web of Science ar/ir Scopus / Article in Clarivate Analytics Web of Science or / and Scopus (S1)
Field of Science: Filologija / Philology (H004)
Author(s): Dabašinskienė, Ineta;Kamandulytė, Laura
Title: Corpora of spoken Lithuanian
Other Title: Leedu suulise keele korpused
Is part of: Eesti Rakenduslingvistika Ühingu aastaraamat = Estonian papers in applied linguistics. Tallinn : Eesti Keele Sihtasutus, 5 (2009)
Extent: p. 67-77
Date: 2009
Keywords: Corpus of spoken language;Adult-directed speech (ADS);Child-directed speech (CDS);Child speech (CS);Grammatical annotation;Grammatical disambiguation;Lexicon
Abstract: Straipsnyje aptariama šnekamosios lietuvių kalbos tekstyno raida. Analitinėje tyrimo dalyje, atsižvelgiant į šaltinius, kurie išėjo duomenų rinkimo metu, transkripciją ir šifravimą, aptarti vaiko kalbos (monologo) ir suaugusiųjų pokalbių duomenys. Antrojoje straipsnio dalyje pristatoma duomenų analizė ir pateikiami preliminarūs rezultatai. Suaugusiems adresuotos, vaikams adresuotos kalbos ir vaikų kalbos duomenys yra analizuojami siekiant nustatyti kalbos dalių paplitimo dažnumą. Šnekamoji kalba yra palyginta su rašomąja kalba, kad būtų galima stebėti vartojimo tendencijas. Pagrindiniai skirtumai ir panašumai tarp šnekamosios kalbos įrašų taip pat yra aptarti. Lingvistiniu požiūriu šis preliminarus tyrimas, paremtas tekstyno duomenimis, parodė skirtumus tarp šnekamosios ir rašomosios kalbos, ypatingai kabos dalių paplitimo požiūriu. Siekiant atskleisti skirtingų šnekamosios kalbos įrašų ypatumus, išsamiau buvo analizuojama linksnio kategorija. Tam tikrų žodžių skirtingų linksnių formų paplitimo dažnumas atspindi lietuvių kalbos linksnio kategorijos prigimtį, t. y. kiekvieno linksnio žymėtumo laipsnį. Kita vertus, daiktavardžių semantika yra esminis faktorius, kuris veikia linksnių formų dažnumą. Dėl to tolimesnis linksnio kategorijos semantikos tyrimas yra būtinas, kad paaiškėtų sąsajos tarp formos ir reikšmės. Tolimesnis sisteminis šnekamosios kalbos tekstyno tyrimas suteiks daugiau galimybių identifikuoti, įvertinti, nustatyti ir pakeisti lietuvių kalbos raidą
The paper discusses the development of spoken Lithuanian corpora. In the analytical part longitudinal child language data as well as adult conversations are discussed in view of the issues that occurred during the period of data collection, transcription and coding. The data are transcribed and coded according to the requirements of CHILDES. The second part of the paper presents a corpus based analysis and provides preliminary results. The data of adult-directed speech, child-directed speech and child speech are analysed to reveal the frequency distribution of parts of speech. Spoken language is compared to written language in order to observe the tendencies of usage. The main differences and similarities within the spoken language registers are discussed as well
Internet: http://arhiiv.rakenduslingvistika.ee/ajakirjad/index.php/aastaraamat/article/view/ERYa5.05/89
http://arhiiv.rakenduslingvistika.ee/ajakirjad/index.php/aastaraamat/article/view/ERYa5.05/89
Affiliation(s): Humanitarinių mokslų fakultetas
Vytauto Didžiojo universitetas
Appears in Collections:Universiteto mokslo publikacijos / University Research Publications

Files in This Item:
marc.xml12.2 kBXMLView/Open

MARC21 XML metadata

Show full item record

Page view(s)

124
checked on Sep 5, 2019

Download(s)

6
checked on Sep 5, 2019

Google ScholarTM

Check


Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.