Vytautas Magnus University Research Management System (VDU CRIS)





3. Mokslo žurnalai / Research Journals

Permanent URI for this communityhttps://hdl.handle.net/20.500.12259/261291

Browse

Search Results

Now showing1 - 2 of 2
  • Item type:Publication,
    Lietuvių kalbos diskurso žymikliai ir jų ryšiai daugiakalbiame tekstyne
    [Lithuanian discourse markers and their relations in a multilingual corpus]
    research article[2023][S4][H004]
    Oleškevičienė Valūnaitė, Giedrė
    ;
    ;
    Gulbinskienė, Dalia
    Darnioji daugiakalbystė / Sustainable Multilingualism, 2023, no. 22, p. 258-272

    Diskurso ryšiais anotuotų tekstynų kūrimas ir tyrimai yra gana nauja sritis, todėl Lietuvos mokslininkai siekia papildyti esamus tekstynų resursus ir ieško būdų, kaip būtų galima tyrinėti diskurso ryšius siejant ir lyginant juos su kitomis kalbomis, nes tam tikrais atvejais skirtingose kalbose diskurso ryšiai realizuojami skirtingomis kalbinėmis priemonėmis. Šio straipsnio tikslas – remiantis užsienio mokslininkų patirtimi pristatyti lietuvių kalbos diskurso žymiklių ir ryšių anotavimą daugiakalbiame tekstyne ir aptarti diskurso žymiklių vertimo tyrimų gaires, verčiant iš anglų kalbos į lietuvių kalbą. Todėl pirmiausia aptariamos diskurso ryšių ir juos išreiškiančių diskurso žymiklių raiškos galimybės lietuvių ir anglų kalbose, atskleidžiami galimi vertėjų pasirinkimai atsižvelgiant į diskurso ryšius vertime ir skirtingų kalbinių priemonių vartojimą pusiau paruoštoje monologinėje kalboje. Straipsnyje pristatomas lygiagretusis daugiakalbis tekstynas TED MBD (angl. Multilingual discourse-annotated corpus), kuris yra anotuotas diskurso lygmeniu, laikantis PDTB (angl. Penn Discourse Treebank) diskurso anotavimo tikslų ir principų. Straipsnyje išsamiai aptariama PDTB diskurso žymiklių anotavimo sistema, skaitytojas supažindinamas su diskurso ryšių reikšmių hierarchija, anotavimo principais ir PDTB schemos taikymo įžvalgomis. Taip pat aprašomi lietuviškosios tekstyno dalies anotavimo principai, pritaikyti laikantis PDTB diskurso anotavimo taisyklių; aptariami pirmieji rezultatai, susiję su diskurso ryšių raiška ir diskurso žymiklių vartojimu. Straipsnyje taip pat pristatomos pirmosios tyrimų gairės, kaip galima palyginti diskurso ryšiais anotuotus lietuviškus ir angliškus tekstus, siekiant suprasti vertimo tendencijas diskurso lygmeniu.

      13Scopus© Citations 1
  • Item type:Publication,
    Intonuoto garsyno kūrimo principai
    [Principles of development of the intonational annotated spoken corpus]
    research article[2013][S4][H004][10]
    ;
    Žmogus ir žodis / Man and the Word, 2013, vol. 15, no. 1, p. 101-110

    The language manifests itself in both spoken and v^ritten forms. Spoken and written language forms are different in many linguistic respects and in the methods and tools they are acquired and analyzed. Intonation is one ofthe most important phenomena of a spoken language. It comprises the segmentation of speech into meaningful units, emphasis of key words, fiuctuation in speech tempo, expression of emotions. Intonation is poorly represented by word orthography and thus poses many problems for intonation researchers. Specially prepared intonational speech corpus is a prerequisite for any serious intonation research. The process of compiling speech corpus can be divided into a few steps: a) acquisition and recording of prosody-rich utterances of spoken language b) description ofthe content of these utterances and utterance markup with tags that describe prosodie features e) automatically assigning timings to prosodie features (as a result of phone level annotation of intonational speech corpus). Every step in this process requires certain procedures to be observed and certain requirements to be met. Linguists of the world have built more than one intonational corpus, some common methodologies have been developed (this allows intonational features of different languages to be compared). This paper describes and discusses the process of building intonational annotated speech corpus of Lithuanian: tagging and labeling linguistic end extra-linguistic phenomena, cliticization, markup of phrase and sentence boundaries, determining and labeling logical stress, mark-up of fundamental frequency.

      16  70