Please use this identifier to cite or link to this item:https://hdl.handle.net/20.500.12259/32388
Type of publication: Straipsnis kitose duomenų bazėse / Article in other databases (S4)
Field of Science: Filologija / Philology (H004)
Author(s): Rimkutė, Erika;Kovalevskaitė, Jolanta;Daudaravičius, Vidas
Title: Daugiakalbių tekstynų naudojimas ir taikymas
Other Title: The usage and application of multilingual corpora
Is part of: Darbai ir dienos. Kaunas : Vytauto Didžiojo universitetas, 45 (2006)
Extent: p. 41-62
Date: 2006
Keywords: Tekstynai;Daugiakalbiai tekstynai
Abstract: Straipsnyje aprašyti daugiakalbių tekstynų tipai, jų sudarymo principai, lygiagretinimo programos, tų tekstynų naudojimo ir taikymo sritys. Išsamiau aprašytas Vytauto Didžiojo universiteto Kompiuterinės lingvistikos centre sudaryti lygiagretieji tekstynai, jų pritaikymo galimybės, naudojama lygiagretinimo programa. Daugiakalbiai tekstynai suteikia galimybę tyrinėti tarpkalbinius dalykus palyginant tam tikrą kalbos reiškinį dviejose ar daugiau kalbų. Daugiakalbiai tekstynai gali būti palyginamieji ir lygiagretieji. Pastarieji gali būti vienakrypčiai ir dvikrypčiai. Lygiagrečiuosius tekstynus sudaro originalo ir vertimo tekstai, sulygiuoti papastraipiui ar pasakiniui. Šie tekstynai dažniausiai naudojami vertimų studijose. Lygiagretieji tekstynai gali būti dvikalbiai ir daugiakalbiai. Palyginamieji tekstynai gali būti sudaryti iš panašios tematikos verstų ir neverstų tos pačios kalbos tekstų arba iš panašios tematikos verstų ir neverstų skirtingų kalbų tekstų. Šie tekstynai taikomi vertimo atitikmenims rinkti, terminų ar kitokių leksinių vienetui vartosenai tirti, kalboje atsispindinčiai kultūrai tyrinėti. Tekstai lygiagretinami naudojant specialias programas. Jos paprastai remiasi statistiniais metodais. Lygiagretinimo procesas dažniausiai sudarytas iš trijų etapų: lygiagretinimo pastraipų, sakinių ir žodžių ar frazių lygmeniu. Daugiakalbiai tekstynai naudojami kalboms mokyti(s), vertimo atitikmenims gauti, kalboms lyginti, įvertinant ir kuriant automatinio vertimo sistemas
The main point of the paper is to introduce multilingual corpora as useful and powerful tools for translation research. The paper describes main types of multilingual corpora, principles of compilation, automatic alignment programs and application of corpora. Many researches point the advantages of multilingual corpora for various monolingual and multilingual linguistic analyses, while the practice of multilingual corpora in Lithuanian translation studies is still a new field of research. This paper gives an introduction to the most important steps in the process of compiling the multilingual corpus in the Centre of Computational Linguistics at Vytautas Magnus University. The online corpus consists of 3 parts: English-Lithuanian parallel corpus (this part contains 6.768 parallel sentences) and Czech- Lithuanian (4.1881 parallel sentences), Lithuanian- Czech (693 parallel sentences) parallel corpus. We introduce the development of software and search possibilities of this corpus. The article exemplifies the usage of the multilingual corpus and contrasts that to the usage of traditional bilingual dictionaries. This corpus is still being developed, and the most recent extensions, such as adding more languages and other text types, are presented in this paper
Internet: https://eltalpykla.vdu.lt/1/32388
https://www.vdu.lt/cris/bitstream/20.500.12259/32388/1/ISSN2335-8769_2006_N_45.PG_41-62.pdf
https://hdl.handle.net/20.500.12259/32388
Affiliation(s): Vytauto Didžiojo universitetas
Appears in Collections:Darbai ir dienos / Deeds and Days 2006, nr. 45
Universiteto mokslo publikacijos / University Research Publications

Files in This Item:
marc.xml12.81 kBXMLView/Open

MARC21 XML metadata

Show full item record

Page view(s)

50
checked on Sep 12, 2019

Download(s)

50
checked on Sep 12, 2019

Google ScholarTM

Check


Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.