Tai, kas tinka žmogui, netinka mašininiam vertimui : žodynų problema
Date |
---|
2008 |
Iki šiol lietuvių leksikografai rūpinosi, kaip sudaryti žodynus, kad būtų patenkinti žmonių poreikiai. Tačiau žmonėms skirti tradiciniai žodynai sunkiai pritaikomi kuriant kalbos apdorojimo programas, nes neužtenka tik perkelti popierinius ar elektroninius žodynus į mašininio vertimo (MV) sistemą (plačiau apie MV žr. GK 2007 9 3–10 ir GK 2007 10 11–19). MV žodynų rengimas yra viena iš sunkiausių užduočių iš dalies dėl to, kad nėra aiškių standartų, kaip juos rengti (plačiau apie MV skirtų žodynų sudarymą žr. Gerber et al. 1997; Dillinger 2001). Žodynai laikomi viena iš silpniausių ir brangiausių visos MV sistemos dalių, o jų dydis ir kokybė turi didelę įtaką MV kokybei (Arnold 1995; Wood et al. 1987). MV leksikos klaidų atsiranda dėl dviejų priežasčių: 1) MV žodyne nėra verčiamo žodžio ir jo atitikmens; 2) pateikiama per daug verčiamo žodžio atitikmenų ir iš jų parenkamas netinkamas (Thurmair 2006). MV sistemų žodynams būtinas didesnis tikslumas, vienareikšmiškumas nei įprastiems žodynams: jeigu MV sistemai nebus pateikta aiškių taisyklių, kada vartotinas vienas, o kada kitas daugiareikšmio žodžio atitikmuo, netikslumų verčiant nebus išvengta. Sudarant žodynus MV sistemoms naudojamasi įvairiais šaltiniais: specialistų žiniomis, vienakalbiais ir daugiakalbiais tekstynais, tradiciniais spausdintais žodynais, įvairių tipų elektroniniais žodynais (Dillinger 2001). Šaltinių įvairovė padeda kuo tiksliau apibrėžti žodžio ar žodžių junginio leksinę aplinką ir reikšmių vartojimo aplinkybes. Straipsnyje rašoma, kuo ypatingi MV skirti žodynai, su kokiais sunkumais susiduriama juos sudarant.