Natūralios kalbos apdorojimo metodai

  • Dalyko kodas: LKB 5010
  • Apimtis ECTS kreditais: 6
  • Pavadinimas anglų kalba: Methods in Natural Language Processing
  • Dalyko aprašo rengėjas(-ai):

    Doc. dr. Andrius Utka, Lietuvių kalbos katedra

Dalyko anotacija lietuvių kalba

Šiuo dalyku siekiama supažindinti studentus su natūraliosios kalbos apdorojimo empiriniais metodais. Šio kurso metu studentams bus pristatytos įvairios natūralios kalbos apdorojimo priemonių savybės ir jų veikimo mechanizmai, pvz., segmentavimas, morfologinis anotavimas, automatizuoto vertimo priemonės, tekstų klasifikavimas. Bus aiškinama, kaip pasirinkti tinkamus natūralios kalbos apdorojimo priemonių įrankius įvairiems lingvistiniams tyrimams ir uždaviniams, savarankiškai juos naudoti, sieti teoriją su praktika, tinkamai panaudoti informaciją iš interneto ir duomenų bazių.

Dalyko anotacija užsienio kalba

This course is an introduction to data-driven methods applied to natural language processing. The emphasis is on methods, but we will survey applications such as segmentation, morphological annotation, computer-assisted translation, information extraction etc. It will be explained how to select tools of natural language processing for various linguistic research projects and tasks, how to apply them and relate theory and practice, how correctly to use information from internet and data bases.

Dalyko studijų rezultatai

1. Susipažinti ir išmokti naudotis su natūralios kalbos apdorojimo ir automatizuoto vertimo priemonėmis.
2. Išmokti kaupti tekstynus, leksines, terminų ir vertimo atminčių duomenų bazes.
3. Susipažinti su pagrindiniais automatizuoto vertimo principais, juos taikyti ir vertinti.
4. Pristatyti, kokiose lingvistinėse duomenų bazėse galima rasti informacijos, kuri yra naudinga atliekant lingvistinius tyrimus bei verčiant tekstus ar terminus.
5. Kritiškai įvertinti savo ir kitų tyrimus.

Dalyko turinys

Leksinė analizė ir segmentavimas.
Morfologinė analizė.
Žodžių junginių ir kolokacijų atpažinimas.
Vertimo atmintys ir terminologijos valdymo sistemos.
Tekstynai ir tekstynų analizės priemonės.
Įvardytųjų esybių nustatymas.
Vertimo atmintys ir terminologijos valdymo sistemos.
Tekstynai ir tekstynų analizės priemonės.

Dalyko studijos valandomis

Paskaitos (P) 30 val.
Seminarai (S) 15 val.
Darbas grupėse 15 val.
Savarankiškas darbas 102 val.
Iš viso 162 val.

Studijų rezultatų vertinimas

Testavimas, pristatymo vertinimas, tyrimo analizė.

Literatūra

1. 2004 Bolshakov I. A., Gelbukh A. Computational Linguistics: Models, Resources, Application. Instituto politécnico nacional
2. 2002 Bowker L. Computer-aided Translation. University of Ottawa Press
3. 2006 Vertimų pasaulyje. Darbai ir Dienos 45. VDU leidykla
Papildoma literatūra
1. 2000 Tekstynų lingvistika. Darbai ir Dienos 24. VDU leidykla