Skaitmeninė lingvistika (LFL3028)

  • Dalyko kodas: LFL 3028
  • Dalyko grupė: C
  • Apimtis ECTS kreditais: 4
  • Pavadinimas anglų kalba: Digital Linguistics
  • Dalykas atestuotas: 2020-05-07
  • Atestacija galioja iki: 2023-05-07
  • Dalyko aprašo rengėjas(-ai):

    Prof. habil. dr. Rūta Petrauskaitė, doc. dr. Andrius Utka, dr. Loic Boizou, Vytautas Ožeraitis, Lituanistikos katedra

Dalyko anotacija lietuvių kalba

Šis dalykas skirtas studentams filologams. Per paskaitas studentai supažindinami su kalbinių išteklių tvarkymu, kalbine programine įranga bei jos veikimo principais, paprastais programų algoritmais ir programavimu. Studentai, gebės tvarkyti kalbos duomenis, naudoti ir taikyti kalbinę programinę įrangą, taip pat kurti paprastas programas, kurios padės atlikti tyrimus ir analizuoti tekstus ar tekstynus. Praktinių užsiėmimų metu, studentai išmoks savarankiškai pritaikyti įvairius įrankius teksto analizei (pvz., konkordansams, dažniniams sąrašams sudaryti, teksto pakeitimams daryti).

Dalyko anotacija užsienio kalba

This course is an introduction to processing of language resources, language software, simple algorithms and computer programming aimed at linguists. It should enable students to manage language data, to use and apply language software for analysing texts, as well as create simple computer programmes for texts and corpora analysis. During the course, students will learn how to apply various linguistic tools for text analysis, for creating word lists, concordancing, and making changes in texts.

Dalyko studijų rezultatai

1. Surasti arba rinkti kalbos duomenis.
2. Surasti tekste arba tekstynuose reikalingą kalbinę informaciją ir ją analizuoti naudojantis kalbiniais programavimo įrankiais.
3. Dirbti su kalbine programine įranga.
4. Išmanyti ir vartoti programavimo terminus.
5. Apdoroti tekstus naudojantis Python programavimo kalba.

Dalyko turinys

Kalbos duomenų rinkimo būdai. Duomenų saugojimo būdai. Pagrindiniai tekstynų lingvistikos terminai, operacijos su tekstynu. Teksto duomenų perkėlimo į skaitmeninę terpę būdai. Neanotuoto teksto apdorojimas. Teksto skaidymas žodžiais. Žodžių sąrašų sudarymas. Anotuoto teksto apdorojimas.
Programa, algoritmas, programos užrašymo būdai. Reguliariosios išraiškos. Kalbinės programinės įrangos panaudojimo būdai. Kalbinių duomenų grafinis atvaizdavimas.
Programavimo svarba tekstynų ir kompiuterinės lingvistikos tyrimuose. Programavimo Python kalba pagrindai. Pagrindiniai programavimo terminai. Programa, algoritmas, programos užrašymo būdai. Įvedimas ir išvedimas. Kintamieji ir duomenų tipai. Masyvas, sąrašas, rinkinys, aibė kt.

Dalyko studijos valandomis

Paskaitos 30 val.
Seminarai 15 val.
Iš viso kontaktinio darbo val. 45 val.
Savarankiškas darbas 62 val.
Iš viso 107 val.

Studijų rezultatų vertinimas

Kolokviumas – 25 %, rašto darbas – 25 %, egzaminas – 50 % galutinio pažymio.

Literatūra

1. 2016 R. Fabrizio, P. Dusty, R. van Hattem, „Python: Journey From Novice to Expert“ http://search.ebscohost.com/login.aspx?direct
=true&AuthType=ip,url,uid&db
=e000xww&AN=1345207&site=ehost-live&custid=ns195314
Papildoma literatūra
1. 2006 „Programming Python: [powerful object-oriented programming]“ / Mark Lutz. VDU Švietimo akademijos biblioteka, ŠA bibliotekos fondas (C 41391)