Statistika lingvistikoje

  • Dalyko kodas: LKK 6002
  • Apimtis ECTS kreditais: 6
  • Pavadinimas anglų kalba: Statistics for Linguistics
  • Dalyko aprašo rengėjas(-ai):

    Doc. dr. Aušra Saudargienė, Taikomosios informatikos katedra

Dalyko anotacija lietuvių kalba

Dalykas skirtas išmokyti studentus šiuolaikinių statistinių metodų teorinių pagrindų ir praktinių jų taikymo įgūdžių. Po kurso baigimo studentai geba formuluoti statistines hipotezes apie skirtumus tarp populiacijų ir ryšius tarp kintamųjų, pasirinkti tinkamus statistinius metodus jų patikrinimui, patikrinti statistines hipotezes, atlikti tiesinę regresinę, klasterinę analizę naudojantis SPSS (Statistical Package for the Social Sciences), interpretuoti gautus rezultatus ir formuluoti išvadas.

Dalyko anotacija užsienio kalba

The course provides students with theoretical and practical basis of statistical methods applied in linguistics. After completion of the course students will be able to formulate statistical hypothesis and perform hypothesis testing on differences between the populations and relationships among the variables, perform linear regression analysis, cluster analysis using SPSS (Statistical Package for the Social Sciences), interpret the results obtained and formulate conclusions.

Būtinas pasirengimas dalyko studijoms

Matematikos pagrindai

Dalyko studijų rezultatai

1. Būti susipažinusiam su pagrindiniais tikimybiniais skirstiniais, mokėti apskaičiuoti aprašomosios statistikos charakteristikas, grafiškai pavaizduoti duomenis.
2. Formuluoti statistines hipotezes ir pasirinkti reikiamus metodus jų patikrinimui.
3. Taikyti parametrinius ir neparametrinius kriterijus hipotezėms apie skirtumus tarp populiacijų ir ryšius tarp kintamųjų nustatyti naudojant SPSS programinę įrangą, mokėti interpretuoti gautus rezultatus ir formuluoti išvadas.
4. Atlikti tiesinę regresinę analizę naudojant SPSS, mokėti interpretuoti gautus rezultatus ir formuluoti išvadas.
5. Atlikti klasterinę analizę naudojant SPSS programinę įrangą, mokėti interpretuoti gautus rezultatus ir formuluoti išvadas.

Dalyko turinys

Matavimo skalės. Aprašomoji statistika. Diskretieji ir tolydieji atsitiktiniai dydžiai. Tankio funkcija ir pasiskirstymo funkcija. Duomenų centro ir sklaidos matai. Diagrama-medis, skritulinė diagrama, histograma.
Statistinės hipotezės. Parametrinės ir neparametrinės hipotezės. Nulinė ir alternatyvioji hipotezės. I ir II rūšies klaidos. Reikšmingumo lygmuo. Galingumas.
Parametrinės hipotezės apie populiacijų vidurkius vienai ir dviems imtims: t kriterijus, porinis t kriterijus.
Hipotezės apie proporcijas vienai ir dviems imtims: binominis kriterijus, X2 kriterijus, tikslus Fišerio kriterijus.
Neparametrinės hipotezės apie populiacijų padėties skirtumus dviems imtims: Mano-Vitnio, Vilkoksono ženklų kriterijai.
Dispersinė analizė ANOVA. Vieno faktoriaus dispersinė analizė. Aprioriniai,  post-hoc kriterijai. Dviejų faktorių dispersinė analizė. Kovariacinė analizė.
Tiesinė regresija. Daugiamatė tiesinė regresija. Tiesinės regresijos modelio prielaidos. Determinacijos koeficientas. Modelio suderinamumo kriterijus. Modelio koeficientai. Tiesinės regresijos lygtis
Klasterinė analizė. k-vidurkių metodas. Centrodai. Dviejų žingsnių klasterinė analizė.
Neparametrinės hipotezės apie populiacijų padėties skirtumus daugiau nei dviems imtims: Kruskalo-Voliso, medianos, Džonkerės-Terpstra, Frydmano kriterijai.
Nominalinių, ranginių ir santykių/intervalinių kintamųjų ryšio matai.

Dalyko studijos valandomis

Paskaitos 22,5 val., darbas grupėse 15 val., laboratoriniai darbai 22,5 val., studentų savarankiškas darbas 102 val.; iš viso 162 val.

Studijų rezultatų vertinimas

Kolokviumas – 30 %, laboratoriniai darbai – 20 %, egzaminas – 50 % galutinio pažymio.

Literatūra

Pagrindinė literatūra
V. Čekanavičius, G. Murauskas 2000: Statistika ir jos taikymai. I dalis. Vilnius: TEV.
V. Čekanavičius, G. Murauskas 2002: Statistika ir jos taikymai. II dalis. Vilnius: TEV.
R. H. Baayen 2007: Analyzing Linguistic Data. A practical introduction to statistics. Cambridge University Press. (http://www.ualberta.ca/~baayen/publications/baayenCUPstats.pdf)
Papildoma literatūra
A. Bakštys 2006: Statistika ir tikimybė. Vilnius: TEV.