Statistika lingvistikoje
Dalyko anotacija lietuvių kalba
Dalykas skirtas išmokyti studentus šiuolaikinių statistinių metodų teorinių pagrindų ir praktinių jų taikymo įgūdžių. Po kurso baigimo studentai geba formuluoti statistines hipotezes apie skirtumus tarp populiacijų ir ryšius tarp kintamųjų, pasirinkti tinkamus statistinius metodus jų patikrinimui, patikrinti statistines hipotezes, atlikti tiesinę regresinę, klasterinę analizę naudojantis SPSS (Statistical Package for the Social Sciences), interpretuoti gautus rezultatus ir formuluoti išvadas.
Dalyko anotacija užsienio kalba
Būtinas pasirengimas dalyko studijoms
Matematikos pagrindai
Dalyko studijų rezultatai
1. Būti susipažinusiam su pagrindiniais tikimybiniais skirstiniais, mokėti apskaičiuoti aprašomosios statistikos charakteristikas, grafiškai pavaizduoti duomenis.
2. Formuluoti statistines hipotezes ir pasirinkti reikiamus metodus jų patikrinimui.
3. Taikyti parametrinius ir neparametrinius kriterijus hipotezėms apie skirtumus tarp populiacijų ir ryšius tarp kintamųjų nustatyti naudojant SPSS programinę įrangą, mokėti interpretuoti gautus rezultatus ir formuluoti išvadas.
4. Atlikti tiesinę regresinę analizę naudojant SPSS, mokėti interpretuoti gautus rezultatus ir formuluoti išvadas.
5. Atlikti klasterinę analizę naudojant SPSS programinę įrangą, mokėti interpretuoti gautus rezultatus ir formuluoti išvadas.
Dalyko turinys
Matavimo skalės. Aprašomoji statistika. Diskretieji ir tolydieji atsitiktiniai dydžiai. Tankio funkcija ir pasiskirstymo funkcija. Duomenų centro ir sklaidos matai. Diagrama-medis, skritulinė diagrama, histograma.
Statistinės hipotezės. Parametrinės ir neparametrinės hipotezės. Nulinė ir alternatyvioji hipotezės. I ir II rūšies klaidos. Reikšmingumo lygmuo. Galingumas.
Parametrinės hipotezės apie populiacijų vidurkius vienai ir dviems imtims: t kriterijus, porinis t kriterijus.
Hipotezės apie proporcijas vienai ir dviems imtims: binominis kriterijus, X2 kriterijus, tikslus Fišerio kriterijus.
Neparametrinės hipotezės apie populiacijų padėties skirtumus dviems imtims: Mano-Vitnio, Vilkoksono ženklų kriterijai.
Dispersinė analizė ANOVA. Vieno faktoriaus dispersinė analizė. Aprioriniai, post-hoc kriterijai. Dviejų faktorių dispersinė analizė. Kovariacinė analizė.
Tiesinė regresija. Daugiamatė tiesinė regresija. Tiesinės regresijos modelio prielaidos. Determinacijos koeficientas. Modelio suderinamumo kriterijus. Modelio koeficientai. Tiesinės regresijos lygtis
Klasterinė analizė. k-vidurkių metodas. Centrodai. Dviejų žingsnių klasterinė analizė.
Neparametrinės hipotezės apie populiacijų padėties skirtumus daugiau nei dviems imtims: Kruskalo-Voliso, medianos, Džonkerės-Terpstra, Frydmano kriterijai.
Nominalinių, ranginių ir santykių/intervalinių kintamųjų ryšio matai.
Dalyko studijos valandomis
Paskaitos 22,5 val., darbas grupėse 15 val., laboratoriniai darbai 22,5 val., studentų savarankiškas darbas 102 val.; iš viso 162 val.
Studijų rezultatų vertinimas
Kolokviumas – 30 %, laboratoriniai darbai – 20 %, egzaminas – 50 % galutinio pažymio.
Literatūra
Pagrindinė literatūra
V. Čekanavičius, G. Murauskas 2000: Statistika ir jos taikymai. I dalis. Vilnius: TEV.
V. Čekanavičius, G. Murauskas 2002: Statistika ir jos taikymai. II dalis. Vilnius: TEV.
R. H. Baayen 2007: Analyzing Linguistic Data. A practical introduction to statistics. Cambridge University Press. (http://www.ualberta.ca/~baayen/publications/baayenCUPstats.pdf)
Papildoma literatūra
A. Bakštys 2006: Statistika ir tikimybė. Vilnius: TEV.