Dabartinės lietuvių kalbos tekstyno žodžių sąrašas. Tekstyno struktūra. Patekstynis Žodžiai,m Proporcija: Grožinė literatūra 17,08 12,3%; Negrožinė literatūra 22,09 15,9%; Dokumentai 13,54 9,7%; Periodiniai leidiniai 85,80 61,7%; Sakytinė kalba 0,54 0,4%--- Iš viso 139,05 100%. Interneto svetainė: tekstynas.vdu.lt corpus.vdu.lt. Data: 2016-10-17 Metodas: > cat txt | tr ' ' '\ > ' | tr '[:upper:]' '[:lower:]' | tr -d ""[:punct:] | grep -v ""[^a-z] | grep -v ""^\s$"" | sort | uniq -c | sort -rn > freq-visas.txt Literatūros šaltiniai: Rimkutė E., Kovalevskaitė J., Melninkaitė V., Utka A., Vitkutė-Adžgauskienė D. 2010: Corpus of Contemporary Lithuanian Language – the Standardised Way. Proceedings of the Fourth International Conference Human Language Technologies – The Baltic Perspective, 154–160. Licence: CLARIN-LT PUB"
Wordlist of the Contemporary Corpus of Lithuanian language. Corpus Structure. Subcorpus Words,m Proportion: Fiction 17,08 12,3%; Non-fiction 22,09; 15,9% Documents; 13,54 9,7% Periodicals; 85,80 61,7%; Speech Corpus 0,54 0,4% --- Total 139,05 100%. Website: tekstynas.vdu.lt corpus.vdu.lt Date: 17/10/2016 Method: > cat txt | tr ' ' '\ > ' | tr '[:upper:]' '[:lower:]' | tr -d '[:punct:]' | grep -v '[^a-z]' | grep -v "^\s$" | sort | uniq -c | sort -rn > freq-visas.txt Reference Rimkutė E., Kovalevskaitė J., Melninkaitė V., Utka A., Vitkutė-Adžgauskienė D. 2010: Corpus of Contemporary Lithuanian Language – the Standardised Way. Proceedings of the Fourth International Conference Human Language Technologies – The Baltic Perspective, 154–160. Licence: CLARIN-LT PUB