A corpus-based study of near-synonyms lawyer, attorney, solicitor, barrister and advocate
Gvazdauskis, Augustinas |
Nowadays, English is the most used language among people with different native tongues. Knowing the History of English, it is unsurprising to find millions of words in this language. Texts should be coherent and engaging while communicating with spoken or written language; this is not easy for anyone. This task becomes even more complicated if the language we are going to use is not our native, for example, English language for Lithuanians. To help achieve this challenging task, lexical elements like synonyms can be used. Synonyms help by making the text more coherent and engaging. The problem arises since there are many synonyms in English, and it is challenging to decide what word substitute by which. Information found in dictionaries is not always informative, and only relying on a dictionary can make some errors in using substitute words. Corpus is a collection of spoken or written texts stored on the internet, which can be used to search for information on any word. This research was written because of taking an interest in how much corpus can assist people in learning synonyms. Especially interest was taken in the nouns lawyer, , solicitor, barrister, and advocate. British National Corpus (BNC) was used with Corpus of Contemporary American English (COCA). These corpora were chosen because of their size and regional distinctions mentioned in the dictionary about these synonyms. This research aim was to do a corpus-based analysis of lawyer, attorney, solicitor, barrister, and advocate. To accomplish this aim, these research questions were used: to find out the differences in frequency and distribution across different genres between lawyer, attorney, solicitor, barrister, and advocate in BNC and COCA. The following research question aimed to analyze collocations and their patterns between lawyer, attorney, solicitor, barrister, and advocate in COCA and BNC. Distribution among different genres can help identify if a word is formal or informal. The next research question was to compare how much information differs from the dictionary to information analyzed from the corpus. Theoretical literature was reviewed that contained information about this research. The theory part reviewed synonym types, corpus definition, COCA, BNC, and corpus linguistics. Also, corpus tools found in only corpora were analyzed too. Previous research on synonyms was the last part of the theory part. After analyzing BNC and COCA corpora, the information was found about lawyer, attorney, solicitor, barrister, and advocate frequency and distribution among different genres. With that information degree of formality of the target nouns were deduced. The most frequent noun in BNC was solicitor; the following were lawyer, advocate, attorney, and barrister. The most frequent noun in COCA was attorney, followed by lawyer, advocate, solicitor, and barrister. In BNC, corpus lawyer was used more frequently in informal contexts such as spoken language and fiction, although he was found in formal contexts too. On the other hand, attorney was more frequent in the formal genre, such as newspaper and academic texts. Distribution seems similar between COCA and BNC of this noun. The noun solicitor was distributed evenly between different genres in BNC, but this noun was more frequent in the COCA corpus in a formal context. The noun barrister was more frequent in the formal context in BNC. Contrarily, in the COCA corpus, the noun appeared more frequently in informal contexts (tv/media). After analyzing collocations, many similarities were found, such as the same collocational patterns between the noun lawyer, attorney, solicitor, barrister, and advocate. After comparing Longman Dictionary Online with corpus analysis, the conclusion was made that corpus contains much more information. Employing corpora to find more information about language, in this case, lexical element synonyms, is advised.
Šiais laikais labiausiai naudojama kalba tarp kitataučių yra anglų. Žinant anglų kalbos istorijos nestebina, kad yra milijonai žodžių anglų kalboje. Kamunijuokant raštu ar žodžiu svarbu kad tekstas būtų rišlus ir įtraukiantis. Tai nėra lengva užduotis nei vienam žmogui. Šita užduotis tampa daug sunkesnė jeigu kalba kuria tau reikia pašnekėti, arba rašyti nėra tavo gimta kalba, pavyzdžiui Anglų kalba Lietuviams.Tam padėti gali leksiniai kalbos elementai vadinami sinonimai. Sinonimai padeda tekstą padaryti įdomesniu ir rišlesniu. Problema iškyla, nes Anglų kalboje sinonimų yra labai daug, ir sunku nuspęsti koki žodį pakeisti kokiu. Žodynuose šitos informacijos nėra tiek daug, ir kartais vien pasikliaudamas žodynu galima padaryti klaidų. Tekstynas yra vįsokiausių tekstų kolekcija elektroniniame formate, kurią galima naudoti ieškant informacijos apie betkurį žodį. Šitas darbas buvo parašytas dėl susidomėjimo kiek tekstynas gali suteikti informacijos apie sinonimus. Ypač susidomėjimas kilo lawyer, , solicitor, barrister ir advocate daiktvardžiais. British National Tekstynas (BNC) , kartu su American English (COCA) tekstynu buvo naudoti šitam darbui. Šitie tekstynai buvo pasirinkti dėl jų dydžio ir dėl to kad, pasižiūrėjus reikšmes žodyne buvo rasta informacija apie regioninius skirtumus tarp šitų sinonimų. Pagrindinis šito darbo tiklsas tekstynais paremta artimų sinonimų lawyer, attorney, solicitor, barrister ir advocate analizė. Tikslui pasiekti kelti tokie uždaviniai: išsiaškinti ant kiek skiriasi lawyer, attorney, solicitor, barrister ir advocate pasikartojimas bei jų pasiskirstymas tarp skirting žanrų (televizija, laikraščiai ir t.t) COCA ir BNC tekstynuose. Žodžių pasiskirstymas rodo kurie žodžiai yra labiau, ar mažiau naudojami. Pasiskirstymo analizė padeda nustatyti žodžio formalumą ir neformalumą. Buvo bandyta Išsiaiškinti kaip žodžių junginiai ‘collocations’ tarp veiksmažodžių ir būdvardžių skiriasi tarp šitų penkių daiktavardžių. Kita užduotis buvo palyginti ant kiek skirasi informacija gauta iš tekstynų lyginant su žodyno informacija. Buvo apžvelgta teorinė literatūra kuri buvo aktuali šitam darbui. Teorijoje buvo nagrinėjama sinonimai, jų rūšys, tekstynai, COCA, BNC, tekstyno lingvistika. Taip pat buvo nagrinėjami įrankiai randami elektroniniuose tekstynuose, bei kiti akademiniai darbai artimų sinonimų tema. Ištyrus BNC ir COCA tekstynus paiškejo lawyer, attorney, solicitor, barrister ir advocate sinonimų pasikartojimas, bei pasiskirstymas skirtnguose žanruose nustatant sinonimų formalumą ir neformalumą. BNC tekstyne labiausiai pasikartojantis daiktavardis buvo solicitor. Po jo sekė lawyer, advocate, attorney ir barrister. COCA tekstyne labiausiai pasikartojantis daiktavardis buvo attorney, po jo sekantys buvo lawyer, advocate, solicitor ir barrister. BNC tekstynuose lawyer dažniau yra naudojamas neformaliame kontekste kaip šnekamoji kalba, fantastinėse knyguose. Nors jis buvo randamas ir formaliuose žanruose. Priešingai attorney buvo labiau randamas formaliuose žanruose kaip laikraščiai bei moksliniai straipsniai. Pasiskirtymas panašus tiek COCA tiek BNC tekstyne. Solicitor daiktavardis buvo maždaug tolygiai pasiskirstęs tarp skirting žanrų BNC, priešingai COCA tekstyne labiau formaliame kontekste jis buvo dažnesnis. Barrister daiktavardis labiau buvo pastėbetas formaliame kontekste BNC, priešingai COCA tekstyne jis dažniau pasirodė neformaliame kontekste (televizija, kita žiniasklaida). Atlikus analizę žodžių junginiams collocations buvo atrasta daug panašamų tarp junginių bei jų pasikartojimas tarpusavy. Palyginus Longman English žodyną su tekstynų analizė buvo pastebėta kad tekstynuose informacijos apie sinonimus yra daug daugiau. Patariama naudotis tekstynus norint plačiau sužinoti apie kalbą, ypač leksinį kalbos elementą: sinonimus.