AntConc LinguTools
Вообичаени алатки за прибелешка и анализа на корпус во лингвистиката

Што е AntConc?
AntConc е алатка за согласување за пишани тела со која може релативно лесно да се извршат стандардни пребарувања за компјутерска анализа на корпус. Софтверот автоматски создава списоци со зборови (фреквенција на зборови) и статистика, на пример за односот помеѓу „токен“ и „типови“, со кои, меѓу другото, може да се испита и богатството на вокабуларот на текстот. Алатката го поддржува заедничкиот формат UTF-8 и дозволува пребарувања со редовни изрази. AntConc е дел од голем број други алатки за анализа на текстови (на пр. AntWordProfiler, AntGram, AntPConc или FireAnt).
Предности:
- едноставна, интуитивна операција
- јасни листи за согласност
- Сортиран хит-приказ
- Можни се пресметки на кластери и n-грама
- Можни се проценки со текстови обележани со ПОС и коментирани коментари
- Контрастивни анализи
- достапен за компјутер и Mac
- Видео упатства и помош
Недостаток:
- не е можно рачно прибелешка/транскрипција
- нема анализа на текст-слика
- само за корпорации до приближно 1,5 милиони токени
Започнување/сценарио за употреба:
Честопати, случајните набудувања во секојдневниот живот доведуваат до јазично интересно прашање. Овие можат да бидат видливи формулации, мода и табу зборови, но исто така и случаи на јазично сомневање. Користејќи го примерот на релативно новата категорија храна со супер храна од тековниот дискурс на исхраната, следново ги покажува можностите за јазична анализа на корпус со употреба на AntConc.
Евалуација:
Ако го внесете зборот супер храна во линијата за пребарување, најпрво ќе ги добиете сите хитови во погледот на согласноста. Големите и малите букви се земаат предвид само ако ознаката е поставена за „Случаи“. Со цел да се добие прв впечаток за јазичниот ко-текст, хитовите може да се сортираат и со помош на копчето „Сортирај“ (слика од екранот 1). Ако нема ознака покрај „Зборови“, барањето за пребарување не зема предвид никакви граници на зборови, затоа се наведени и множинската форма и различните соединенија, како што е прашокот за супер храна. Дискурзивните дебати со терминот суперхрана (7) и трендот за суперхрана (14) сега се наведени во прегледот на согласноста. Различна храна, како што е брокула (8) или гоџи бобинки (11), исто така, се чини дека е поврзана со клучниот збор.
Снимка на екранот 1: Центрирани согласности за поимот за пребарување „супер храна“
Атрибутите реални и егзотични, исто така, укажуваат на овие две области: прво, дискурзивно преговарано прашање за тоа што прават суперхраната во принцип и, второ, која храна е вклучена. За систематски список на придавски атрибути, прво мора да се создаде корпус обележан според деловите на говорот. Алатката AntTag го овозможува ова на едноставен начин. При конвертирање, мора да бидат избрани поставките за јазик „германски“ и варијантата за обележување „хоризонтална“ (не „вертикална“). Означениот документ автоматски се зачувува под оригиналниот txt документ. Ако сега ги вчитате сите ПОС-означени датотеки креирани на овој начин во AntConc, ќе добиете преглед на сите придавки атрибути кои веднаш го следат клучниот збор лево користејќи го барањето за пребарување „ADJA superfood“ (слика од екранот 2). Дискурсот, јазично видлив, се повикувања на оспорена предметна област во која јавно се дискутира за реалните или за реалните суперхрана. Самата дискурзивна надградба е исто така адресирана, на пример, преку докази за суперхрана од хип, нови и хип. Зуи зборови очигледно опишуваат разни производи во рамките на моменталната исхрана.
Снимка на екранот 2: Центрирани согласности за изразот за пребарување „супер храна“ со корпус означен со ПОС
Преглед на фреквенциите на зборовите може да се создаде релативно лесно под табулаторот „Список со зборови“ (слика од екранот 3). Таму, првите зборови за содржина се еднина форма супер храна (37), зборовни форми јадат (34) и здрава (40). Како што се очекуваше, има голем број на високофреквентни, помали зборови во горните ешалони, од определби до помошни глаголи, а високо се предлозите во и со.
Снимка на екранот 3: Список со зборови
Друга перспектива за проценка на методот управуван од корпус е пресметување на N грамови, што може да се изврши и со обележан и со неозначен корпус. Полето за внесување останува празно, десната ознака "N-грама" мора да биде поставена. Прегледот на големите (слика 4) дава индикација за клучниот англицизам на чистото јадење, а заедничката комбинација на зборови, исто така, покажува дека текстовите имаат тенденција да дефинираат кои видови супер храна се консумираат каде и како (слика на екранот 5 . Ако ја следите патеката на фразите воведени со, може да најдете предлог-вметнување специфично за дискурсот (екранот 6), во кој соодветната именка изразува што се смета за суперхрана:
Од семантичка гледна точка, суперхраната претставува збогатување.Овој нутритивно-физиолошки вишок се реализира морфолошки преку соединенија (чиа пудинг) и синтаксички, меѓу другото, во ко-конструкција. Овие конструкции се користат за комбинирање на добро познати јадења и храна - од здравствени причини - со здрава храна (салата со кеale, чаши со смути со чиа семе).
Снимка на екранот 4: Биграми
Снимка на екранот 5: Доказ за фразата „таму“ во погледот на согласноста
Снимка на екранот 6: Преглед на биграмот за предлогот "со"
Снимка на екранот 7: Случајност на изразот за пребарување „супер храна“ (колокати) во околина со пет збора лево и десно
За евалуација според „Колокати“, мора да се избере изворен збор или фраза со која другите зборови ќе се ко-ко-случуваат во претходно избраната околина (претходно поставена е средина од пет збора лево и десно од терминот за пребарување). За суперхрана има акумулација на еднина и множина форми на сен (е и се) (скриншот 7), што сугерира на претпоставка дека англицизмот редовно се јавува во предикации во кои се прават дефинитивни описи, како во следните предикативни конструкции:
Доказите за лековитите моќ на суперхраната се ретки. (Фокус на Интернет 7.6.2018)
Овесот е вистинска „супер храна“. (Шпигел на Интернет, 19 април 2018 година)
Список со клучни зборови може да се креира само ако корпус за споредба е претходно поставен на AntConc однапред под „Поставки на алатката“. За корпусот на суперхрана, на пример, тематски контраст со повеќе глобални намирници за исхрана, што се претпоставува дека покажуваат помалку метадискурзивни траги, бидејќи дефинициите се помалку контроверзни. Исто така, може да се претпостави дека има помалку конструкции на дефиниција и назначување.
Заклучок:
Оваа корпус-лингвистичка мини-студија го идентификува терминот суперхрана како гласен збор чиј здравствен ефект одговара на индивидуална храна и состојки и чии здравствени ефекти (критички) се дискутираат во јавниот прес-дискурс.