За репрезентативноста на колокациите во светот
Мандатна работа (напреден семинар) 2015 година 23 страници

Примерок за читање
структура
1. Вовед - За репрезентативноста на колокациите на мрежата
1.1. Кои се колокациите?
1.2. Прашање
1.3. Мрежата како корпус
а) Лингвистиката на корпусот како емпириски метод на истражување
б) Предности и недостатоци на мрежата како корпус
в) Да се испитаат колокациите на мрежата
2. Сопствена јазична истрага на корпус на избрани колокации на мрежата
2.1. „Речникот на колокации на германски“ - избор на колокации што треба да се испитаат
2.2. Анализа на корпус користејќи WebCorp
2.3. Резултати и споредба со речникот за колокација
3. Интерпретација и дискусија за резултатите
3.1. изгледи
1. Вовед - За репрезентативноста на колокациите на мрежата
1.1. Кои се колокациите?
Во истражувањето на фразеологијата, терминот колокација се користи „за означување на фиксни неидиоматски комбинации на зборови“ (сп. Редер 2006: 160). Колокациите се конвенционализирани во одделни јазици, одредени комбинации на зборови се силно закотвени во еден јазик и на тој начин претставуваат фиксни „единици на јазичниот систем“ (сп. Лер 1996: 1). Во јазичните истражувања, колокациите често се третираат како бинарни лексички единици, како во примерите споменати погоре. Сепак, постојат и „повеќе од два збора врски“ (сп. Холос 2010: 85), како во примерот масовно критикуван (сп. Хаусман 2004: 316). Сепак, тука не треба да се решава за овие, бидејќи тие би го надминале опсегот на оваа работа.
Сумирајќи, мојата корпус-лингвистичка истрага ја темелам на следното разбирање на колокациите: Колокациите се статистички чести комбинации на зборови од бинарна природа кои се карактеризираат со синтагматските и семантичките зависности на соговорникот врз основа (сп. Хаусман 2001: 316, Редер 2006: 158). Сегашната работа ќе се фокусира на вербални и суштински колокации, бидејќи тие се лесни за идентификување од јазична гледна точка на корпусот и затоа се добро прилагодени за проценка на репрезентативноста на колокациите во мрежниот корпус (сп. Бридт 1995: 5). Разновидноста на можните комбинирани комбинации на зборови може да доведе до двосмисленост при пребарувањето и евалуацијата на телата, поради што е неопходна јасна разграничување на предметот што треба да се испита.
1.2. Прашање
Пред да навлезам во шансите и ризиците на мрежата како корпус за анализата на колокација во следното поглавје, би сакал да го наведам прашањето насочено кон целите на оваа истрага во овој момент. Целта е да се испита дали „Светската мрежа“ е репрезентативна за употребата на вербални и именски собрани. Резултатите од сопствената анализа на корпусот на мрежата треба да се споредат со записите во „Речник за колокации на германски јазик“ (Quasthoff 2011) за да може да се процени репрезентативноста на реалната употреба на јазикот на Интернет. Записите во речникот веќе укажуваат на соодветно висока фреквенција на соодветните колокации на германски јазик (сп. Quasthoff 2011: XII). Бидејќи квантитативната анализа е можна само во ограничена мерка во мрежниот корпус 1, исто така треба да се изврши квалитативна анализа на резултатите при проценка на податоците на корпусот.
1.3. Мрежата како корпус
Во следното поглавје, ќе бидат направени прелиминарни размислувања за соодветноста на мрежата како јазичен корпус, што ќе се влее во дискусијата за подоцнежните резултати од анализата на колокација.
а) Лингвистиката на корпусот како емпириски метод на истражување
Со помош на корпус лингвистика, емпириски може да се истражи употребата на разни јазични појави на еден јазик. Користејќи автентичен јазичен материјал, на пример, може да се обезбедат докази за значењето и употребата на специфични колокации и да се утврди нивната фреквенција на појава. Затоа, тие можат да се анализираат квалитативно и квантитативно (сп. Scherer 2006: 35f.). Ова тогаш може да биде основа за создавање речници, како во случајот со „Речникот на колокации на германски“. Повеќето корпорации - со други зборови, „збирки текстови или делови од текстови кои (…) се избрани и класифицирани според одредени јазични критериуми“ (2006: 3) - сега се дигитализирани и може да се анализираат со помош на компјутери. „Светската мрежа“ обезбедува исклучително голема колекција на податоци од пишан (и делумно говорен) јазик и ги проширува можностите за јазична анализа на корпус. Сепак, постојат некои недостатоци или ограничувања. Различните карактеристики на таканаречените „веб-тела“ 2 ќе бидат подетално разгледани подолу.
б) Предности и недостатоци на мрежата како корпус
в) Да се испитаат колокациите на мрежата
И покрај ограничувањата дискутирани погоре, мрежата може да се користи за лексикографски и јазични статистички студии (Scherer 2006: 75, Diemer 2008: 36). Јазичните студии на Бикел е јасно дека покрај големиот раст и постојаниот понатамошен развој на мрежниот корпус, резултатите од пребарувањето се „инхерентно конзистентни“ и „репродуктивни“ во одредено време (Бикел 2006: 80). Многу слични резултати може да се постигнат во различни периоди, што укажува на одредена стабилност на ткаениот корпус (сп. 2006: 78 г.).
2. Сопствена јазична истрага на корпус на избрани колокации на мрежата
Со цел да испитам дали „Светската мрежа“ е репрезентативна за употребата на вербални и суштински колокации, би сакала да ја засновам мојата корпусна анализа на избрани колокации од „Речникот на колокации на германски“ за споредба.
2.1. „Речникот на колокации на германски“ - избор на колокации што треба да се испитаат
„Речник за колокации на германски“ е првиот речник за колокација на германски јазик (сп. Quasthoff 2011: XII). Бидејќи е замислен врз основа на емпириската, корпусно-јазична истрага на корпусот на јазикот во Лајпциг, таа ја отсликува јазичната реалност на употребата на колокативи (сп. Раџик 2013: 64, Квастоф 2011: XII). Речникот на колокација на Квастоф ги собира најчестите соговорници за вкупно 3253 именки, глаголи и придавки, кои се наведени како основа на бинарни комбинации на зборови (2011: X). Раџик (2013: 71) го смета за создавање на „Речник за колокации на германски јазик“ базирано на корпус како „големо достигнување на германската лексикографија“. Соодветните колокации на клучен збор не се структурирани според нивната вистинска фреквенција на појава во референтниот корпус, но се подредени според синтаксичката и семантичката врска во таканаречените групи на колокација 4 (сп. Квастоф 2011: X).
За независна анализа на корпусот, од една страна се анализираат вербалните колокации (именка + глагол), кои произлегуваат од основната исхрана. Од друга страна, треба да се испитаат именските колокации (придавка + именка) врз основа на споменатите погоре. Речникот на колокација прво ги наведува следниве глаголи и придавки како соговорници на именската исхрана (сп. 2011: 150):
1 види дел 1.3б).
2 „Веб-тела“ е јазично подготвен јазичен материјал од Интернет. Мора да се направи разлика помеѓу овие „достапни тела на Интернет“ кои се достапни на Интернет, но не се обработуваат јазично (сп. Storrer 2011: 12).
3 За структурата и спроведувањето на оваа јазична истрага на корпусот, видете Бикел (сп. 2006: 75 г.). 6-ти
4 Овие групи на колокација се наведени, одделени со точка-запирка. Врз основа на оваа структура, ги презентирав и резултатите од ова јазично дело од точката 2.3 (стр. 10).