(Факултет по славянски филологии, Софийски университет „Св. Климент Охридски”)
Abstract
The article is focused on the morphological ambiguity in Bulgarian. More specifically, it discusses the noun-related ambiguous types. The orthographically ambiguous words have been extracted from a morphologically annotated corpus of Bulgarian (the Bultreebank morphological corpus). The author proposes a classification of the ambiguity types based on the parts-of-speech as well as the grammatical meanings.
Резюме
Статията представя морфологичните многозначности при съществителните имена. Разглежданите имена са извлечени от морфологично анотиран корпус. Разделени са по типове. Само в рамките на съществителното име типовете многозначности са анализирани според вариациите на граматическите характеристики, които пораждат многозначността.
1. Увод
Настоящата статия разглежда морфологичните многозначности, в които участват съществителни имена. Преди да се разгледат по-обстойно тези многозначности, е важно да се посочи какво се разбира под морфологична многозначност и какво представляват типовете морфологични многозначности. Също така е важно да се отбележи и върху какъв материал е направен представяният анализ.
Под морфологична многозначност разбирам свойството на лексикалните единици, съвпадащи в графичното си изписване, да принадлежат към различна граматическа категория (напр. къс (прил.) и къс (същ.)) или да имат различни граматически значения (напр. политика (същ., ж.р., ед.ч.) иполитика (същ., м.р, ед.ч., опред.)). Като пример може да се посочи графемата я, която може да принадлежи към четири граматически категории – съотносителен съюз, междуметие, лично местоимение, частица за усилване. Избрано е да се работи с понятието графема, тъй като за наблюдение и анализ се използват писмени текстове. Също така е важно да се отбележи, че повечето морфологични многозначности лесно се разрешава в контекст – било по-малък или по-обширен.
За по-коректното структуриране на многозначностите е въведен още един термин – тип морфологична многозначност. Под тип се разбира съвкупността от възможните граматически категории и граматически значения, които се носят от определени лексеми извън контекст. Важно е да се отбележи, че типовете се отграничават както на базата на части на речта (къс), така и на базата на граматическите значения при всяка част на речта (политика).
Като примери за тип морфологична многозначност могат да се посочат лексемите мислите, жените, които принадлежат към две граматически категории (съществително име и глагол) и имат следните граматически значения – при съществителното – нарицателно, женски род, множествено число, определено и при глагола – несвършен вид, преходен, сегашно време, 2 л., множествено число. Тук тези две граматически категории и граматическите им значения съставят един тип морфологична многозначност.
На базата на морфологичната анотация на синтактичния корпус Бултрибанк (Simov , Osenova, Slavcheva 2004) са направени наблюдения относно морфологичните многозначности в българския език и тяхното групиране по типове. Автоматично са извлечени многозначностите на базата на граматичните характеристики, които са им приписани под формата на тагове (Осенова, Симов 2007: 130). Корпусът е съставен от 215 149 думи. От тези думи са извлечени 6510 уникални лексикални единици, които са морфологично многозначни. Говори се за уникални лексикални единици, тъй като многозначностите ще бъдат групирани по типове и за да може да се гледа обективно на честотата на срещане на даден тип, е важно лексикалните единици, които стоят зад този тип, да са неповтарящи се. В противен случай някои често срещани многозначни лексеми (като на, което може да бъде частица за усилване или предлог) могат да изградят неточна представа за честотата на даден тип. Всичките 6510 многозначности са групирани в 831 типа. Всеки тип има различен брой представители. Може да се отбележи, че също както при лексикалната многозначност, автосемантичните думи са най-многозначни – това е очаквано поради факта, че имат многочленна парадигма. Съществителното име е единствената част на речта, която участва в типове морфологични многозначности с всички останали части на речта.
2. Анализ
Съществителните имена участват общо в 372 типа морфологични многозначности според данните, извлечени от морфологично анотирания корпус. Тези многозначности могат да бъдат представени в 24 групи според частите на речта, с които съществителните влизат в многозначност. Нужно е само да се отбележи, че при направените наблюдения причастията са разглеждани отделно от глагола (Кънчева 2013). 24-те групи са обединени в по-големи цялости според броя на частите на речта, които участват в многозначностите. В Таблица 1 са представени тези цялости, групите, които влизат в тях, и броят на типовете, които има във всяка група. Посочен е и по един пример, като при случаите с повече от един тип е избран пример от най-често срещания тип. В Приложение 1 са поместени всички посочени в таблицата примери заедно с граматическата категория, към която принадлежат, и с всички възможни граматически значения, които могат да притежават.
Таблица 1.
Както може да се види от броя на типовете в отделните групи, съществителните участват в повече многозначности с глаголи и причастия, отколкото в рамките на групата им. При глаголите например се наблюдават най-много типове многозначности в рамките на глаголни форми. При местоименията ситуацията изглежда по същия начин.
Могат да се търсят различни причини за това групиране на многозначностите. От една страна, глаголите имат най-много граматически значения, което предпоставя образуване на най-много многозначности. От друга страна, много от типовете многозначности са обусловени от парадигмата – формите за аорист и имперфект при глаголите от трето спрежение съвпадат. Това се наблюдава и при местоименията – в парадигмата на личните местоимения например съвпадат формите за мъжки и среден род. Тези съвпадения са исторически обусловени. Според някои езиковеди например в случаите с глаголни форми се говори не за морфологична многозначност, а за синкретичност (Ницолова 2008). В статия на К. Алексова (Алексова 2005) съвпадението на форми в рамките на парадигмата на една вербална лексема се разглежда детайлно и се разграничават три явления – хомолексемна морфологична омонимия, бипартиципиалност и бидетерминативност. Настоящата работа не си поставя за цел да реши този въпрос. Избраният термин – морфологична многозначност – не противоречи на термини като синкретизъм и омонимия2. За морфологична многозначност се говори в (Осенова 2011).
В тази статия акцентът се поставя върху морфологичните многозначности между съществителни имена, като в хода на изследването ще бъдат правени и сравнения с многозначности между съществителни имена и други части на речта. Анализът се концентрира върху няколко точки:
Както всяка граматика представя частите на речта и граматическите характеристики, които те могат да притежават, така и морфологичният модел при компютърното моделиране на езика приписва предварително зададени граматически характеристики на частите на речта. Съществителните, които се разглеждат като многозначни в настоящото изследване, са анотирани според тагсета, описан в (Simov, Osenova, Slavcheva 2004). Граматическите характеристики, които притежават съществителните имена според (Simov, Osenova, Slavcheva 2004), са нарицателни/собствени, род, число, определеност, маркирани са още и остарели форми в акузатив и датив, както и звателните форми. В рамките на категорията число се включват маркери за плуралия тантум и бройна форма.
Съществителните имена и техните граматически характеристики са представени още в редица изследвания (Андрейчин, Асенова, Георгиева и др. 1998), (Бояджиев, Куцаров и Пенчев 1998), (Георгиев 1999), (Буров 2004), (Куцаров 2007), (Ницолова 2008) и др.
Нужно е да се направи едно уточнение относно морфологичните многозначности между съществителни имена, преди да се започне с йерархизирането им. На този етап на анализ се работи единствено с типовете многозначности, които при разделението на части на речта са се оформили само в рамките на съществителните имена. Тъй като в рамките на други типове (между съществителни и други части на речта) може да има и многозначности между съществителни имена. Например в рамките на многозначностите между съществителни и причастия е налице следният тип: между [съществително нарицателно, мъжки род, единствено число, членувано с кратък член]; [съществително нарицателно, мъжки род, бройна форма]; [минало свършено деятелно причастие на несвършен, преходен глагол, женски род, единствено число, нечленувано] и [минало несвършено деятелно причастие на несвършен, преходен глагол,женски род, единствено число3] – с пример чувала.
Този тип многозначност между кратък член и бройна форма може да се види и при многозначностите само между съществителни имена, (той е и най-често срещаният), но примерите от други типове (които са между две или повече части на речта, но в техните рамки може да се разглежда и многозначност само между съществителни имена) не са анализирани в това изследване. Акцентът тук се поставя върху типовете, образували се само в рамките на съществителните имена. За сравнение ще бъдат посочени морфологични многозначности на съществителни с други части на речта (глаголи и прилагателни имена).
53-те типа морфологични многозначности между съществителните имена могат да бъдат разделени в няколко по-големи групи според граматическите характеристики, които варират. Тъй като се разглеждат морфологични многозначности само между съществителни имена, противопоставянията са между граматическите характеристики, които притежава съществителното име. Основните характеристики, между които се наблюдават противопоставяния, са: род, число, определеност извателна форма. В настоящата статия на типовете морфологичните многозначности между съществителни имена се прави първоначално структуриране. То е нужно като основа за едно по-задълбочено изследване, в което вече да се разглеждат грамемите на граматическите значения род, число и др. Или на базата на мъжки род, женски род, среден род; единствено число, множествено число, бройна форма да се изгради структура на значенията и да се разгледа не само наличието на многозначности между род и число например, а точно между кой род и кое число се появява.
Според броя на лексикалните единици, които представят даден тип, може да се говори за продуктивни и непродуктивни типове. За момента разделението се прави на базата на резултатите от корпусното изследване. Предстои и анализиране на многозначностите от речника, след което тази типология да бъде допълнително доуточнена. За непродуктивни се приема да се считат типове, които имат малък брой представители. В тази група влизат всички типове морфологични многозначности с по един представител. В тези случаи много често става въпрос за случайно съвпадение на две или повече лексикални единици. Типовете с до пет представителя също се смятат за непродуктивни. Поради факта, че изследването е направено върху малко над двеста хиляди дими, е напълно реално дадени типове да увеличат броя на представителите си в един неколкократно по-голям корпус. Но едва ли типове с до пет представителя биха го увеличили до такава степен, че да се окажат високо продуктивни. Поради това е избрано да се разграничат две степени на продуктивност – висока и ниска. За ниско продуктивни типове се разглеждат тези типове, зад които стоят между пет и двадесет лексикални единици, а за високо продуктивни – тези с над двадесет лексикални единици. В настоящето изследване фокусът е поставен върху продуктивните типове морфологични многозначности между съществителни имена. Ще се разглежда вариацията на кои граматически характеристики провокира появата на продуктивен тип многозначност.
Типовете морфологични многозначности между съществителни имена са организирани в девет групи според основните граматически значения – род, число, определеност/неопределеност и звателна форма. В групата на числото е поместена една подгрупа, която обединява типовете многозначности с наличие на форми плуралия тантум. Първо ще бъдат представени групите с варираща една граматическа характеристика. Те са четири – с вариация на род, число, определеност и звателна форма. След това тези със зависимост между две граматически характеристики – между род и число; род и определеност; род и звателна форма и число и определеност. И последна ще бъде поместена групата между три граматически значения, която обединява и най-много типове (13) – а именно между род, число и определеност.
Първата по-голяма цялост обединява типове морфологични многозначности с вариация на рода. Родът при съществителните имена се разглежда като вътрешно присъщо и постоянно граматическо значение (Ницолова 2008: 52). Съществителните имена не се менят по род. На базата на рода те се класифицират по групи. Освен класификационна категория родът в българския език е и синтактична и частично морфологична категория (Ницолова 2008: 52). Поради тези причини родът сам по себе си трудно би провокирал възникването на много и продуктивни типове морфологични многозначности. Но в съчетание с друга граматическа характеристика родът може да предизвика интересни съвпадения във формите на различни лексикални единици. Интересно би било да се разгледа и поведението на рода при морфологични многозначности между съществителни и други части на речта.
В групата с вариация на рода попадат и някои съществителни имена, които според някои автори се смятат за съществителни от общ род (genus communia). Не всички примери обаче са такива. В тази група попадат девет типа. Повечето от тях са непродуктивни – с по един представител. Само три типа се причисляват към продуктивните и те са:
В групата на многозначности с вариация на рода е интересно да се изследва какво е съотношението между лексеми, при които се наблюдава лексикална омонимия, и лексеми, които са пример за съществителни от общ род. В първата група попада например мед – срв.
Във втората група влизат съществителни като будала и роднина. Те могат да означават лица както от женски или мъжки род, така и лица без оглед на пола (Ницолова 2008: 57).
Естествено, когато говорим за вариация на рода, говорим и за отделни лексеми. Интересен е случаят със съществителните имена от общ род. В корпуса, от които са извлечени многозначностите, съществителните от общ род са анотирани с отделен таг за всеки род, към който могат да принадлежат. Например роднина е анотирано и като женски род, и като мъжки. Това решение е взето, с цел да се избегне възможността на съществителното да се припише род, който не може да притежава (в случая среден), тъй като, ако се остави без род, може да се подразбира и среден. Но по този начин се елиминира възможността да означават лице без оглед на пола.
Следващата група представя типове морфологични многозначности с вариация на числото. Числото е граматическа категория, която отразява количествената характеристика на предметите, които могат да се измерват (Иванчев 1978: 102). В съвременния български език числото включва три грамеми: форми за единствено число и два вида форми за множествено число – самостойна и несамостойна. Самостойната е обикновената форма за множествено число. Несамостойната е т.нар. бройна форма – тя се образува само от съществителни от мъжки род за нелица, завършващи на съгласна, и означава ограничено разчленено множество (Ницолова 2008). Числото, също както рода, само по себе си не е продуктивна категория за образуване на типове морфологични многозначности, но в съчетание с други категории участва в най-продуктивните типове многозначности между съществителни имена.
В групата с вариация на числото влизат три типа, но и трите непродуктивни – с по един и два представителя. В тази група е оформена една подгрупа, включваща съществителни, които могат да притежават граматическата характеристика плуралия тантум. Тук влизат 11 типа, като е важно да се отбележи, че те са непродуктивни – имат между един и три представителя. Също така голяма част от многозначностите са в рамките на една лексикална единица. Т.е. има основание да се преразгледат приписаните им граматически характеристики.
В групата с плуралия тантум има типове, при които има повече от едно противопоставяне между граматическите характеристики. Но при тези случаи става въпрос за многозначности между различни лексикални единици – например врата (Моля те, затвори отворената врата) и врата (Той го хвана за врата, а не за ръката).
Звателните форми се разглеждат като падежни форми, въпреки че те не означават синтактични отношения в изречението. Те са още контактни думи или квалификативно-оценъчни думи, тъй като служат като обръщение към слушателя (Ницолова 2008: 74). Звателните форми в голяма степен са остарели, което се доказва и от факта, че повечето лексикални единици, носещи маркера звателност и участващи в морфологични многозначности, са маркирани още и като остарели или рядко срещащи се.
Детерминацията или определеността е много сложна граматическа категория, която има семантично-прагматичен характер. Както отбелязва Ницолова, тя е свързана както с отразяваната в изказването ситуация, така и с речевия акт и неговите участници (Ницолова 2008: 78). По-подробно за детерминацията виж в "Българска граматика" на Р. Ницолова (Ницолова 2008). Поради целите на настоящата работа няма да се разглежда семантичната обосновка на детерминацията, а само формообразуването й.
Групите, представящи вариации на определеността и звателната форма, се състоят само от по един непродуктивен тип. Звателността като цяло е непродуктивна, докато определеността в съчетание с числото образува най-продуктивния тип морфологична многозначност между съществителни имена, който е представен по-долу в статията.
Дотук може да се обобщи, че при типовете с една варираща граматическа характеристика най-голяма продуктивност има родът. В рамките на рода най-често се появява многозначност между мъжки и женски род. В по-голяма част от случаите става въпрос за съществителни от общ род, на които са приписани характеристики и за женски, и за мъжки род. Многозначността в друга част от примерите се дължи на случайно съвпадение.
Следва изброяването на групи, обединяващи типове с две вариращи характеристики. Първо са поместени групите с вариация на рода, а последна е дадена единствената група, в която няма участие на род. Под вариацията на род и число попадат шест типа, като само един от тях е продуктивен:
1. Между [същ. нар., женски род, единствено число, неопределено] и [същ., нар., среден род,множествено число, неопределено] – 8 представителя – вина, нива, школа.
Както може да се види става въпрос за ниско продуктивен тип, където говорим за многозначност, породена от съвпадение на окончанието за женски род, единствено число -а и окончанието за множествено число на съществителни от среден род, завършващи на -о, -а.
В групата с вариации на род и определеност има само два типа, единият от които с два представителя, а другият с двадесет и пет.
1. Между [същ. нар., женски род, единствено число, неопределено] и [същ. нар., мъжки род, единствено число, членувано с кратък член] – 25 представителя – графа, критика, логика.
Тук морфологичната многозначност се дължи на съвпадение отново на окончанието на женски род, единствено число -а и краткия член за съществителни от мъжки род -а. Нужно е да се отбележи, че в случая става въпрос за условен правопис при формата за мъжки род. Но този факт не е релевантен в писмен текст, където се работи с графеми, заради това и такива съвпадения са обект на настоящото изследване.
С вариации на род и звателна форма има пет типа, като всичките са непродуктивни (с по един, два или три представителя) и голяма част от тях включват маркирани като остарели или много рядко срещани форми. Поради това няма да им бъде отделено място в тази работа.
Следва групата с вариация на число и определеност. В нея попадат четири типа, сред които и най-продуктивният тип морфологична многозначност между съществителни имена. Той е в рамките на една лексема, между две нейни словоформи – между бройната форма на съществително от мъжки род и членуваната с кратък член форма на същото съществително.
1. Между [същ. нар., мъжки род, единствено число, членувано с кратък член] и [същ. нар., мъжки род, бройна форма] – 550 представителя – автомобила, адреса.
Относно вариацията на число и определеност, само за бегло сравнение могат да се отбележат най-многобройните типове между съществителни и глаголи. В тези типове числото е от основно значение, тъй като морфологичната многозначност се поражда от окончанието за множествено число при съществителни имена от мъжки и женски род -и и окончанието за аорист за второ и трето лице, единствено число; сегашно време, трето лице, единствено число и повелително наклонение, второ лице, единствено число -и. Двата типа с най-много представители са:
Както може да се види единствената разлика между предишните два посочени типа е в рода на съществителното име (женски род в тип 1 и мъжки род в тип 2).
Определеността също е посочена като варираща характеристика, защото е необходимо съществителното да е неопределено, за да се получи многозначността. Ако съществително е членувано, то налице е друг тип многознаночност: (срв. с първия посочен по-горе тип) между същ. нар., женски род, множествено число, определено и глагол, свършен вид, преходен, сегашно време, второ лице, множествено число – с пример загубите.
Последна е поместена най-голямата група – тя включва типове с три вариращи граматически характеристики – род, число и определеност. Тук влизат тринадесет типа, като само един е продуктивен.
Този тип може да се съотнесе към два типа, вече представени – към многозначността с вариация на род и определеност и тази с вариация на число и определеност. Ако се разглеждат само формите от мъжки род, то няма никаква разлика с представения и по-горе тип с вариация на число и определеност. Единствената разлика с типа, представящ вариация на род и определеност, е, че в него примерите илюстрират одушевени лица от мъжки род, които не могат да образуват бройна форма.
За сравнение могат да бъдат посочени многозначностите между съществителни и прилагателни имена. Сред типовете с най-много представители се наблюдава следната закономерност – единствената разлика е по част на речта (съществително и прилагателно име), а граматическите характеристики (род, число, определеност) съвпадат. Тук попадат примери като:
Нужно е по-задълбочено изследване, за да се установи кои от тези примери се дължат на субстантивация, конверсия или случайно съвпадение.
Относно вариациите на граматически характеристики е интересно да се сравни първият от по-горе посочените примери с типове със същите прилагателни, но с различен род. Така например прилагателното гола попада в тип многозначност между [прилагателно, женски род, единствено число]; [същ. нар., мъжки род, членувано с кратък член] и [същ. нар, мъжки род, бройна форма], абоса – в многозначност между [прилагателно, женски род, единствено число] и [същ. нар., мъжки род, членувано с кратък член]. Т.е. наблюдават се същите вариации както и само между съществителни имена.
3. Заключение
Въз основа на морфологично анотиран корпус са извлечени 6510 многозначни лексикални единици. Тези лексикални единици са групирани по типове – общо 831 типа. Всички типове са разпределени по части на речта, т.е. уточнено е за всяка част на речта в колко и какви типове морфологични многозначности участва. Изградена е стратегия за разграничаване на продуктивни и непродуктивни типове. В настоящата статия е работено само с продуктивни типове.
Типовете морфологични многозначности при съществителните имена са групирани в зависимост от броя на частите на речта, с които влиза в многозначност. Класификацията е направена само в рамките на съществителното име (в рамките на една част на речта) и между съществително и една, две или три други части на речта (в рамките на две, три или четири части на речта).
Съществителното име е единствената част на речта, която участва в морфологични многозначности с всички останали части на речта. От тази гледна точна е интересно да се наблюдават вариациите на граматическите характеристики, които пораждат тези многозначности. Като основа е избрано да се разглеждат типовете морфологични многозначности между съществителни имена и на базата на изградените наблюдения да се изследват по-късно многозначностите между съществителни и други части на речта.
Само в рамките на съществителното име типовете многозначности са разделени според вариациите на граматическите характеристики, които пораждат многозначността. В рамките на съществителните имена родът, числото и определеността са граматическите характеристики, които пораждат най-многобройни типове многозначности. Най-голяма продуктивност очаквано има вариацията на число и определеност, вследствие на която се получава многозначност между бройна форма и определеност с кратък член при съществителни от мъжки род за нелица.
При по-задълбочено изследване могат да се анализират грамемите в рамките на всяка от изброените характеристики и да се наблюдава тяхното поведение. Това е така поради факта, че например при многозначности между съществителни имена при числото продуктивна е бройната форма, а при многозначности между съществителни и глаголи продуктивна е формата за обикновено множествено число.
Направените наблюдения и анализи показват, че морфологичната многозначност е явление с многобройни примери, което показва, че това явление в езика не бива да се подценява, от една страна, а от друга – че по-подробното му изследване се превръща в наложителна задача. Разглежданите типове многозначности разкриват, че могат да се търсят вариации на граматически характеристики, пораждащи многозначности, както и да се търсят причините за образуване на продуктивни типове морфологични многозначности.
БележкиЦитирана литература
За автора
Станислава Кънчева е докторант в катедра „Български език” във Факултета по славянски филологии на Софийския университет „Св. Климент Охридски”. Интересите й са в областта на морфологията, депендентния синтаксис и обработката на естествен език.
E-mail: stanislavakancheva [at] gmail [dot] com
Статията е препоръчана за публикация от научния ръководител на докторанта доц. д-р Петя Осенова.
Приложение 1
|
Типове морфологични многозначности при съществителни имена в българския език
Абонамент за:
Коментари за публикацията (Atom)
Няма коментари:
Публикуване на коментар