Следите за нашими новостями!
Твиттер      Google+
Русский филологический портал

Ю. Д. Апресян

ЛИНГВИСТИЧЕСКИЕ ПРОБЛЕМЫ ФОРМАЛЬНОГО СЕМАНТИЧЕСКОГО АНАЛИЗА ПРЕДЛОЖЕНИЯ

(Структура текста - 81. Тезисы симпозиума. - М., 1981. - С. 16-20)


 
1. Формальный семантический анализ предложения - это правила установления соответствия между его синтаксическим и семантическим представлениями. Анализ адекватен естественному языку, если конечный продукт анализа удерживает всю семантическую информацию, выраженную в предложении средствами этого естественного языка, и только такую информацию.
2. В данной работе семантический анализ рассматривается с точностью до установления соответствия между главными частями полных представлений, а именно, между глубинно-синтаксической структурой (ГСС) предложения и его поверхностно-семантической структурой (ПСемС).
2.1. ГСС предложения, являющаяся объектом анализа, - это дерево зависимостей, в узлах которого стоят имена глубинно-синтаксических лексем с наборами семантически содержательных граммем, например, ДОМ, ед. В число глубинно-синтаксических лексем входят не только реальные, но и фиктивные лексемы, эксплицирующие значения ряда поверхностно-синтаксических конструкций (синтаксем). Так, предикативной конструкции с обязательным постпозитивным подлежащим и сказуемым в форме императива единственного числа, стоящим в самом начале препозитивного придаточного предложения (Приди мы минутой раньше, мы бы успели на поезд), в ГСС соответствует фиктивная лексема "ИРРЕАЛЬНОЕ УСЛОВИЕ. Таким образом, собственно семантическая информация сосредоточена в ГСС исключительно в лексемах и граммемах. Стрелки подчинения, связывающие узлы ГСС, универсальны и асемантичны, т.е. показывают только внутреннюю синтаксическую организацию смыслов.
2.2. ПСемС, являющаяся продуктом анализа, - это граф, в узлах которого стоят слова "национального" семантического языка (семы), а дуги отражают предикатно-аргументные связи между ними. Семы, и только они, кодируют всю собственно семантическую информацию ПСемС."Это значит, что различные подструктуры ПСемС являются образами либо реальных лексем, либо фиктивных глубинно-синтаксических лексем, либо семантически содержательных граммем, имеющихся в соответствующей ГСС.
2.3. Для осуществления преобразования ГСС в ПСемС необходимы следующие четыре класса правил: 1) правила формирования оптимального набора значений лексем и граммем для узлов ГСС; 2) правила замены каждой лексемы и граммемы их семантическими образами - фрагментами ПСемС; 3) правила слияния этих фрагментов в более крупные блоки ПСемС:, 4) фильтры для установления семантической правильности ПСемС, построенной тремя предыдущими наборами правил.
3.1. На первом шаге семантического анализа возникает проблема снятия ложной многозначности, предстающей в двух ипостасях: ложная многозначность в пределах узла и ложная многозначность в пределах всей ГСС.
3.1.1. В общем случае узел ГСС может быть представлен в виде набора позиций - позиции лексемы и ряда позиций семантически содержательных граммем, например: ИГРАТЬ, наст, несов, изъяв. В каждой позиции возможно более одного значения; ср. разные значения глагола ИГРАТЬ во фразах играть с кошкой, играть в шашки, играть на рояле, играть людьми и разные значения граммем несов и наст во фразах За стеной кто-то играет Бетховена (актуально-длительное значение), По утрам он играет Бетховена (узуальное значение), Завтра он играет Бетховена (значение предстоящего действия), Вы играете Бетховена? (значение потенциального действия), Тут я сажусь за рояль и играю Бетховена (настоящее историческое). Чтобы избавиться от большого числа принципиально допустимых, но нереализуемых в данном языке комбинаций лексических и граммемных значений, необходимо сформулировать ограничения на правильные комбинации значений для произвольного узла ГСС. Одно из таких ограничений запрещает комбинацию перформативного значения лексемы (если оно есть) с актуально-длительным значением граммемы несов (фраза типа Я долго клянусь, что я невиновен может быть осмыслена как правильная только в настоящем историческом, но не в актуально-длительном значении).
3.1.2. Точно такая же проблема, но только в неизмеримо больших масштабах, возникает и для ГСС в целом. Для ее решения, помимо формулировки правил сочетаемости значений лексем и граммем в пределах всей ГСС, похожих на ограничения типа 3.1.1., применяются и другие правила. Основное из них гласит, что в неметаязыковом контексте для многозначной ГСС следует выбирать ту из принципиально мыслимых ее интерпретаций, для которой повторяемость сем в ПСемС-ах составляющих ее лексем и граммем максимальна.
3.2. Главные проблемы второго шага семантического анализа, т.е. семантической интерпретации выбранных значений лексем и граммем, могут быть сформулированы следующим образом:
3.2.1. Необходимо локализовать тот элемент (лексему или граммему), который является носителем данного значения. Трудность состоит в том, что в естественном языке одни и те же значения в почти одинаковых условиях выражаются существенно различными средствами. Потенциальное значение во фразе Вы играете Бетховена? выражено, скорее всего, граммемой несов, а во фразе Мой сын говорит по-французски то же самое значение присуще, по данным русских толковых словарей, лексеме ГОВОРИТЬ.
3.2.2. Весьма нетривиальной задачей является истолкование значений лексем и граммем, т.е. построение для них необходимых и достаточных ПСемС. Особенно сложны для истолкования граммемы глагольных категорий и фиктивные лексемы, эксплицирующие значения синтаксем, потому что важнейшие компоненты значений таких граммем и лексем спрятаны в трудно доступные части ПСемС - пресуппозиции, модальные рамки, рамки наблюдения. Значение граммемы сов в контексте лексем типа НАЧИНАТЬСЯ, КОНЧАТЬСЯ, ОБРЫВАТЬСЯ, ПОВОРАЧИВАТЬ и т.п., когда подлежащим при них является имя пространственного объекта, включает сложную модальную рамку с вложенной в нее рамкой наблюдения: Около морены, тропа кончилась <оборваласъ> = 'Около морены тропа кончалась <обрывалась>, и говорящий мыслит наблюдателя, перемещавшегося по тропе, сознание которого зарегистрировало этот факт'. Весь выделенный разрядкой текст (за исключением, разумеется, смысла 'тропа') является экспликацией значения граммемы сов в указанных условиях. Сравнение фиктивной лексемы 'ИРРЕАЛЬНОЕ УСЛОВИЕ (см. 2.1.) с ее ближайшей перифразой ЕСЛИ ВЫ (мы пришли минутой раньше, мы бы успели на поезд) показывает, что, при возможном совпадении пресуппозиций ('мы не пришли минутой раньше и опоздали на поезд'), первая единица отличается от второй нетривиальной модальной рамкой; 'говорящий считает ситуацию Р (ср. "мы пришли минутой раньше") желательной или нежелательной'.
3.2.3. Отдельной интересной и непростой задачей является правильное распределение найденных элементов значения между различными частями ПСемС - зссерцией, пресуппозицией, модальной рамкой и рамкой наблюдения. Понять, которой из этих четырех частей принадлежит тот или иной кусок совокупного значения языковой единицы, важно потому, что они ведут себя очень неодинаково относительно системы семантических преобразований и свойства правильности ПСемС (см. ниже).
3.3. На третьем этапе анализа - этапе слияния отдельных значений в более крупные блоки - возникают две трудности.
3.3.1. Одна из них связана с тем, что сложение значений в естественном языке происходит часто по неаддитивным законам: в процессе слияния друг с другом значения лексем и граммем могут претерпевать сложные превращения - обогащаться, редуцироваться, менять свои области действия и т.п. Слова, обозначающие физические параметры или линейные размеры вещей (ВЕС, ВЫСОТА, ДЛИНА, ДАВЛЕНИЕ, СКОРОСТЬ, ТЕМПЕРАТУРА, ЦВЕТ и т.п.), имеют по две семантические валентности. Своей первой валентностью такое существительное присоединяет к себе название объекта, которому присущ данный параметр (высота Монблана, скорость света), а второй - значение величины. Значение величины выражается либо явно (высота в 1000 метров, скорость в 300 000 км/сек), либо неявно; ср. Мы были на высоте Монблана, Никакое физическое тело не может лететъ со скоростью света. В последнем случае в принципе омонимичные словосочетания высота Монблана, скорость света имеют значение 'высота, равная высоте Монблана', 'скорость, равная скорости света'. Смысловые компоненты, выделенные разрядкой, не входят в каноническое толкование параметрических существительных и должны вырабатываться специальным правилом семантической модификации.
3.3.2. Другая трудность связана с тем, что правила обогащения, редукции, мены областей действия далеко не всегда носят общий характер. Имеется громадное число правил (по-видимому, десятки тысяч), характеризующих поведение отдельных слов в отдельных значениях, а иногда даже и в отдельных грамматических формах или синтаксических конструкциях. Существительное ТЕМПЕРАТУРА отличается от прочих параметрических существительных, в частности, тем, что в конструкциях, когда его первая валентность насыщается словами со значением отрезка времени (средняя температура сентября <зимы>), оно наращивает не включенный в каноническое словарное толкование смысл 'атмосферный воздух': температура Р Х-а = 'температура Р атмосферного воздуха, имеющая место в отрезок времени X'.
3.4. На последнем этапе семантического анализа возникает задача проверки правильности построенной ПСемС. Семантика естественного языка свободна и допускает почти неограниченные нарушения законов логики и здравого смысла. В частности, логические противоречия и абсурды сами по себе нисколько не нарушают семантической правильности высказываний и, следовательно, ПСемС. Нарушения возникают лишь тогда, когда логически исключающие друг друга компоненты смысла находятся, по крайней мере частично, в пресуппозициях или модальных рамках ПСемС: в семантически правильной ПСемС содержание пресуппозиций и модальных рамок должно быть внутренне непротиворечиво и не должно противоречить ассер-тивным частям ПСемС.
4. Получением семантически правильной ПСемС завершается лишь часть лингвистической процедуры семантического анализа предложения. После этого возникают следующие проблемы: 1) слияние ПСемС с остальными частями семантического представления предложения, в особенности, с его коммуникативной структурой; 2) введение полного поверхностно-семантического представления предложения в последовательность других таких представлений, отражающую в целом связный текст; 3) слияние результатов чисто лингвистического семантического анализа предложения с результатами его логического и информационного анализа (на основе модели мышления и модели представления знаний о внешнем мире).
5. Изучение проблематики семантического анализа предложения дает интересный побочный результат, из которого вытекает одно важное следствие, имеющее отношение к лингвистике текста.
5.1. Значения предложений, с одной стороны, и значения таких содержательных единиц языка, как лексемы, граммемы и синтаксемы, с другой, обнаруживают некоторые глубокие общие принципы организации. Все названные типы значений многослойны и в общем случае включают, как мы видели, ассертивную часть, пресуппозиции, модальную рамку, рамку наблюдения. Все они представимы на одном и том же семантическом языке, с помощью принципиально одинаковых или даже одних и тех же семантических структур. Очевидно, например, что ПСемС (разрывной) лексемы ЕСЛИ..., ТО, граммемы деепр, в условном значении (Не зная броду, не суйся в воду = *Если не знаешь броду, то не суйся в воду') и синтаксемы "нереферентная именная группа в роли подлежащего плюс глагольная группа со значением узуальности в роли сказуемого", тоже имеющей условное значение (ср. Дети, склонны проказничать = 'Если X - ребенок, то X склонен проказничать'), должны быть очень похожими, если не идентичными. Конечно, сентенциальные, лексические, граммемные и синтаксемные значения обнаруживают и различия. Пресуппозиции предложения, при неизменной синтаксической структуре, могут меняться, а пресуппозиции лексемы, граммемы и синтаксемы постоянны. По сравнению с лексическими значениями в значениях граммем и синтаксем больше доля субъективных элементов смысла (пресуппозиций, модальных рамок, рамок наблюдения),.и они в гораздо большей мере обусловлен контекстом. Поразительным, однако, является не факт различий, а факт семантических сходств между единицами столь различной природы. Если же учесть, что правильное предложение является элементарным образцом связного текста и легко разворачивается в семантически эквивалентный ему связный текст (и обратно), то придется признать, что глубокие семантические аналогии обнаруживаются между текстом и лексемой, текстом и граммемой, текстом и синтаксемой. Лексема, граммема и синтаксема суть латентные тексты. Семантическое устройство этих микроструктур языка повторяет устройство микро- и макроструктур текста, демонстрируя тем самым принципиальное единство всей языковой вселенной.
5.2. Овладение загадками этих простейших структур хотя бы в пределах предложения предстает как необходимое предварительное условие для постановки гораздо более сложного вопроса о лингвистике текста.