ЛИНГВИСТИЧЕСКИЕ ПРОБЛЕМЫ ФОРМАЛЬНОГО СЕМАНТИЧЕСКОГО АНАЛИЗА ПРЕДЛОЖЕНИЯ
(Структура текста - 81. Тезисы симпозиума. - М., 1981. - С. 16-20)
1. Формальный семантический анализ предложения - это правила установления
соответствия между его синтаксическим и семантическим представлениями. Анализ
адекватен естественному языку, если конечный продукт анализа удерживает всю
семантическую информацию, выраженную в предложении средствами этого естественного
языка, и только такую информацию.
2. В данной работе семантический анализ рассматривается с точностью до установления
соответствия между главными частями полных представлений, а именно, между глубинно-синтаксической
структурой (ГСС) предложения и его поверхностно-семантической структурой (ПСемС).
2.1. ГСС предложения, являющаяся объектом анализа, - это дерево зависимостей,
в узлах которого стоят имена глубинно-синтаксических лексем с наборами семантически
содержательных граммем, например, ДОМ, ед. В число глубинно-синтаксических лексем
входят не только реальные, но и фиктивные лексемы, эксплицирующие значения ряда
поверхностно-синтаксических конструкций (синтаксем). Так, предикативной конструкции
с обязательным постпозитивным подлежащим и сказуемым в форме императива единственного
числа, стоящим в самом начале препозитивного придаточного предложения (Приди
мы минутой раньше, мы бы успели на поезд), в ГСС соответствует фиктивная лексема
"ИРРЕАЛЬНОЕ УСЛОВИЕ. Таким образом, собственно семантическая информация
сосредоточена в ГСС исключительно в лексемах и граммемах. Стрелки подчинения,
связывающие узлы ГСС, универсальны и асемантичны, т.е. показывают только внутреннюю
синтаксическую организацию смыслов.
2.2. ПСемС, являющаяся продуктом анализа, - это граф, в узлах которого стоят
слова "национального" семантического языка (семы), а дуги отражают
предикатно-аргументные связи между ними. Семы, и только они, кодируют всю собственно
семантическую информацию ПСемС."Это значит, что различные подструктуры
ПСемС являются образами либо реальных лексем, либо фиктивных глубинно-синтаксических
лексем, либо семантически содержательных граммем, имеющихся в соответствующей
ГСС.
2.3. Для осуществления преобразования ГСС в ПСемС необходимы следующие четыре
класса правил: 1) правила формирования оптимального набора значений лексем и
граммем для узлов ГСС; 2) правила замены каждой лексемы и граммемы их семантическими
образами - фрагментами ПСемС; 3) правила слияния этих фрагментов в более крупные
блоки ПСемС:, 4) фильтры для установления семантической правильности ПСемС,
построенной тремя предыдущими наборами правил.
3.1. На первом шаге семантического анализа возникает проблема снятия ложной
многозначности, предстающей в двух ипостасях: ложная многозначность в пределах
узла и ложная многозначность в пределах всей ГСС.
3.1.1. В общем случае узел ГСС может быть представлен в виде набора позиций
- позиции лексемы и ряда позиций семантически содержательных граммем, например:
ИГРАТЬ, наст, несов, изъяв. В каждой позиции возможно более одного значения;
ср. разные значения глагола ИГРАТЬ во фразах играть с кошкой, играть в шашки,
играть на рояле, играть людьми и разные значения граммем несов и наст во фразах
За стеной кто-то играет Бетховена (актуально-длительное значение), По утрам
он играет Бетховена (узуальное значение), Завтра он играет Бетховена (значение
предстоящего действия), Вы играете Бетховена? (значение потенциального действия),
Тут я сажусь за рояль и играю Бетховена (настоящее историческое). Чтобы избавиться
от большого числа принципиально допустимых, но нереализуемых в данном языке
комбинаций лексических и граммемных значений, необходимо сформулировать ограничения
на правильные комбинации значений для произвольного узла ГСС. Одно из таких
ограничений запрещает комбинацию перформативного значения лексемы (если оно
есть) с актуально-длительным значением граммемы несов (фраза типа Я долго клянусь,
что я невиновен может быть осмыслена как правильная только в настоящем историческом,
но не в актуально-длительном значении).
3.1.2. Точно такая же проблема, но только в неизмеримо больших масштабах,
возникает и для ГСС в целом. Для ее решения, помимо формулировки правил сочетаемости
значений лексем и граммем в пределах всей ГСС, похожих на ограничения типа 3.1.1.,
применяются и другие правила. Основное из них гласит, что в неметаязыковом контексте
для многозначной ГСС следует выбирать ту из принципиально мыслимых ее интерпретаций,
для которой повторяемость сем в ПСемС-ах составляющих ее лексем и граммем максимальна.
3.2. Главные проблемы второго шага семантического анализа, т.е. семантической
интерпретации выбранных значений лексем и граммем, могут быть сформулированы
следующим образом:
3.2.1. Необходимо локализовать тот элемент (лексему или граммему), который
является носителем данного значения. Трудность состоит в том, что в естественном
языке одни и те же значения в почти одинаковых условиях выражаются существенно
различными средствами. Потенциальное значение во фразе Вы играете Бетховена?
выражено, скорее всего, граммемой несов, а во фразе Мой сын говорит по-французски
то же самое значение присуще, по данным русских толковых словарей, лексеме ГОВОРИТЬ.
3.2.2. Весьма нетривиальной задачей является истолкование значений лексем
и граммем, т.е. построение для них необходимых и достаточных ПСемС. Особенно
сложны для истолкования граммемы глагольных категорий и фиктивные лексемы, эксплицирующие
значения синтаксем, потому что важнейшие компоненты значений таких граммем и
лексем спрятаны в трудно доступные части ПСемС - пресуппозиции, модальные рамки,
рамки наблюдения. Значение граммемы сов в контексте лексем типа НАЧИНАТЬСЯ,
КОНЧАТЬСЯ, ОБРЫВАТЬСЯ, ПОВОРАЧИВАТЬ и т.п., когда подлежащим при них является
имя пространственного объекта, включает сложную модальную рамку с вложенной
в нее рамкой наблюдения: Около морены, тропа кончилась <оборваласъ>
= 'Около морены тропа кончалась <обрывалась>, и говорящий мыслит наблюдателя,
перемещавшегося по тропе, сознание которого зарегистрировало этот факт'.
Весь выделенный разрядкой текст (за исключением, разумеется, смысла 'тропа')
является экспликацией значения граммемы сов в указанных условиях. Сравнение
фиктивной лексемы 'ИРРЕАЛЬНОЕ УСЛОВИЕ (см. 2.1.) с ее ближайшей перифразой ЕСЛИ
ВЫ (мы пришли минутой раньше, мы бы успели на поезд) показывает, что,
при возможном совпадении пресуппозиций ('мы не пришли минутой раньше и опоздали
на поезд'), первая единица отличается от второй нетривиальной модальной рамкой;
'говорящий считает ситуацию Р (ср. "мы пришли минутой раньше") желательной
или нежелательной'.
3.2.3. Отдельной интересной и непростой задачей является правильное распределение
найденных элементов значения между различными частями ПСемС - зссерцией, пресуппозицией,
модальной рамкой и рамкой наблюдения. Понять, которой из этих четырех частей
принадлежит тот или иной кусок совокупного значения языковой единицы, важно
потому, что они ведут себя очень неодинаково относительно системы семантических
преобразований и свойства правильности ПСемС (см. ниже).
3.3. На третьем этапе анализа - этапе слияния отдельных значений в более крупные
блоки - возникают две трудности.
3.3.1. Одна из них связана с тем, что сложение значений в естественном языке
происходит часто по неаддитивным законам: в процессе слияния друг с другом значения
лексем и граммем могут претерпевать сложные превращения - обогащаться, редуцироваться,
менять свои области действия и т.п. Слова, обозначающие физические параметры
или линейные размеры вещей (ВЕС, ВЫСОТА, ДЛИНА, ДАВЛЕНИЕ, СКОРОСТЬ, ТЕМПЕРАТУРА,
ЦВЕТ и т.п.), имеют по две семантические валентности. Своей первой валентностью
такое существительное присоединяет к себе название объекта, которому присущ
данный параметр (высота Монблана, скорость света), а второй - значение величины.
Значение величины выражается либо явно (высота в 1000 метров, скорость в 300
000 км/сек), либо неявно; ср. Мы были на высоте Монблана, Никакое физическое
тело не может лететъ со скоростью света. В последнем случае в принципе омонимичные
словосочетания высота Монблана, скорость света имеют значение 'высота,
равная
высоте Монблана', 'скорость, равная скорости света'. Смысловые компоненты, выделенные
разрядкой, не входят в каноническое толкование параметрических существительных
и должны вырабатываться специальным правилом семантической модификации.
3.3.2. Другая трудность связана с тем, что правила обогащения, редукции, мены
областей действия далеко не всегда носят общий характер. Имеется громадное число
правил (по-видимому, десятки тысяч), характеризующих поведение отдельных слов
в отдельных значениях, а иногда даже и в отдельных грамматических формах или
синтаксических конструкциях. Существительное ТЕМПЕРАТУРА отличается от прочих
параметрических существительных, в частности, тем, что в конструкциях, когда
его первая валентность насыщается словами со значением отрезка времени (средняя
температура сентября <зимы>), оно наращивает не включенный в каноническое
словарное толкование смысл 'атмосферный воздух': температура Р Х-а = 'температура
Р атмосферного воздуха, имеющая место в отрезок времени X'.
3.4. На последнем этапе семантического анализа возникает задача проверки правильности
построенной ПСемС. Семантика естественного языка свободна и допускает почти
неограниченные нарушения законов логики и здравого смысла. В частности, логические
противоречия и абсурды сами по себе нисколько не нарушают семантической правильности
высказываний и, следовательно, ПСемС. Нарушения возникают лишь тогда, когда
логически исключающие друг друга компоненты смысла находятся, по крайней мере
частично, в пресуппозициях или модальных рамках ПСемС: в семантически правильной
ПСемС содержание пресуппозиций и модальных рамок должно быть внутренне непротиворечиво
и не должно противоречить ассер-тивным частям ПСемС.
4. Получением семантически правильной ПСемС завершается лишь часть лингвистической
процедуры семантического анализа предложения. После этого возникают следующие
проблемы: 1) слияние ПСемС с остальными частями семантического представления
предложения, в особенности, с его коммуникативной структурой; 2) введение полного
поверхностно-семантического представления предложения в последовательность других
таких представлений, отражающую в целом связный текст; 3) слияние результатов
чисто лингвистического семантического анализа предложения с результатами его
логического и информационного анализа (на основе модели мышления и модели представления
знаний о внешнем мире).
5. Изучение проблематики семантического анализа предложения дает интересный
побочный результат, из которого вытекает одно важное следствие, имеющее отношение
к лингвистике текста.
5.1. Значения предложений, с одной стороны, и значения таких содержательных
единиц языка, как лексемы, граммемы и синтаксемы, с другой, обнаруживают некоторые
глубокие общие принципы организации. Все названные типы значений многослойны
и в общем случае включают, как мы видели, ассертивную часть, пресуппозиции,
модальную рамку, рамку наблюдения. Все они представимы на одном и том же семантическом
языке, с помощью принципиально одинаковых или даже одних и тех же семантических
структур. Очевидно, например, что ПСемС (разрывной) лексемы ЕСЛИ..., ТО, граммемы
деепр, в условном значении (Не зная броду, не суйся в воду = *Если не знаешь
броду, то не суйся в воду') и синтаксемы "нереферентная именная группа
в роли подлежащего плюс глагольная группа со значением узуальности в роли сказуемого",
тоже имеющей условное значение (ср. Дети, склонны проказничать = 'Если X - ребенок,
то X склонен проказничать'), должны быть очень похожими, если не идентичными.
Конечно, сентенциальные, лексические, граммемные и синтаксемные значения обнаруживают
и различия. Пресуппозиции предложения, при неизменной синтаксической структуре,
могут меняться, а пресуппозиции лексемы, граммемы и синтаксемы постоянны. По
сравнению с лексическими значениями в значениях граммем и синтаксем больше доля
субъективных элементов смысла (пресуппозиций, модальных рамок, рамок наблюдения),.и
они в гораздо большей мере обусловлен контекстом. Поразительным, однако, является
не факт различий, а факт семантических сходств между единицами столь различной
природы. Если же учесть, что правильное предложение является элементарным образцом
связного текста и легко разворачивается в семантически эквивалентный ему связный
текст (и обратно), то придется признать, что глубокие семантические аналогии
обнаруживаются между текстом и лексемой, текстом и граммемой, текстом и синтаксемой.
Лексема, граммема и синтаксема суть латентные тексты. Семантическое устройство
этих микроструктур языка повторяет устройство микро- и макроструктур текста,
демонстрируя тем самым принципиальное единство всей языковой вселенной.
5.2. Овладение загадками этих простейших структур хотя бы в пределах предложения
предстает как необходимое предварительное условие для постановки гораздо более
сложного вопроса о лингвистике текста.