С. А. Старостин
О ДОКАЗАТЕЛЬСТВЕ ЯЗЫКОВОГО РОДСТВА
(Старостин С.А. Труды по языкознанию. - М., 2007. - С. 779-793)
Русский | Эвенкийский |
я (< слав. *azъ < ПИЕ *eĝho-m-,
где исторически собственно местоименный корень - *-m, ср. косв.
основу *me-) |
bi < ТМ *bi < алт. *bĭ |
э-тот (< слав. *e- < ПИЕ *e- 'этот, тот') | e-r < ТМ *e- < алт. *e |
два (< слав. *dъva < ПИЕ *duō-u 'этот, тот') | Ʒū-r < ТМ *Ʒube- < алт. *tiubu |
что (< слав. *čь-to < ПИЕ *kwi-, *kwe- 'этот, тот') | ê-kūn < ТМ *xia- (xaj-) < алт. *k'a(j) |
кто (< слав. *kъ-to < ПИЕ *kwe- 'этот, тот') | ê-kūn < ТМ *xia- (xaj-) < алт. *k'a(j) |
Русский | Эвенкийский |
холодный (< слав. *xoldъ-nъ < ПИЕ *g(h)elə- / *kelə-, возм. (s)ghelə-) | gil-di < ТМ *gil < алт. *giĺo |
гора (< слав. *gora < ПИЕ *gwer-) | ure < ТМ *xurē < алт. *k'uri |
звезда (< слав. *gvĕzda < ПИЕ *gweizdh-) | ōsī-kta < ТМ *xōsī-kta < алт. *k'učV |
тот (< слав. *tъ < ПИЕ *to-) | ta-r < ТМ *ta < алт. *t'a (t'e) |
мы (< слав. *my < ПИЕ *mo-) | mi-t < ТМ *mün < алт. *bü-na |
пепел (< слав. *pepelъ < ПИЕ *pel-) | xule-pten < ТМ *pulńe < алт. *p'olńe |
Значение | Индоевропейский | Алтайский |
'кровь' | *esH-r | *sēga |
'рыба' | *dhĝhū- | *diojgi |
'давать' | *dō- | *t'uja |
'имя' | *enom-n̥ (*elom-n̥) | *liăm(n)o |
'солнце' | *seHw-n- (*seHw-l-) | *siagu |
'огонь' | *peHw-r- | *p'ore |
'ты' | *tū | *t'i (*t'a) (корень сохранился только в монг., но представляет собой явный архаизм) |
Значение | Индоевропейский | Алтайский |
'черный' | *kr̥-sno- | *karu (~k-) |
'есть' | *ed- | *itV (корень сохранился только в монг., но представляет собой явный архаизм) |
'лист' | *leup-, *lep- | *liap'[e] |
'мужчина' | *uī-ro- | *iōre |
'много' | *menə(gh)- | *mana |
'шея' | *mono- | *mŏjno |
'не' | *ne, *n̥- | *āna |
'тяжелый' | *gwerə- | *k'iuru |
'червь' | *kwr̥-mi- | *k'iāru (*k'iūra) |
Примечания
1. Относительно состава стандартного 100-словного списка Сводеша см. (Старостин 1989а).
2. С. Е. Яхонтов использует модифицированный
список Сводеша, из которого исключены значения all, burn, bark, bite, claw
(nail), feather, lie, seed, warm, we, вместо которых используются: far, heavy,
near, salt, short, snake, thin, wind, worm, year. В его 35-словный список
включены следующие значения: blood, bone, die, dog, year, egg, eye, fire,
fish, full, give, hand, horn, I, know, louse, moon, name, new, nose, one,
salt, stone, sun, tail, this, thou, tongue, tooth, two, water, what, who,
wind, year.
В реальной практике (в частности, компьютерной) приходится считаться как с
классическим списком (который уже обработан для очень большого числа языков),
так и со списком Яхонтова. По-этому, например, моя компьютерная система STARLING
требует для каждого языка заполнения 110-словной анкеты.
3. Вопрос о непогрешимости фонетических соответствий
давно обсуждается в сравнительном языкознании. Допустимы ли исключения из
фонетических правил, и если да, то не подрывает ли это сформулированного выше
пункта а)? На практике всякому компаративисту известны случаи отклонений от
регулярных соответствий - объясняемых аналогиями, эвфемистическими, табуистическими
или ономатопоэтическими причинами, а .зачастую никак не объясняемых (причина
нерегулярности вполне может быть не установлена). Имеет смысл поэтому говорить
не о полностью регулярных, но о систематических соответствиях, т.е. о соответствиях,
регулярно связывающих каждую фонему языка А с одной или несколькими фонемами
языка В. Система соответствий должна оцениваться не по принципу абсолютного
отсутствия исключений (хотя такое, конечно, чрезвычайно желательно), но по
принципу улучшаемости: хороша такая система, которую можно улучшить, не меняя
множества лексики, на котором эта система работает. Классический пример такого
улучшения - закон Вернера, который показал, что казавшееся немотивированным
расщепление индоевропейских глухих согласных в германском однозначно связано
с местом ударения в древнеиндийском и древнегреческом, и, таким образом, уменьшил
степень неопределенности в системе индоевропейских фонетических соответствий.
Особый вопрос - объективность фонетических соответствий, их независимость
от пристрастий конкретного исследователя. Пока не предложена идеальная формальная
процедура установления фонетических соответствий. Тем не менее некоторые алгоритмы
все же существуют. Один из них реализован в моей компьютерной системе STARLING,
которая позволяет довольно успешно устанавливать основной набор фонетических
соответствий между любыми двумя родственными языками на материале переводных
списков. Суть алгоритма в следующем:
а) вычисляется частота каждой фонемы в списке каждого из сравниваемых языков;
б) в языке А берется подмножество слов N, содержащих фонему х; в) в языке
В берется подмножество слов N', являющихся переводом слов подмножества N языка
А; г) вычисляется частота каждой фонемы языка В в подмножестве N' и сравнивается
со стандартной частотой данной фонемы во всем списке слов языка В; д) фонема
х', частота которой в подмножестве N' существенным образом (вычисляемым, например,
по правилу "трех сигм") превышает стандартную частоту данной фонемы,
считается соответствующей фонеме х языка А.
Заметим, что при такой процедуре одной фонеме х может в принципе соответствовать
несколько фонем в языке В, что не противоречит реальной компаративистической
практике.
Эта процедура позволяет устанавливать около 80% правильных фонетических соответствий
и почти не дает ложных соответствий. Точность соответствий естественно возрастает
при увеличении исходного массива данных.
Ценность этою компьютерного алгоритма состоит не столько в компьютеризации
работы компаративиста (этот алгоритм не может определить дополнительных распределений,
не срабатывает в случае выпадения фонем, т. е. соответствия некоторой фонемы
в одном языке нулю в другом, не позволяет установить многих редких, но существенных,
соответствии), сколько в доказательстве объективности факта фонетических соответствии
вообще и подтверждения выводов, эмпирически полученных исследователем.
4. Когда я говорю об "общей" лексике или "сохранившейся* лексике, я имею в виду лексику, удовлетворяющую семантическим критериям стандартной лексикостатистики, т. е. слова, имеющие общую (соответствующую друг другу) форму и единое значение. Любая мена значения автоматически вывалит слово ил сравнения. Подчеркну, что это вопрос чисто процессуальный: ясно, что слова могут менять значение, но также ясно, что если при определении родства мы допустим неточные семантические сравнения, вероятность ошибки и погрешности чрезвычайно возрастет - поскольку очень трудно формально отделить допустимый семантический сдвиг от маловероятного или вовсе невероятного. При установлении фонетических соответствий и при составлении этимологических словарей семантически неоднозначные параллели, конечно, допустимы (и могут оцениваться или оспариваться специалистами); но при тестировании родства на множестве базисной лексики следует считать только случаи одно-однозначного семантического соответствия. Существенно здесь не то, что пол. brzuch имеет хорошее соответствие в рус. брюхо, но то, что 'живот' по-польски передается как brzuch , а по-русски - как живот, т.е. словом другого происхождения.
5. Ясно, что пункты б) и в) можно переформулировать
более общим образом - поскольку 35-словный список является более устойчивым
подмножеством 100-словного, а 100-словный - более устойчивым подмножеством
всей лексики языка. В принципе можно сказать:
б) эти фонетические соответствия действуют на некотором множестве лексики
языков В и С;
в) доля общей лексики возрастает, если берется выборка из более устойчивой
лексики.
Чрезвычайно существенно, однако, оперировать с некоторым фиксированным списком
(списками). Ясно, что для любой пары языков, обнаруживающих сходства, можно
набрать свой список, доля схождений в котором будет чрезвычайно велика, и
все критерии родства окажутся в таком случае размыты. Поэтому попытки представить
различные списки базисной лексики для различных, к примеру, географических
ареалов не представляются плодотворными. Список Сводеша уже хорошо себя зарекомендовал
на материале самых различных языковых семей, и кажется целесообразным сохранить
его в качестве стандарта тестирования языкового родства.
6. Последняя теория представляется совершенно абсурдной с точки зрения классического сравнительно-исторического метода. Нет ни одного засвидетельствованного в памятниках языка, который не претерпел бы существенных изменений хотя бы за 1000 лет своего развития. Неизбежность языковых изменений с очевидностью вытекает из самой сущности языка как средства коммуникации: информационный код не может не искажаться при передаче из поколения в поколение, так же, как не может не искажаться сигнал в телефонной линии или генетический код. Но подробное обсуждение этой темы выходит за рамки настоящей статьи.
7. Здесь мы используем традиционную индоевропейскую
реконструкцию, а для праалтайского - реконструкцию, принятую коллективом Алтайского
этимологического словаря (автор данной статьи, А. В. Дыбо и О. А. Мудрак),
в настоящее время готовящегося к печати.
Большинство приводимых примеров присутствует уже в [ОСНЯ]. Мною добавлен лишь
ряд примеров, обнаруживающих неучтенное В. М. Иллич-Свитычем, но довольно
часто встречающееся соответствие алтайских глухих придыхательных *k', *t'
индоевропейским звонким *gw, *d(w) (ср. примеры 'гора*, 'звезда',
'давать', 'тяжелый').
8. На самом деле, любой корень любого из
сравниваемых языков - если нельзя продемонстрировать, что он .заимствован
из некоторого другого языка - имеет шанс быть возведенным к праязыку, Этот
шанс вполне может быть оценен статистически: при общем числе равноудаленных
языков n и при степени сохранности корня (т. е. числе языков, сохранивших
его рефлекс) х вероятность возвести произвольный корень к праязыку равна 1/(1Ух).
Ясно поэтому, что в ситуации бинарного сравнения (при делении праязыка ровно
на два языка-потомка) число реконструируемых (то есть сохранившихся в обоих
языках) корней может быть очень невелико, в зависимости от глубины соответствующей
семьи, однако весьма велико число потенциально реконструируемых корней: каждый
корень в языке, имеющем лишь одного родственника, с вероятностью 0.5 может
продолжать некоторый праязыковой корень. Эта вероятность естественно уменьшается
при увеличении числа сравниваемых языков, однако при этом неизбежно возрастает
число реально реконструируемых корней (естественно, если сравниваемые языки
родственны).
Поэтому нет ничего удивительного в том, что, скажем, для прауральского восстанавливается
меньше корней, чем для праностратического: уральская семья делится ровно на
две ветви (финно-угорскую и самодийскую), и общеуральскими по определению
считаются только корни, сохранившиеся в обеих ветвях - хотя, как мы показали
выше, каждый, к примеру, финно-угорский корень имеет довольно высокую вероятность
(0.5) быть возведенным к общеуральскому состоянию.
Аналогичная ситуация налицо, к примеру, и в севернокавказских языках. Число
общих севернокавказских корней невелико (около 700) - только в силу бинарного
членения севернокавказской общности (на западнокавказскую и восточнокавказскую
подгруппы). При этом ясно, что реальный корневой состав общесевернокавказского
языка был существенно больше, поскольку каждый отдельный восточнокавказский
или западнокавказский корень имеет весьма высокий шанс быть возведенным к
общесевернокавказскому состоянию.
Интересно, что в этимологически хорошо разработанных семьях с большим ветвлением
(типа индоевропейской, финно-угорской, алтайской, восточнокавказской, австронезийской,
синотибетской и т. п.) число реконструируемых корней приближается к некоторой
константе, колеблющейся около 2-2.5 тысяч. Это число, по-видимому, не зависит
от временной глубины соответствующей семьи, поскольку совершенно аналогичные
цифры мы получаем для молодых семей типа славянской, германской, тюркской
и т.п. Наличие подобной константы можно объяснить только тем, что реконструируемые
праязыки представляли собой реальные языковые образования со средним для любого
языка числом морфем. Гипотеза о том, что любой язык имеет конечное число корней,
колеблющееся между 2-3 тысячами, вполне вероятна, хотя и нуждается в дополнительной
типологической проверке. Так, словарь морфем современного русского языка [Кузнецова,
Ефремова 1986] насчитывает 4400 корней, хотя реальное число, видимо, существенно
меньше (в качестве отдельных единиц в словарь включены варианты корней типа
оберт- при верт- и т. п.).
9. Примеров можно привести множество. Так,
реконструкция анлаутных звонких (*d-, *g-) в пратюркском принимается
не всеми исследователями, поскольку реально они сохраняются только в одной
- огузской - подгруппе; в прочих языках, начиная с древнетюркского, оппозиция
глухости-звонкости в анлауте отсутствует. Внешние же (монгольские и тунгусо-маньчжурские)
данные однозначно поддерживаю! реконструкцию звонких и таким образом позволяют
уточнить пратюркскую реконструкцию. Праслав. *noktь 'ночь' реконструируется
именно так (не *notjь) только в силу того, что известен индоевропейский
прототип этого корня *nokwt-. Даже реконструкция праславянских
сочетаний типа *TorT, *TolT была бы вряд ли возможна чисто на славянской
почве, без привлечения данных внешнего сравнения.
Литература
АПиПЯА - С.А. Старостин. Алтайская проблема и происхождение
алтайского языка. М., 1991.
Кузнецова, Ефремова 1986 - А.И. Кузнецова, Т.Ф. Ефремова. Словарь морфем русского
языка. М., 1986.
ОСНЯ - В.М. Иллия-Свитыч. Опыт сравнения ностратических языков (семито-хамитский,
картвельский, индоевропейский, уральский, дравидийский, алтайский). Сравнительный
словарь. М.: Наука. Т. I, 1971. Т. II, 1976. Т. III, 1984.
Сводеш 1960 - М. Сводеш. Лексико-статистическое датирование доисторических
этнических контактов (на материале племен эскимосов и североамериканских индейцев)
// Новое в лингвистике. Вып. I. М., 1960.
Старостин 1989а - С.А. Старостин. Сравнительно-историческое языкознание и
лексикостатистика // Лингвистическая реконструкция и древнейшая история Востока.
Ч. I. М., 1989: 3-39.
Шайкевич 1995 - А.Я. Шайкевич. Введение в лингвистику. М., 1995.
Birnbaum 1978 - H. Birnbaum. Linguistic Reconstruction, its Potential and
Limitations in New Perspective. Washington, 1978.
Dixon 1997 - R.M.W. Dixon. The Rise and Fall of Languages. Cambridge, 1997.
Lehman 1992 - W.P. Lehman. Historical Linguistics: an Introduction. Third
edition. London - New York, 1992.
Meillet 1907 - A. Meillet. Introduction à l'étude comparative
des langues indo-européennes. Paris, 1907.
Nichols 1992 - J. Nichols. Linguistic Diversity in Space and Time. Chicago,
1992.
Ruhlen 1987 - M. Ruhlen. Guide to the World's Languages. Stanford, 1987.
Trask 1996 - R.L. Trask. Historical Linguistics. London, New York, Sidney,
Auklend, 1996.
Впервые опубликовано в: Типология и теория языка (к 60-летию А.Е. Кибрика). М., 1999. С. 57-69.