Следите за нашими новостями!
Твиттер      Google+
Русский филологический портал

М. Т. Дьячок

ЛЕКСИКОСТАТИСТИЧЕСКИЙ СПИСОК С.Е. ЯХОНТОВА: ПРОБЛЕМА ВЕРИФИКАЦИИ

(Иностранные языки в научном и учебно-методическом аспектах. - Вып. 7. - Новосибирск, 2008. - С. 14-18)


 
Лексикостатистический список С.Е. Яхонтова был предложен известным советским лингвистом-востоковедом в начале 1960-х гг. Он представляет собой несколько видоизмененный список М. Сводеша [1], разбитый на две части. Первый из этих списков включает 35 слов: ветер, вода, вошь, глаз, год, дать, два, знать, зуб, имя, камень, кость, кровь, кто, луна, новый, нос, огонь, один, полный, рог, рука, рыба, собака, солнце, соль, ты, умереть, ухо, хвост, что, этот, я, язык, яйцо. 32 слова входят в 100-словный список М. Сводеша, 3 слова (ветер, год и соль) добавлены С.Е. Яхонтовым. По мнению С.Е. Яхонтова, этот список включает наиболее устойчивую лексику любого языка мира. Второй список включает 65 слов и содержит менее устойчивую лексику.
Список С.Е. Яхонтова, составленный из 35 слов, в отличие от списка М. Сводеша, изначально не был рассчитан на проведение каких-либо углубленных лексикостатистических исследований. Его предназначение - сориентировать исследователя в вопросе, являются ли данные языки родственными и в какой мере.
Преимуществом 35-словного списка является его краткость, которая позволяет быстро определить, являются ли анализируемые языки родственными или нет. Естественно, наиболее плодотворной сферой применения списка С.Е. Яхонтова являются малоизученные языки, еще сохранившиеся в настоящее время в Латинской Америке, Африке, Новой Гвинее и отдельных районах Азии. Генеалогическая классификация этих языков до сих пор разработана недостаточно. Существует большое число языков, которые считаются изолированными или "неклассифицированными" (этот термин используют в случае недостатка данных). Кроме того, возможно применение списка и в тех случаях, когда родственные связи тех или иных языков до сих пор вызывают споры (так обстоит дело, например, с чукотско-корякскими и ительменскими языками [2]).
Статистические параметры определения степени языкового родства при использовании 35-словного списка С.Е. Яхонтова были предложены С.А. Старостиным [3]. Кратко они могут быть сформулированы следующим образом:
1. Близкородственные языки (например, славянские или германские) имеют более 30 родственных слов в списке.
2. Языки, родственные на уровне языковых групп внутри языковой семьи (например, индоевропейской), насчитывают более 15 родственных слов в списке.
3. Языки, родственные на уровне макросемей (например, ностратической), имеют более 5 схожих слов в списке.
4. Если же количество родственных слов меньше 5, то это означает, что либо данные языки не являются родственными вообще, либо их родство настолько далеко, что не может быть доказано методами традиционного сравнительно-исторического языкознания. Сходство слов при этом возникает в результате заимствования или случайного совпадения.
Проблема, однако, состоит в том, что в случае, когда мы имеем дело с малоизученными языками, говорить о родстве слов можно только предположительно. Обычно в качестве гипотетически родственных слов рассматриваются слова, имеющие одинаковое значение и близкие по своему внешнему облику. Так, в частности, долгое время анализировались лексикостатистические списки по папуасским языкам [4].
В результате основным критерием при определении близости языков оказывается не действительное генетическое родство слов, а их фонетическое сходство. Следует, однако, отметить, что в случаях, когда языки претерпевают существенные фонетические изменения, сходство даже родственных слов может отсутствовать, ср., напр., испанское agua и французское eau 'вода' (< лат. aqua) или индонезийское dua и иааи (меланезийский язык Новой Каледонии) lo 'два' (< праавстронез. *d̥uva').
Таким образом, если родственные связи языков не установлены (а именно на работу с такими языками во многом и рассчитан список С.Е. Яхонтова), то на практике приходится учитывать лишь внешнее подобие слов. Естественно, что точного критерия "похожести" слов предложить нельзя: одна и та же пара слов может казаться похожей для одного человека и непохожей для другого. Тем не менее, существуют и явно сходные слова, ср., напр. русское новый и итальянское nuovo или индонезийское darah и иааи dra 'кровь' (< праавстронез. *[dd̥]aγah). Именное такие слова и будут принимать участие в анализе.
Чтобы проверить, насколько эффективно применение списка С.Е. Яхонтова в условиях, когда нам неизвестны родственные связи слов, а во внимание принимается лишь их фонетическое сходство, рассмотрим списки по следующим языкам: русскому, английскому, испанскому и хинди. Эти языки относятся к разным группам в пределах индоевропейской языковой семьи, причем расстояние между этими группами примерно одинаково (см. таблицу).
Рассмотрим, сколько слов из этих списков будут действительно родственными, а сколько - похожими лишь внешне.
 
русский
английский
испанский
хинди
ветер wind viento havā
вода water agua pānī
вошь louse piojo
глаз eye ojo ākh
год year año sāl
дать give dar denā
два two dos do
знать know saber jānnā
зуб tooth diente dãt
имя name nombre nām
камень stone pieso patthar
кость bone hueso haddi
кровь blood sangre xun
кто who quien kaun
луна moon luna candra
новый new nuevo nayā
нос nose nariz nāk
огонь fire fuego āg
один one uno ek
полный full lleno bhar-pūr
рог horn cuerno sīg
рука hand mano hāth
рыба fish pescado machlī
собака dog perro kuttā
солнце sun sol surya
соль salt sal namak
ты you
умереть die morir marnā
ухо ear oreja kān
хвост tail cola dum
что what que kyā
этот this este yah
я I yo mãi
язык tongue lengua jībh
яйцо egg huevo andā
 
Подсчеты дают следующие результаты.
В русском и английском языке имеется 18 родственных слов: ветер - wind, вода - water, два - two, знать - know, имя - name, кто - who, новый - new, нос - nose, один - one, полный - full, солнце - sun, соль - salt, ухо - ear, что - what, этот - this, я - I, язык - tongue, яйцо - egg.
Из них по меньшей мере 8 слов сохраняют фонетическое сходство и воспринимаются как родственные с первого взгляда, без обращения к истории языков: ветер - wind, вода - water, два - two, новый - new, нос - nose, полный - full, солнце - sun, соль - salt.
В русском и испанском языках имеется 20 родственных слов: ветер - viento, дать - dar, два - dos, имя - nombre, кость - hueso, кто - quien, луна - luna, новый - nuevo, нос - nariz, один - uno, полный - lleno, солнце - sol, соль - sal, ты - tú, умереть - morir, ухо - oreja, что - que, я - yo, язык - lengua, яйцо - huevo.
По крайней мере 10 слов сохраняют фонетическое сходство: ветер - viento, дать - dar, два - dos, луна - luna, новый - nuevo, нос - nariz, солнце - sol, соль - sal, ты - tú, умереть - morir.
В русском и хинди имеется 15 родственных слов: дать - denā, два - do, знать - jānnā, имя - nām, кость - haddi, кто - kaun, новый - nayā, нос - nāk, огонь - āg, полный - bhar-pūr, солнце - surya, ты - tū, умереть - marnā, что - kyā, яйцо - andā.
Родственными с первого взгляда могут быть признаны по крайней мере 8 слов: дать - denā, два - do, знать - jānnā, новый - nayā, нос - nāk, огонь - āg, ты - tū, умереть - marnā.
Аналогичные подсчеты могут быть проведены и между другими парами сравниваемых языков: английским - испанским, английским - хинди и т.д.
Таким образом, можно сделать следующий вывод: в пределах одной языковой семьи (на уровне языковых групп) фонетически сходными оказывается примерно половина родственных слов. Иначе говоря, языки могут быть признаны родственными в пределах одной языковой семьи, если в списке С.Е. Яхонтова имеется не менее 7-8 фонетически близких слов с одинаковым значением.
Нетрудно предположить, что в случаях более отдаленного языкового родства (например, на уровне более глубоких семей или макросемей), количество фонетически близких слов будет существенно меньше. Так, сравнение списка С.Е. Яхонтова для турецкого и японского языков, родственных в пределах алтайской языковой семьи, распад которой произошел значительно раньше, чем индоевропейской (примерно в 6 тысячелетии до н. э.), дает следующие результаты.
В японском и турецком списках оказывается всего 5 родственных слов: 'год' (япон. tosi - тур. yıl < праалт. *dila), 'камень' (япон. isi - тур. taş < праалт. *tiōl'a), 'один' (япон. hitotsu - тур. bir < праалт. *birV), 'что' (япон. nan(i) - тур. ne < праалт. *ŋia-), 'я' (япон. watasi - тур. ben < праалт. *bä-) [5]. Из них лишь одна пара слов (япон. nan(i) - тур. ne) близка фонетически. Прийти к каким-либо значимым выводам на основании одного слова, конечно же, невозможно.
Итак, использование 35-словного списка С.Е. Яхонтова возможно только в том случае, когда глубина языкового родства сравниваемых языков примерно равна возрасту индоевропейской языковой семьи, т.е. находится в пределах 3-4 тыс. лет до н. э. Для определения более отдаленных родственных связей необходимо использовать другие, более точные, методы. Тем не менее, список С.Е. Яхонтова представляет собой достаточно надежный инструмент, позволяющий дать предварительную оценку степени языкового родства и указать лингвисту на направление дальнейших исследований.
 

Примечания

1. См. Сводеш М. Лексикостатистическое датирование доисторических этнических контактов // Новое в лингвистике. Вып. 1. - М., 1960; Сводеш М. К вопросу о повышении точности в лексикостатистическом датировании // Там же.; Дьячок М.Т. Глоттохронология: пятьдесят лет спустя // Сибирский лингвистический семинар. - Новосибирск, 2002, № 1.

2. Володин А.П. Ительменский язык // Языки мира. Палеоазиатские языки. - М., 1977. - С. 60.

3. Starostin S.A. Old Chinese Basic Vocabulary: A Historical Perspective // Journal of Chinese Linguistics. V. 8. - Berkeley, 1995.

4. Леонтьев А.А. Папуасские языки. - М., 1977. - С. 23.

5. Старостин С.А. Алтайская проблема и происхождение японского языка. - М., 1991. - С. 82-107.