Дьячок - Лексикостатистический список С.Е. Яхонтова: проблема верификации

Следите за нашими новостями!

Philology.ru - Русский филологический портал

М. Т. Дьячок

ЛЕКСИКОСТАТИСТИЧЕСКИЙ СПИСОК С.Е. ЯХОНТОВА: ПРОБЛЕМА ВЕРИФИКАЦИИ

(Иностранные языки в научном и учебно-методическом аспектах. - Вып. 7. - Новосибирск, 2008. - С. 14-18)

Лексикостатистический список С.Е. Яхонтова был предложен известным советским лингвистом-востоковедом в начале 1960-х гг. Он представляет собой несколько видоизмененный список М. Сводеша [1], разбитый на две части. Первый из этих списков включает 35 слов: ветер, вода, вошь, глаз, год, дать, два, знать, зуб, имя, камень, кость, кровь, кто, луна, новый, нос, огонь, один, полный, рог, рука, рыба, собака, солнце, соль, ты, умереть, ухо, хвост, что, этот, я, язык, яйцо. 32 слова входят в 100-словный список М. Сводеша, 3 слова (ветер, год и соль) добавлены С.Е. Яхонтовым. По мнению С.Е. Яхонтова, этот список включает наиболее устойчивую лексику любого языка мира. Второй список включает 65 слов и содержит менее устойчивую лексику.

Список С.Е. Яхонтова, составленный из 35 слов, в отличие от списка М. Сводеша, изначально не был рассчитан на проведение каких-либо углубленных лексикостатистических исследований. Его предназначение - сориентировать исследователя в вопросе, являются ли данные языки родственными и в какой мере.

Преимуществом 35-словного списка является его краткость, которая позволяет быстро определить, являются ли анализируемые языки родственными или нет. Естественно, наиболее плодотворной сферой применения списка С.Е. Яхонтова являются малоизученные языки, еще сохранившиеся в настоящее время в Латинской Америке, Африке, Новой Гвинее и отдельных районах Азии. Генеалогическая классификация этих языков до сих пор разработана недостаточно. Существует большое число языков, которые считаются изолированными или "неклассифицированными" (этот термин используют в случае недостатка данных). Кроме того, возможно применение списка и в тех случаях, когда родственные связи тех или иных языков до сих пор вызывают споры (так обстоит дело, например, с чукотско-корякскими и ительменскими языками [2]).

Статистические параметры определения степени языкового родства при использовании 35-словного списка С.Е. Яхонтова были предложены С.А. Старостиным [3]. Кратко они могут быть сформулированы следующим образом:

1. Близкородственные языки (например, славянские или германские) имеют более 30 родственных слов в списке.

2. Языки, родственные на уровне языковых групп внутри языковой семьи (например, индоевропейской), насчитывают более 15 родственных слов в списке.

3. Языки, родственные на уровне макросемей (например, ностратической), имеют более 5 схожих слов в списке.

4. Если же количество родственных слов меньше 5, то это означает, что либо данные языки не являются родственными вообще, либо их родство настолько далеко, что не может быть доказано методами традиционного сравнительно-исторического языкознания. Сходство слов при этом возникает в результате заимствования или случайного совпадения.

Проблема, однако, состоит в том, что в случае, когда мы имеем дело с малоизученными языками, говорить о родстве слов можно только предположительно. Обычно в качестве гипотетически родственных слов рассматриваются слова, имеющие одинаковое значение и близкие по своему внешнему облику. Так, в частности, долгое время анализировались лексикостатистические списки по папуасским языкам [4].

В результате основным критерием при определении близости языков оказывается не действительное генетическое родство слов, а их фонетическое сходство. Следует, однако, отметить, что в случаях, когда языки претерпевают существенные фонетические изменения, сходство даже родственных слов может отсутствовать, ср., напр., испанское agua и французское eau 'вода' (< лат. aqua) или индонезийское dua и иааи (меланезийский язык Новой Каледонии) lo 'два' (< праавстронез. *d̥uva').

Таким образом, если родственные связи языков не установлены (а именно на работу с такими языками во многом и рассчитан список С.Е. Яхонтова), то на практике приходится учитывать лишь внешнее подобие слов. Естественно, что точного критерия "похожести" слов предложить нельзя: одна и та же пара слов может казаться похожей для одного человека и непохожей для другого. Тем не менее, существуют и явно сходные слова, ср., напр. русское новый и итальянское nuovo или индонезийское darah и иааи dra 'кровь' (< праавстронез. *[dd̥]aγah). Именное такие слова и будут принимать участие в анализе.

Чтобы проверить, насколько эффективно применение списка С.Е. Яхонтова в условиях, когда нам неизвестны родственные связи слов, а во внимание принимается лишь их фонетическое сходство, рассмотрим списки по следующим языкам: русскому, английскому, испанскому и хинди. Эти языки относятся к разным группам в пределах индоевропейской языковой семьи, причем расстояние между этими группами примерно одинаково (см. таблицу).

Рассмотрим, сколько слов из этих списков будут действительно родственными, а сколько - похожими лишь внешне.

русский	английский	испанский	хинди
ветер	wind	viento	havā
вода	water	agua	pānī
вошь	louse	piojo	jũ
глаз	eye	ojo	ākh
год	year	año	sāl
дать	give	dar	denā
два	two	dos	do
знать	know	saber	jānnā
зуб	tooth	diente	dãt
имя	name	nombre	nām
камень	stone	pieso	patthar
кость	bone	hueso	haddi
кровь	blood	sangre	xun
кто	who	quien	kaun
луна	moon	luna	candra
новый	new	nuevo	nayā
нос	nose	nariz	nāk
огонь	fire	fuego	āg
один	one	uno	ek
полный	full	lleno	bhar-pūr
рог	horn	cuerno	sīg
рука	hand	mano	hāth
рыба	fish	pescado	machlī
собака	dog	perro	kuttā
солнце	sun	sol	surya
соль	salt	sal	namak
ты	you	tú	tū
умереть	die	morir	marnā
ухо	ear	oreja	kān
хвост	tail	cola	dum
что	what	que	kyā
этот	this	este	yah
я	I	yo	mãi
язык	tongue	lengua	jībh
яйцо	egg	huevo	andā

Подсчеты дают следующие результаты.

В русском и английском языке имеется 18 родственных слов: ветер - wind, вода - water, два - two, знать - know, имя - name, кто - who, новый - new, нос - nose, один - one, полный - full, солнце - sun, соль - salt, ухо - ear, что - what, этот - this, я - I, язык - tongue, яйцо - egg.

Из них по меньшей мере 8 слов сохраняют фонетическое сходство и воспринимаются как родственные с первого взгляда, без обращения к истории языков: ветер - wind, вода - water, два - two, новый - new, нос - nose, полный - full, солнце - sun, соль - salt.

В русском и испанском языках имеется 20 родственных слов: ветер - viento, дать - dar, два - dos, имя - nombre, кость - hueso, кто - quien, луна - luna, новый - nuevo, нос - nariz, один - uno, полный - lleno, солнце - sol, соль - sal, ты - tú, умереть - morir, ухо - oreja, что - que, я - yo, язык - lengua, яйцо - huevo.

По крайней мере 10 слов сохраняют фонетическое сходство: ветер - viento, дать - dar, два - dos, луна - luna, новый - nuevo, нос - nariz, солнце - sol, соль - sal, ты - tú, умереть - morir.

В русском и хинди имеется 15 родственных слов: дать - denā, два - do, знать - jānnā, имя - nām, кость - haddi, кто - kaun, новый - nayā, нос - nāk, огонь - āg, полный - bhar-pūr, солнце - surya, ты - tū, умереть - marnā, что - kyā, яйцо - andā.

Родственными с первого взгляда могут быть признаны по крайней мере 8 слов: дать - denā, два - do, знать - jānnā, новый - nayā, нос - nāk, огонь - āg, ты - tū, умереть - marnā.

Аналогичные подсчеты могут быть проведены и между другими парами сравниваемых языков: английским - испанским, английским - хинди и т.д.

Таким образом, можно сделать следующий вывод: в пределах одной языковой семьи (на уровне языковых групп) фонетически сходными оказывается примерно половина родственных слов. Иначе говоря, языки могут быть признаны родственными в пределах одной языковой семьи, если в списке С.Е. Яхонтова имеется не менее 7-8 фонетически близких слов с одинаковым значением.

Нетрудно предположить, что в случаях более отдаленного языкового родства (например, на уровне более глубоких семей или макросемей), количество фонетически близких слов будет существенно меньше. Так, сравнение списка С.Е. Яхонтова для турецкого и японского языков, родственных в пределах алтайской языковой семьи, распад которой произошел значительно раньше, чем индоевропейской (примерно в 6 тысячелетии до н. э.), дает следующие результаты.

В японском и турецком списках оказывается всего 5 родственных слов: 'год' (япон. tosi - тур. yıl < праалт. *dila), 'камень' (япон. isi - тур. taş < праалт. *tiōl'a), 'один' (япон. hitotsu - тур. bir < праалт. *birV), 'что' (япон. nan(i) - тур. ne < праалт. *ŋia-), 'я' (япон. watasi - тур. ben < праалт. *bä-) [5]. Из них лишь одна пара слов (япон. nan(i) - тур. ne) близка фонетически. Прийти к каким-либо значимым выводам на основании одного слова, конечно же, невозможно.

Итак, использование 35-словного списка С.Е. Яхонтова возможно только в том случае, когда глубина языкового родства сравниваемых языков примерно равна возрасту индоевропейской языковой семьи, т.е. находится в пределах 3-4 тыс. лет до н. э. Для определения более отдаленных родственных связей необходимо использовать другие, более точные, методы. Тем не менее, список С.Е. Яхонтова представляет собой достаточно надежный инструмент, позволяющий дать предварительную оценку степени языкового родства и указать лингвисту на направление дальнейших исследований.

Примечания

1. См. Сводеш М. Лексикостатистическое датирование доисторических этнических контактов // Новое в лингвистике. Вып. 1. - М., 1960; Сводеш М. К вопросу о повышении точности в лексикостатистическом датировании // Там же.; Дьячок М.Т. Глоттохронология: пятьдесят лет спустя // Сибирский лингвистический семинар. - Новосибирск, 2002, № 1.

2. Володин А.П. Ительменский язык // Языки мира. Палеоазиатские языки. - М., 1977. - С. 60.

3. Starostin S.A. Old Chinese Basic Vocabulary: A Historical Perspective // Journal of Chinese Linguistics. V. 8. - Berkeley, 1995.

4. Леонтьев А.А. Папуасские языки. - М., 1977. - С. 23.

5. Старостин С.А. Алтайская проблема и происхождение японского языка. - М., 1991. - С. 82-107.