Следите за нашими новостями!
Твиттер      Google+
Русский филологический портал

Дж. Гринберг

ОПРЕДЕЛЕНИЕ МЕРЫ РАЗНОЯЗЫЧИЯ

(Новое в лингвистике. - Вып. 6. - М., 1972. - С. 204-214)


 
1. При взгляде на карту распределения языков на достаточно обширном пространстве бросается в глаза несходство отдельных территорий: мы видим там и участки чрезвычайно пестрые, вроде Новой Гвинеи или Нубийских Холмов в Судане, и сравнительно однородные, такие, как Восточные Леса Северной Америки до завоевания или же современные Соединенные Штаты, и, наконец, все промежуточные градации. В настоящей статье мы рассмотрим вопрос о выработке оценок, которые помогли бы в объективной форме выразить субъективные впечатления от этих различий, дав последним количественную характеристику, позволили бы сравнивать между собой территории, географически несходные, и, быть может, обнаружить некоторую связь между уровнем разноязычия (linguistic diversity), с одной стороны, и политическими, экономическими, географическими, историческими и прочими внеязыковыми факторами - с другой.
2. Первый, простейший способ оценки - мы будем называть его методом А - это одноязычный невзвешенный метод (monolingual nonweighted method) (смысл этого наименования вскоре станет ясным читателю). Вероятность того, что два произвольно взятых жителя данной территории говорят на общем языке, можно считать мерой разноязычия этой территории. Если все жители данной местности говорят на одном языке, то вероятность общего языка у двух произвольно взятых жителей, очевидно, равна 1, то есть достоверности. Наоборот, если каждый житель говорит на своем языке, то вероятность эта будет равна нулю. Поскольку мы хотим измерять не степень сходства, а уровень различий, то мы будем вычитать значения вероятности из 1, так что наш показатель будет изменяться в пределах от 0, что соответствует минимальному уровню разноязычия, до 1, то есть до самого высокого уровня.
Общая вероятность случайного отбора двух людей, говорящих на одном и том же языке, представляет собой сумму вероятностей такого отбора для каждого из распространенных в данной местности языков М, N, О и т. д. В свою очередь эти вероятности выражаются как m2, n2, о2, . . ., где m - отношение числа носителей языка М ко всему населению, n - то же самое для языка N и т. д. Вычитая эти вероятности из 1, как мы только что условились, получаем формулу :1 минус сумма квадратов m, n, о и т. д., или
 
(1) A = 1 - Σi (2),
 
где А - показатель разноязычия, a i последовательно принимает значения m, n, о и т. д. Поясним это на условном примере. Если 1/8 населения некоторой местности говорит на языке М, 3/8 - на языке N и 1/2 - на языке О, то
 
А = 1 - [1/8)2 + (3/8)2 + (1/2)2] = 1 - 26/64 = 38/64, т. е. 0,593...
 
3. Есть два соображения, побуждающие строить другую модель, более сложную, но отражающую степень близости между языками. Дело в том, что, во-первых, при пропорциональном распределении языков в каких-либо двух местностях мы хотели бы считать более разноязычной ту из них, в которой говорят на языках неродственных или отдаленно родственных, по сравнению с областью, где распространены близкородственные языки, входящие в одну языковую группу. Во-вторых, поскольку нет четкого определения, отличающего язык от диалекта, данные по разным территориям могут оказаться, строго говоря, несопоставимыми, если придерживаться обычного условного разграничения. Ввиду этого можно предложить следующее видоизменение вышеописанной процедуры, которое мы назовем одноязычным взвешенным методом (monolingual weighted method), или методом В. Для пары языков М и N вероятность случайного отбора последовательно сначала носителя М, а затем носителя N, равна произведению mn, где m (соответственно n) - это доля, которую составляют носители языка М (соответственно, языка N). Помножим это произведение на весовой коэффициент, пробегающий значения от 0 до 1; коэффициент этот, называемый коэффициентом сходства (resemblance) r, определяется так: берем произвольный, но фиксированный набор слов, например новейшую редакцию глоттохронологического списка, и подсчитываем для каждой пары языков, какую долю составляют совпадающие слова. Поскольку измеряем мы реальное сходство, а не историческое родство, предлагается заимствования учитывать наравне со словами, восходящими к единому корню. Вычитая сумму взвешенных таким образом произведений из единицы, получаем значение взвешенного одноязычного показателя В:
 
(2) B = 1 - Σmn (mn) (rMN),
 
где rMN - коэффициент сходства между языками М и N, отвечающий приведенному определению. В сущности, метод А можно считать частным случаем метода В, при котором тип помножаются на 1, если они равны, и на 0, если они неравны. В частности, для первого примера
 
A = 1 - 1 x [(1/8)2 + (3/8)2 + (1/2)2] + 0 x [(1/8 x 3/8) + (1/8 x 1/2) + (3/8 x 1/8) + (3/8 x 1/2) + (1/2 x 1/8) + (1/2 x 3/8)].
 
Процедуру расчета показателя В можно проиллюстрировать на том же примере, слегка видоизменив его. Принимая прежнее распределение языков М, N и О, допустим теперь, что коэффициент сходства между языками М и N равен 0,85, между М и О - 0,30, а между N и О - 0,25. Тогда
 
B = 1 - [(1/64 x 1) + (3/64 x 0,85) + (1/16 x 0,30) + (3/64 x 0,85) + (9/64 x 1) + (3/16 x 0,25) + (1/16 x 0,30) + (3/16 x 0,25) + (1/4 x 1)] = 0,381.
 
Очевидно, что В всегда меньше или равно А (последнее будет иметь место, только когда коэффициенты сходства для всех пар языков равны нулю). Безразлично, назовем ли мы языки, имеющие коэффициент сходства равный единице, разными языками или же будем считать, что это один и тот же язык. Мы, таким образом, попутно получили рабочее определение языка как совокупности говоров со 100-процентным сходством «базовых» словарей - определение, которое вне данного контекста необязательно окажется удачным. Пользуясь методом А, можно избавиться от известной расплывчатости понятия «язык», приняв в качестве критерия языкового тождества коэффициент сходства, равный 1,00 или чуть меньше, скажем как минимум 0,95.
4. В принципе мы предполагаем с учетом всевозможных поправок, что более разноязычными окажутся территории с низким уровнем коммуникации и что повышение этого уровня, сопряженное с ростом хозяйства и развитием государственности, как правило, должно вести к распространению некоторого местного или заимствованного языка-посредника (lingua franca), к росту двуязычия и в конечном счете к исчезновению всех языков, кроме одного господствующего. Естественно поэтому ожидать, что между показателями разноязычия и показателями уровня культуры и экономики будут наблюдаться корреляции, выявить которые возможно только при учете фактора многоязычия.
Мы назвали показатели А и В одноязычными в том смысле, что при их вычислении каждый житель территории учитывался как носитель только одного языка - своего родного. В настоящем разделе мы опишем ряд показателей, учитывающих данные о многоязычии. Сразу же напрашивается простейший способ, который состоит в том, чтобы посчитать человека, говорящего на двух языках, за двоих, говорящего на трех языках - за троих и т. д. Назовем этот способ методом дробления индивида (split-personality method) и обозначим его невзвешенный и взвешенный варианты соответственно буквами С и D. Логически более приемлем, может быть, другой способ - метод случайного говорящего (random speaker method), в свою очередь со взвешенным и невзвешенным вариантами. Этот метод основан на следующей вероятностной схеме. Допустим, что взят первый попавшийся житель данной местности и что он полиглот, который с равной вероятностью заговорит на любом из известных ему языков; выберем произвольно другого жителя, и вероятность того, что оба заговорят на одном языке, будем считать значением показателя Е, а вероятное значение коэффициента сходства между языками, на которых они заговорят, - значением показателя F. Для населения сплошь одноязычного показатель Е будет иметь то же значение, что А, а показатель F - то же значение, что В. Процедура расчетов тоже будет, в общем, такая же, как при вычислении А и, соответственно, В, но с той разницей, что население теперь разбивается на доли говорящих на каждом из языков и на нескольких языках во всех возможных сочетаниях. Так, население местности, где употребляются языки М, N и О, будет разбито, скажем, на следующие доли: m = 1/8 - говорящие только на языке М; n = 3/8 - говорящие только на языке N; о = 1/16 - говорящие только на О; mn = 1/4 - двуязычные, говорящие на языках М и N; mo = 0 - двуязычные, говорящие на М и О; no = 3/16 - двуязычные, говорящие на N и О; и, наконец, mno = 1/16 - трехъязычные, говорящие на М, N и О. В сумме эти величины, естественно, дают 1, то есть все население. Попарные произведения всех долей вычисляются, как было описано. В данном случае этих пар 49, считая и те, которые имеют нулевое значение. Так, скажем, mn x mno = 1/4 x 1/16 = 1/64, - вероятность того, что при случайном отборе первый человек будет говорить на языках М и N, а второй окажется трехъязычным. Далее каждое произведение нужно поделить на число частей, полученное от перемножения. Так, произведение mn x mno в предыдущем примере нужно разделить на 6, что соответствует числу комбинаций языков MM, MN, МО, NM, NN и NO. При вычислении показателя Е эти значения умножаются либо на 1 для тождественных пар (MM, NN), либо на O -для разнородных пар (MN, МО, NM и NO). В нашем примере, где произведение mn x mno = 1/4 x 1/16 = 1/64 делится на 6 частей, каждая из которых будет равна 1/384, две из них надо помножить на 1, а четыре - на 0, так что в результате получится 1/64 X 1/3 = 1/192. При вычислении показателя F каждую из шести частей нужно помножить на коэффициент сходства соответствующей пары языков. Как и в предыдущих случаях, полученные значения суммируются и вычитаются из единицы.
Следующий возможный метод оценки - метод случайных собеседников (random speaker-hearer method), или метод G. Этот показатель измеряется вероятностью того, что если произвольно взятый многоязычный житель некоторой местности заговорит на любом из известных ему языков, то другой произвольно взятый житель этой местности сможет его понять, иными словами, будет знать тот язык, на котором заговорит первый. Сглаживая эффект разноязычия, этот показатель более рельефно отражает распространение lingua franca. Практически применим только невзвешенный вариант этого метода. Процедура расчета та же, что и при методе Е; единственная разница состоит в том, что после того как произведения долей, характеризующих многоязычные группы, будут разделены на равные части, каждая часть умножается на 1 не только для пар тождественных языков, но и для пар, второй член которых хотя бы в одной паре выступает в качестве первого члена. Так, возвращаясь к примеру из пункта 4, на единицу теперь следует помножать доли, соответствующие не только парам ММ и NN, но и парам MN и NM, а на 0 - только доли, соответствующие парам NO и МО. В результате вместо значения 1/192, полученного по методу Е, получаем 1/64 x 2/3 = 1/96.
Наконец, последним предлагается показатель уровня коммуникации (index of communication), Н, который определяется как вероятность того, что два произвольно взятых жителя некоторой местности говорят хотя бы на одном общем языке. Этот показатель отражает реальную возможность языкового общения между двумя случайными собеседниками, в силу чего он чувствительнее других показателей реагирует на такие явления, как распространение вспомогательных языков. Чтобы определить его, нужно сначала разделить все население на доли, отражающие число говорящих на каждом из языков и на каждой комбинации языков, а затем вычислить все попарные произведения этих долей, как при методе Е. Затем, если среди языков, соответствующих сомножителям произведения, имеется хотя бы один общий, то такое произведение помножается на 1. Например, если 1/20 населения говорит на трех языках MNO и 1/20 - на двух языках ОР, то произведение этих долей, равное 1/400, следует помножить на 1. Потом все произведения складываются. Вычитать их из 1 в данном случае, по-видимому, не имеет смысла, так как тогда мы получили бы не показатель коммуникации, а показатель разобщенности.
Уровень коммуникации и языковая однородность (величина, противоположная разноязычию и определяемая вычитанием показателей разноязычия из 1) - понятия не равнозначные. Действительно, при высоком уровне разноязычия показатель уровня коммуникации может быть равен 1, что имеет место, когда все члены разноязычного населения владеют некоторым общим языком.
Отметим также, что описанные выше показатели не учитывают, что полиглот владеет известными ему языками неодинаково. Пока что нет удовлетворительного способа оценки этих различий, и даже если бы удалось его разработать, то едва ли возможно было бы его применить настолько широко, чтобы получить данные, характеризующие с этой точки зрения население целой области. Правда, можно было бы выделить основной, обычно родной язык, отличив его от прочих (такие сведения часто даже включают в переписи), но мы не видим, как дать этим различиям математическое выражение, которое не было бы произвольным.
Условный пример табл. 1 показывает, каким образом происходит рост уровня коммуникации.
 
C
D
E
F
G
H
I
0,80
0,40
0,80
0,40
0,80
0,20
II
0,83
0,37
0,75
0,365
0,66
0,48
III
0,64
0,31
0,60
0,30
0,40
1,0
IV
0,70
0,50
0,70
0,60
0,40
1,00
 
В строке I показано население, которое распадается на пять одноязычных групп, равных по численности и говорящих, соответственно, на языках М, N, О, Р и Q; коэффициент сходства для любой пары языков равен 0,50. На стадии, отраженной в строке II, один из языков, М, начал распространяться и усвоен половиной носителей каждого из остальных четырех языков. В результате 1/5 населения говорит только на М, по 1/10 приходится на двуязычные группы МN, МО, МР и МQ, а еще по 1/10 - это одноязычные, не говорящие на М. На следующей стадии (III), язык М известен уже всему населению, которое, если не считать исконных носителей М, теперь сплошь состоит из двуязычных. IV строке соответствует следующая картина: имеется универсальный язык-посредник R, не родственный ни одному из местных языков; население, таким образом, распадается на пять равных по численности двуязычных групп: MR, NR, OR, РR и QR, причем коэффициент сходства между языком R и любым местным языком = 0,00, а между местными языками, как и ранее, 0,50. Как указывалось, С обозначает невзвешенный метод дробления индивида, D - взвешенный метод дробления индивида, Е - невзвешенный метод случайного говорящего, F - взвешенный метод случайного говорящего, G - метод случайных собеседников и Н - показатель уровня коммуникации.
5. Поскольку исходные данные о группах, говорящих на том или ином языке или на той или иной комбинации языков, выражаются долями от общей численности населения, вышеизложенные методы применимы к различным местностям независимо от территории и численности населения (что является, несомненно, достоинством этих методов). Какие области избрать объектом для сравнения - этот вопрос исследователь решает по своему усмотрению, исходя из специфики интересующих его проблем. В обычном случае сравниваемые области должны быть хотя бы приблизительно равны по территории и численности населения. В самом деле, представляется сомнительным, чтобы можно было извлечь какую-либо пользу, скажем, из сравнения уровня разноязычия на островах Зеленого Мыса с соответствующим показателем, вычисленным для Азиатского континента. В то же время подобрать для сравнения местности, абсолютно одинаковые по территории или по численности населения, бывает практически невозможно, так как данные переписей всегда относятся к установленным политико-административным единицам.
Возникает вопрос, нельзя ли учесть эти расхождения, внеся некоторый поправочный коэффициент. В принципе при увеличении территории разноязычие должно возрастать. Можно показать, что если вычислить показатели разноязычия отдельно для местностей X и Y, а затем для объединенной территории X + Y, то общий показатель будет больше обоих или хотя бы одного из них. Равен он будет частным показателям лишь в случае их равенства между собой, а также если в местностях X и Y в одинаковых пропорциях распределены одни и те же языки; ни при каких условиях общий показатель не будет меньше каждого частного.
Сказанное можно проиллюстрировать данными табл. 2. Из 32 [1] штатов и территорий Мексики у 20 показатель А (одноязычный невзвешенный метод) ниже, чем для страны в целом, и только у 12 - выше. У 23 отдельных штатов и территорий показатель уровня коммуникации Н выше, чем для страны в целом, и только у девяти он ниже. Пример Кавказа в этом смысле еще разительнее: шесть из семи кавказских районов имеют показатель разноязычия А ниже, чем Кавказ в целом, и только у Дагестана, района исключительно разноязычного, этот показатель несколько выше.
 
  A H
Агуас Кальентес 0,0016 0,9997
Вера Крус 0,3465 0,8175
Герреро 0,3655 0,7371
Гуанахуато 0,0152 0,9992
Дуранго 0,0404 0,9862
Идальго 0,5060 0,6665
Кампече 0,4997 0,7042
Керетаро 0,1665 0,9469
Кинтана-Роо 0,5508 0,7448
Коауила 0,0324 0,9998
Колима 0,0140 1,0000
Мехико, штат 0,3763 0,8635
Мичоакан 0,1189 0,9624
Морелос 0,2476 0,9949
Наярит 0,0720 0,9588
Нуэво-Леон 0,0288 0,9978
Оахака 0,8363 0,4767
Пуэбла 0,5922 0,7043
Сан-Луис-Потоси 0,3357 0,8610
Сакатекас 0,0002 0,9998
Северная Нижняя Калифорния 0,3893 0,9434
Синалоа 0,0618 0,9950
Сонора 0,2226 0,9577
Табаско 0,1871 0,9588
Тамаулипас 0,0570 0,9988
Тласкала 0,3104 0,8982
Федеральный округ 0,1295 0,9994
Халиско 0,0141 1,0000
Чиуауа 0,1955 0,9112
Южная Нижняя Калифорния 0,0315 0,9999
Юкатан 0,4056 0,9998
     
Мексика 0,3122 0,8386
     
Грузия 0,6370  
Армения 0,2740  
Азербайджан 0,6105  
Дагестан 0,8988  
Чечения 0,1161  
Северная Осетия 0,2736  
Карачаевская обл. 0,3252  
     
Кавказ 0,8703  
     
Провинция Плато (Сев. Нигерия) 0,9539  
 
При сравнении двух районов, X и Y, естественно было бы ожидать, что если Y больше X, то уровень разноязычия в районе Y будет равняться уровню разноязычия в территориальном комплексе, состоящем из X и дополнительного участка, равного Y - X, принимая, что на этом дополнительном участке уровень разноязычия тот же, что в районе X. Однако, как мы видели, разноязычие территориального комплекса нельзя определить исходя из показателей, характеризующих отдельные районы. Даже в случае, когда эти показатели равны, уровень разноязычия на объединенной территории будет зависеть от того, какие из языков того или иного района одновременно употребляются и в других районах, а всякое заведомое предположение на этот счет представляется произвольным. Проблема, таким образом, остается пока не решенной.
6. Выше мы мимоходом указали на различие между уровнем возможностей общения, или уровнем коммуникации, измеряемым показателем Н, и степенью языковой однородности, меру которой можно получить, вычитая любой показатель разноязычия из единицы. Полезно определить также, в чем заключается разница между взвешенными и невзвешенными показателями разноязычия. Для этого представим себе, с одной стороны, глухую сельскую местность с примитивным хозяйством, а с другой - промышленный район, население которого разноплеменно и состоит из переселенцев, недавно прибывших из районов, удаленных друг от друга. Невзвешенные показатели разноязычия у этих двух местностей могут оказаться равными; однако взвешенные значения, отражающие степень сходства между языками, вероятно, покажут более высокий уровень разноязычия для промышленного района. Из этого примера видно также, что хотя, вообще говоря, в районах с низким уровнем коммуникации и хозяйственного развития скорее можно ожидать высокого уровня разноязычия, связь эта далеко не проста. Так, повышение уровня коммуникации в местности, где до этого господствовала разобщенность, может на первых порах вызвать повышение всех показателей разноязычия.
Мы не будем здесь углубляться в рассмотрение связи между значениями отдельных показателей разноязычия и внеязыковыми факторами, так как изучение этой связи - дело прежде всего социологии и этнографии. Итогом такого изучения могла бы явиться типологическая классификация, которая установила бы, что районы, у которых совпадают значения всех показателей разноязычия, характеризуются одинаковыми экологическими, экономическими и политическими условиями.
7. В табл. 2 приведены значения ряда показателей, вычисленных специально, чтобы проиллюстрировать на примерах, какого рода данные можно получать с помощью описанных методов. Показатели А (невзвешенный одноязычный метод) и Н (уровень коммуникации) рассчитаны для всех штатов и территорий Мексики и для страны в целом по данным переписи 1930 г.; выбор объясняется, в частности, наличием в этой переписи сведений о двуязычии. Взвешенные показатели не вычислялись, так как с этим сопряжены очень трудоемкие расчеты, да и все равно имеющаяся лингвистическая информация недостаточно полна. Затем следуют значения показателя А, вычисленные для семи районов Кавказа отдельно и для всей территории в целом по данным переписи 1926 г. Наконец, мы вычислили показатель А еще для одной территории - для провинции Плато в Северной Нигерии [2]. Это местность рекордно высокого разноязычия: показатель А для нее выше, чем для Дагестана и Оахаки, территорий, которые также весьма примечательны в этом отношении.
 

Примечания

1. В таблице 31 территория; вероятно, пропущен Чиапас. - Прим. перев.

2. По данным справочника С. G. Ames, Gazetteer of the Plateau Province, Nigeria, Jos, 1932.


Источник текста - сайт www.classes.ru - Репетитор по английскому языку в Санкт-Петербурге.