Разумное. Доброе. Вечное.

AAA
Обычный Черный

Рекомендованное

Опрос

Навигация

Стих дня

Всякая поэзия есть выражение душевного состояния.
© Бергсон А.

17 октября

Об инструментах

нам очень любопытно петыр
так расскажите ж нам зачем
вы вбили гвоздь в кирпич и главно
е чем

Новости культуры от Яндекса

ГлавнаяОсновы филологииТочные методы в филологии


Кто не делится найденным, подобен свету в дупле секвойи (древняя индейская пословица)


Точные методы в филологии

Считается, что усвоение науками отвлеченных понятий и методов математики расширяет их возможности, способствует открытию новых, более глубоких закономерностей. Неслучайно, что еще в ХIV в. мыслитель эпохи Возрождения Николай Кузанский в трактате «Об ученом познании» утверждал, что все познания о природе необходимо записывать в цифрах, а все опыты над нею производить с весами в руках. Философ И. Кант был убеждён, что точное естествознание простирается до тех границ, в пределах которых возможно применение математического метода.

Интерес филологии к математике

Если науки естественного цикла сравнительно давно заговорили на языке математики, то гуманитарные обратились к нему только в ХХ в.

Проявление интереса филологов к математике в форме квантитативных методик совпало с началом XX столетия. В знаковом прогнозе-пожелании Бодуэна де Куртенэ есть два взаимодополняющих пункта: «5. Нужно чаще применять в языкознании количественное, математическое мышление и таким образом приблизить его всё более и более к наукам точным»; и «6. Языкознание будет становиться всё более точной наукой также в зависимости от того, насколько <…> будет совершенствоваться метод качественного анализа» [Бодуэн де Куртенэ 1963: 17].

Позже Е.Д. Поливанов напишет статью «И математика может быть полезной», пафос которой сформулирован в сноске: «…Лингвистика может претендовать на звание точной науки с неменьшим правом, чем любая из естественноисторических дисциплин (например, геология, минералогия, ботаника, зоология, антропология и т.д.)» [Поливанов 1968: 287]. Е.Д. Поливанов указывает на три области лингвистики, где квантитативные методики видятся наиболее результативными: 1) использование математики в экспериментальной фонетике (анализ кимографических кривых); 2) в диалектологической статистике и 3) в определении относительной вероятности этимологий — как достоверных, так и гипотетических и, наконец, фантастических. Всё это Поливанов обсуждает на убедительном фактическом материале.

«Точное литературоведение»

Точное стиховедение началось именами А.Х. Востокова («Опыт о русском стихосложении», 1812) и Г. Германна («Elementa doctrinae metrical», 1816). К началу XX в. относится работа русского писателя и теоретика литературы Андрея Белого (Б.Н. Бугаева; 1880–1934), основоположника семантической концепции искусства, во многом определившего развитие стиховедения XX в. В статье «Лирика и эксперимент» (1909) сын профессора математики и студент естественного отделения физико-математического факультета Московского университета изложил свою идею соединения «точных знаний» и гуманитарных наук, обращая особое внимание на то, что исходная точка научного исследования в области лирической поэзии лежит в конкретном материале лирических произведений разных народов от древности до наших дней. Только текст лирического произведения, а не отвлеченные суждения о нём могут быть положены в основу точного исследования [Клинг 2009: 34–35].

В небольшой по объёму, но титанической по подготовительной работе статье «Пушкин, Тютчев и Баратынский в зрительном восприятии природы» он дал образец точного филологического исследования [Белый 1983]. Андрей Белый был первым, кто ощутил эвристическую мощь лексикографии в фундаментальных исследованиях вообще и в выявлении мировидения носителей языка и культуры в частности. Представляется интересной и чрезвычайно перспективной технология, предложенная им в указанной статье, суть которой автор свёл к нескольким тезисам:

«…Необходима статистика, необходим словарь слов: Баратынского, Пушкина, Тютчева»; «в руках чуткого критика словари — ключи к тайнам духа поэтов»;

«…Нужна квинтэссенция из цитат — предполагающая нелёгкую обработку словесного материала»;

«Каково отношение Пушкина — к воде, воздуху, небу и прочим стихиям природы? Оно — в сумме всех слов о солнце, а не в цитате, и не в их ограниченной серии» (выделено нами. — А.Х.);

«Изучение трёх «природ» трёх поэтов по трём зрительным образам («зрительный образ» = “картина мира”. — А.Х.) нас способно ввести в глубочайшие ходы и их душ и в тончайшие нервы творчества»;

«… Необходима путеводная нить — материал слов, образов, красок, рассортированный точно и собранный тщательно»  [Белый 1983: 551–556].

Фактически Андрей Белый указал на то, что филологам стало ясно в последнюю четверть ушедшего века: представление о языковой картине мира, о концептосфере, о лексикографизации филологических методов: слова, «собранные тщательно» и «рассортированные точно», способны дать информацию, которую другим путём получить трудно.

Американский славист Джеймс Бейли отмечает, что Андрей Белый обосновал «лингвостатистический» метод анализа стихотворного ритма в славянских языках, он разграничил ритм и метр и написал статью о четырёхстопном ямбе нескольких русских поэтов. «Возможно, лучшим способом объяснить этот подход является следующий: метр — это то, что указывает дирижёр своей палочкой, а ритм — то, что играют музыканты из оркестра. Метр можно также наблюдать, когда музыканты притоптывают ногой во время игры» [Бейли 2009: 93].

От Андрея Белого идёт традиция «точного литературоведения», представленная именами Б.И. Ярхо, К.Ф. Тарановского и М.Л. Гаспарова.

Борис Исаакович Ярхо (1889–1942), литературовед и переводчик, на материале средневековой литературы, фольклора, стиховедения и поэтики разработал детальную программу применения количественных методов к анализу всех уровней художественной формы. Фундаментальный труд «Методология точного литературоведения» писался в ссылке (после лагеря), где учёный и умер. Рукопись разыскал и частично опубликовал М.Л. Гаспаров в 1969 и 1984 гг. [Ярхо 1984], полностью — М.И. Шапир в 2006 [Ярхо 2006].

Б.И. Ярхо был учёным исключительной широты, но о чём бы он ни писал, он искал и оттачивал точную методологию литературоведения. Ярхо констатировал, что главным недостатком современного ему литературоведения являются неясность и расплывчатость характеристик и определений. При этом Ярхо за образец научности принял биологию. «Литературоведу надлежит черпать мужество главным образом из успехов биологии, так как она представляет ступень научности, ближайшую к нашей дисциплине и вообще к наиболее развитым из общественных наук. Нашей ближайшей задачей является достижение именно этой стадии научности» [Ярхо 1984: 212]. Литературоведение, полагает Ярхо, есть такая же «наука о жизни», и у неё нет причин отставать от биологии [Там же: 213]. В основу метода положены три момента жизни — множественность, непрерывность и изменчивость.

Программный характер имеют две публикации Ярхо: «Граница научного литературоведения» (1925) и «Простейшие основания формального анализа» (1927). В основу концепции Ярхо положил аксиоматическое, не поддающееся определению понятие литературоведения — эстетическая эмоция. Совокупность эстетически действенных элементов произведения составляет его форму. У литературной формы есть три главные области: а) фоника (то, что воспринимается слухом); б) стилистика (то, что воспринимается значением и чувством языка); в) поэтика (то, что воспринимается воображением, как образы и мотивы, и умом, как идейная или эмоциональная концепция) [Ярхо 1984: 196]. Ярхо обращает внимание на то, что ни одна статистическая величина не вводится без морфологического анализа, т.е. без проверки того, какие реальные литературные явления они отражают [Там же: 198]. Итогом поисков должен стать «сравнительно-статистический метод, поддержанный показом и экспериментом» [Там же: 236].

Кирилл Фёдорович Тарановский (1911–1993), специалист в области русской литературы и русского стихосложения, родился в Юрьеве (Тарту, Эстония) в семье профессора права. После октябрьской революции 1917 г. семья эмигрировала в Белград (Сербия), где будущий филолог окончил сербскую гимназию и два факультета Белградского университета — юридический (1933) и филологический (1936). В конце 1930-х годов учился в Карловом университете (Прага), где общался с членами Пражского лингвистического кружка и особенно с Р.О. Якобсоном. С 1931 г. изучает творчество О. Мандельштама. В 1941 г. защитил докторскую диссертацию о русских двусложных размерах, после её опубликования на сербском в 1953 г. ставшую одной из самых известных работ по поэтике в XX в. Преподавал в Белградском университете. В 1958 г. переехал в США, преподавал в Калифорнийском университете Лос-Анджелеса (1959–1963). Многие годы возглавлял кафедру славистики Гарвардского университета.

К.Ф. Тарановский сделал огромные по объёму подсчёты по русским стихам XIX в. и открыл два главных просодических закона русского стиха: закон регрессивной акцентной диссимиляции и закон восходящего зачина строки [Бейли 2004: 13]. Тарановскому принадлежит также первенство в осознании необходимости перехода от анализа формальных параметров стиха к анализу его содержательных характеристик. Одним из первых на материале русского пятистопного хорея дал строгое обоснование идеи о существовании связи между метром стихотворения и его содержанием. Это то, что ныне называют «экспрессивным ореолом», или «семантическим ореолом». В работах о поэзии Мандельштама Тарановский пересмотрел понятие «подтекст», понимая под ним отсылку к предыдущему тексту, поддерживающему или раскрывающему посылку последующего текста. Подтекст — это своеобразный ключ к художественному произведению, облегчающий понимание его смысла. Полагают, что это понятие легло в основу современных теорий «интертекстуальности».

В Гарвардском университете аспирантом Тарановского был Джеймс Бейли (род. в 1929 г.), ныне один их самых известных славистов США, специалист по стиховедению и фольклору, автор книг «Toward a Statistical Analysis of English Verse», «Three Russian Lyric Folk Song Meters», «Anthology of Russian Folk Epics». В своих «Воспоминаниях слависта» Дж. Бейли пишет о том, что он использовал при анализе русской народной поэзии лингвостатистический метод — в высшей степени объективный, так как он направлен на описание того, как поэты используют язык, чтобы соблюсти метрическую схему. Исследуя русский песенный фольклор и переводя русские былины на английский язык, американский учёный свежим взглядом увидел немало специфичного в русском народном стихосложении. Так, им отмечено, что русские крестьяне используют язык, который «сам по себе создаёт схожие ритмические структуры. Самые искусные исполнители фольклорных произведений проявляют незаурядное мастерство в создании своих произведений, мастерски используя русские слова. По этому поводу я всё время повторяю свою поговорку: “Певцы не глупцы”» [Бейли 2009: 100].

Академик Михаил Леонович Гаспаров (1935–2005), выдающийся русский филолог, специалист по классической филологии и стиховедению, превративший метод сравнительно-статистического анализа стиха (метра, ритма, рифмы и строфики) в инструмент точной филологии. М.Л. Гаспарова с полным правом можно считать рыцарем точного знания в филологии. Его кредо: «Я занимаюсь «точноведением», а вы — «чтотоведением».

Как член редколлегии и автор нового издания М.Л. Гаспаров определил задачи, стоящие перед «Филологикой»: «Для меня цель — это филология как точная наука, а в наше время научные исследования на каждом шагу подменяются собственным интуитивным творчеством». Этой тенденции как раз призвана противостоять «Philologica». «Существование ее — явление отрадное: важно и нужно понимать, что такое научность» [Отзыв о журнале «Philologica» 1996э].

Теоретические рассуждения Гаспарова о точности в филологии подтверждаются его конкретной аналитической работой над текстом. Показательна его статья «Точные методы анализа грамматики в стихе» [Гаспаров 1998б ], которая начинается констатацией того, что методы квантитативной лингвистики в России мало прилагались к изучению языка художественной литературы, хотя для характеристики языка отдельных авторов и художественных форм статистические методы интереснее, чем для характеристики языка в целом [Там же: 168]. Далее в статье приводятся конкретные и весьма интересные примеры применения автором квантитативной методики. Так, соотношение прилагательных и глаголов, по существу, это показатель статики / динамики художественного мира произведения. Логично предположить, говорит Гаспаров, что по этому показателю мир лирики (и вообще поэзии) статичнее: глаголов меньше, а мир повествования (и вообще в прозе) динамичнее: преобладают глаголы.

На деле всё не так. За точку отсчёта Гаспаров берёт художественную прозу. В «Пиковой даме» Пушкина на одно прилагательное приходится 2,7 глагола. У Чехова («Три года») — три глагола; у Толстого («Хозяин и работник») — пять глаголов. Разброс, как видим, ощутимый и не совсем ожидаемый. Интуитивно казалось, что сжатый стиль быстрой пушкинской прозы должен быть более насыщен глаголами, чем медлительный стиль толстовской прозы. Детализация художественного мира у Толстого и Чехова достигается не за счёт прилагательных, уточняющих образы, а за счёт глаголов, уточняющих действия и состояния. Далее Гаспаров сопоставляет прозу Пушкина с его же поэзией. Интуитивное предположение, что лирика меньше насыщена глаголами, чем эпос, не только подтверждается, но и уточняется. Глагольная динамичность действия в стихотворном повествовании у Пушкина не ниже, а даже выше, чем в прозаическом повествовании. Максимум глаголов приходится у Пушкина на стилизации народной поэзии — «Песни западных славян» и сказки. Видимо, полагает Гаспаров, динамичность действия Пушкину представлялась существенной приметой народной поэзии. Что совсем не тривиально на фоне обычных представлений о медлительности фольклорного повествования [Там же: 168–169].

Начинающий литературовед обычно робеет перед числами, имея в виду такое эфирное явление, как поэтический текст: в одну телегу впрячь нельзя коня и трепетную лань. Академик убедительно показывает, что гармонию поверять алгеброй не только можно, но и полезно. «Меня много раз спрашивали, не убивают ли подсчеты алгеброй гармонию, не мешают ли они непосредственному наслаждению поэзией. Я отвечал: нет, помогают. Неправильно думать <…>, будто всё и так слышно: многие мелочи, из которых складывается гармония, лежат ниже уровня сознания и непосредственно слухом не отмечаются; только когда нащупаешь их подсчетами, начинаешь их замечать. (Нащупывать приходится путем проб и ошибок; сколько на этом пути сделано трудоемких подсчетов, оказавшихся излишними, — не счесть.) Кроме того, подсчеты требуют медленного чтения и перечитывания стихов, а это полезно. Мне не случилось в молодости полюбить стихи Фета — так уж сложились обстоятельства, я лучше знал пародии на Фета, чем самого Фета. А я знал, что Фет заслуживает любви. И вот я стал каждую свою стиховедческую тему разрабатывать сперва на стихах Фета. Ритм словоразделов, связи слов в стихе, расположение фраз в строфе — что бы это ни было, я сперва смотрел и подсчитывал, как это получается у Фета, а потом уже — у других поэтов. С каждым перечитыванием стихи все глубже западали в подсознание. И после десяти или двадцати таких упражнений внимания я почувствовал, что научился любить Фета» [Гаспаров 2001: 316].

Что даёт обострённое чувство точности филологу? Огромный объём подсчётов, произведённых М.Л. Гаспаровым, привёл его к выводам весьма содержательным. Свидетельством тому книга «Метр и смысл. Об одном из механизмов культурной памяти» [Гаспаров 2000], предмет которой — смысловые ассоциации, которые связываются со стихотворными размерами русской поэзии и образуют сеть традиций, тянущихся от XVIII в. до последних советских и постсоветских десятилетий. В книге прослежены смысловые ореолы стихотворных размеров, которые образуют общую семантическую панораму русской метрики. М.Л. Гаспаров пытается ответить на «детский вопрос», почему поэт, начиная стихотворение, берёт для него именно такой-то размер, а не иной [Гаспаров 2000: 9].

Союз филологии и «точного знания» строился не только яркими представителями словесности, но и выдающимся математиком академиком Андреем Николаевичем Колмогоровым (1903–1987), который лично или со своими учениками и сподвижниками опубликовал двенадцать статей по теории стиха. Вклад А.Н. Колмогорова в филологию другой представитель математической науки условно разделил на три компонента: 1) исследования в области лингвистики и теории стиха; 2) организационная поддержка новых направлений в филологии; 3) участие в создании благоприятной атмосферы в обществе и науке, без которой развитие этих направлений было бы затруднено [Успенский 2009: 11]. По сообщению этого автора, Колмогоров предложил безупречное с формально-логической точки зрения определение классических метров, а также описание и разграничение метров неклассических, в частности, им сформулировано математически строгое определение ямба.

В 1977 г. Колмогоров выступил официальным оппонентом на защите докторской диссертации М.Л. Гаспарова. Интерес Колмогорова к теории стиха объясняют, во-первых, его широкими общегуманитарными и, в частности, литературными интересами; во-вторых, стремлением к научному анализу явления, к систематизации понятий и к поискам их точных определений (интерес к стиховедению); в-третьих, стремлением к математизации как высшему уровню научного анализа и систематизации (интерес к метрике, поскольку метрический аспект стихосложения легче всего поддаётся математизации) [Успенский 2009: 15]. В сфере изучения теории стихотворной речи видят три основных аспекта деятельности Колмогорова: 1) задача аксиоматического построения теории русской классической метрики; 2) исследование стихотворных метров русской поэзии за пределами классической метрики; 3) поддержка точных методов в литературоведении [Баевский 2010: 55]. О роли Колмогорова в научной судьбе филолога пишет В.С. Баевский [Баевский 2010], которому принадлежит книга о лингвистическом, математическом, семиотическом и компьютерном моделировании в истории и теории литературы [Баевский 2001].

Ярким примером математически безупречного анализа по- этического текста может служить статья А.Н. Колмогорова о пушкинском «Арионе».

Научное творчество А. Белого, Б.И. Ярхо, К.Ф. Тарановского, М.Л. Гаспарова, Дж. Бейли, а также А.Н. Колмогорова свидетельствует однозначно: филология может и должна быть наукой точной. Интересно, что «точноведение» парадоксальным образом складывается на материале поэтических текстов, в которых, казалось бы, трудно совместить гармонию и алгебру, хотя сами поэты точности своего слова не отрицали. Дж. Бейли эпиграфом к сборнику своих работ по стиховедению взял строчку русского поэта Георгия Иванова: «Поэзия — точнейшая наука» [Бейли 2004: 10]. 248

Союз филологии и математики с годами крепнет. Знаменательно проведение в марте 2009 г. круглого стола, посвящённого 70-летию ректора МГУ В.А. Садовничего, на тему «Математика и филология», в ходе которого прозучало немало интересных и содержательных докладов [Математика и филология 2009].

Языкознание и математика

Наиболее активной в разработке и применении квантитативных методик была лингвистика, занимающая особое, срединное положение среди всех областей человеческого познания.

Системность языка, обобщенный характер его единиц — вот та благодатная почва, в которой стали плодотворно укореняться идеи и методы современной математики. В лингвистике есть все условия для математического исследования. Во-первых, в лингвистике влияние наблюдателя на объект наблюдения ничтожно мало, осознания явления наблюдателем недостаточно для того, чтобы его изменить. Во-вторых, язык обладает длинными статистическими рядами [Леви-Строс 1985: 54—55].

Польский писатель-фантаст и мыслитель Станислав Лем в разделе «Загадки языка» книги «Философия случая» в числе загадок языка отметил специфику связи языка и числа: «<Математику> “содержит в себе” язык как таковой, но содержит таким образом, что она как бы “скрыта” от тех, кто им пользуется. Математика в таком случае рождается одновременно с языком, будучи укоренена в сфере его флективных уровней и ограничена их закономерностями и структурой языкового синтаксиса» [Лем 2005: 645].

Языкознание первым из гуманитарных наук от установки на полное и исчерпывающее описание отдельных фактов перешло к установке на обобщение, на поиски единого закона, объясняющего необозримое множество отдельных фактов. Эта познавательная позиция и определила интерес к математическим методам.

Пока наиболее перспективным представляется исследование сущностных характеристик языка при помощи аппарата теории вероятности и математической статистики — квантитативная лингвистика. Собственно говоря, связь математики с языкознанием началась с попыток установить статистические свойства речи, поскольку языку присущи объективные количественные характеристики. Благодаря вероятностной природе языковой структуры она легко поддается изучению математическим аппаратом теории вероятности и математической статистики. Основа тому — регулярность, упорядоченность языковых явлений. Уже существует большая специальная литература, отразившая результаты применения статистических методик в исследовании различных ярусов языковой системы.

Шире всего количественные методики используются при описании лексического уровня языковой системы. Лингвисты убеждены, что лексемный ярус системен, но его системность особого рода. В лексике целостность и устойчивость системы сочетается с автономностью частей (подсистем). В ней заметна массовость и случайность и одновременно господствует необходимость. Всё это характерно для вероятностных систем. Известен вывод Б.Н. Головина: «Язык вероятностен, речь частотна». Квантитативная лингвистика возможна потому, что для речи характерна относительная стабильность частот отдельных элементов или групп элементов и устойчивое распределение элементов, выражающее наличие внутренней упорядоченности в системе. Единицами и уровнями квантитативного анализа являются словоформы, лексема и словоупотребление [Тулдава 1987].

Частотные словари

Практическим результатом статистического изучения лексики являются частотные словари, отличающиеся от обычных лингвистических (толковых, орфографических и других) тем, что словарные единицы располагаются не только в алфавитном порядке, но и в порядке убывающей частотности. В первом случае это будет алфавитный частотный словарь, а во втором — ранговый частотный словарь. Частотные словари характеризуются следующими параметрами: объём текста (число словоупотреблений), объём словаря словоформ и корпуса лексем.

Первым частотным словарём, составленным на базе одиннадцати миллионов словоупотреблений, был словарь немецкого языка Ф. Кединга (Берлин, 1898). За девяносто лет нашего столетия было составлено несколько сот частотных словарей и частотных списков для нескольких десятков языков. Первым частотным словарём русского языка был словарь Г. Йоссельсона (США, Детройт, 1953).

В нашей стране первый частотный словарь русского языка был составлен Э. Штейнфельд (1963). Известны материалы к частотному словарю языка Пушкина (1963). В 1977 г. вышел в свет «Частотный словарь русского языка» под редакцией Л.Н. Засориной. Он создавался на основе выборки в один миллион словоупотреблений из четырёх жанров (художественная проза, драматургия, научная публицистика, газетно-журнальные материалы), в нём около 40 тысяч слов. Самое частотное слово — предлог в (во), далее идут служебные слова и местоимения (и, не, на, я, быть, что, он, с, а, как, это). Самое частотное существительное — год.

В 90-х годах XX в. в Швеции на базе корпуса современных русских текстов, созданного в Институте славистики Уппсальского университета, под ред. Леннарта Лённгрена вышел в свет «Частотный словарь современного русского языка» (Уппсала, 1993).

В конце XX в. актуальной стала идея и практика создания частотных словарей идиолектов выдающихся языковых личностей. Примером может служить «Статистический словарь языка Достоевского», разработанный группой лексикографов в ИРЯ РАН.

Это уникальный в мировой практике лексикографический проект, опирающийся на корпус текстов в 2,9 млн словоупотреблений, представляет всю лексику — 43 тыс. разных слов — трёх основных жанров писателя: художественной литературы, публицистики и писем. Отличается словарь степенью лингвистической дифференциации: в таблицах Словаря лексика Ф.М. Достоевского представлена в распределении по основным жанрам и по периодам творчества [Шайкевич 2003]. Авторы проекта, характеризуя своё детище, специально останавливаются на вопросе о перспективах Словаря. Один из составителей исследует возможность проекта в изучении языка писателя на примере романа Достоевского «Идиот» [Шайкевич 1996].

Выясняется, что у частотных словарей имеется большой познавательный, эвристический потенциал. В последнее время об этом заговорили философы и филологи. В статье М. Эпштейна «Предлог “В” как философема. Частотный словарь и основной вопрос философии» имеется многозначительный подзаголовок «Частотный словарь как картина мира» [Эпштейн 2003: 86]. Автор полагает, что из всех видов словарей частотный словарь наиболее приближен к речевой практике, поскольку он описывает именно частоту вхождения языковых единиц в поток речи, степень их востребованности всеми говорящими. Частотный порядок слов, отмечает философ, — это «всенародная», стихийно-демократическая система понятий, которую не может игнорировать философия [Эпштейн 2003: 87].

В частотных словарях выделяется головная часть, в которой сосредоточены самые употребительные в том или ином тексте или корпусе текстов слова. Эта часть — предмет доминантного анализа, методика которого основывается на предположении, что среди наиболее частотных лексем присутствуют слова, обозначающие доминанты концептуальной картины этноса, социальной группы или индивида. Доминантный анализ ориентирован на выявление, изучение и описание наиболее частотных слов в аспекте языковой картины мира с дальнейшим движением анализа от доминантных слов — к доминирующим концептам.

Разрабатывая основы фольклорной диалектологии, курский лингвофольклорист С.П. Праведников составил частотные словари южных (курских) и северных (архангельских) народных лирических песен, сопоставил их и пришёл к выводу, что головные части составленных частотных списков заметно различаются и свидетельствуют о территориальной дифференцированности языка русского фольклора [Праведников 2010].

Изучение авторского идиостиля

С помощью формально-количественных методов изучается авторский идиостиль, под которым понимается взаимосвязь между языковыми средствами и особенностями творческой позиции писателя, его взгляда на мир, окружающую действительность.

Определение авторства с помощью формально-количественных и статистических методов стимулировало поиск и выявление характерных структур авторского языка. На этом строятся многообразные методики, представленные в книге «От Нестора до Фонвизина. Новые методы определения авторства» (М., 1994). Специалисты исследовали несколько простых параметров авторского стиля и на базе большого количества произведений писателей XVIII–XX вв. статистически доказали, что доля всех служебных слов в данном прозаическом произведении является авторским инвариантом.

Один из авторов, опираясь на модель цепей А.А. Маркова, предложил методику определения авторства, основанную на том, что по произведениям автора, которые достоверно им созданы, вычисляется матрица переходных частот употреблений пар букв. Затем такие матрицы строятся для каждого из авторов, «подозреваемых» в написании анонимного текста, и оценивается вероятность того, что именно он написал анонимный фрагмент текста. В результате автором анонимного текста полагается тот, у которого вычисленная оценка вероятности больше.

Используя квантитативные методики идентификации текстов, авторы рассматриваемой коллективной монографии пытаются ответить на вопрос, кто был автором «Повести временных лет», и приходят к выводу, что автором первой редакции «Повести…» мог быть Нестор, древнерусский писатель, летописец XI — начала XII в., монах Киево-Печерского монастыря, автор житий князей Бориса и Глеба, Феодосия Печерского, один из крупнейших историков Средневековья.

Знаменитый шедевр древнерусской словесности XII в. «Слово о полку Игореве», уникальность которого скептиками ставится под сомнение, был подвергнут жёсткой формально-количественной ревизии. Применение анализа частот парной встречаемости грамматических классов слов позволило наглядно доказать, что глубинная структура «Слова» — это структура языка XI в. Этот формально-количественный анализ не отверг гипотезу историка Б.А. Рыбакова о боярине Петре Бориславиче как авторе «Слова о полку Игореве». Возможно, отчасти она и подтверждена. Однако, полагают исследователи, необходимо ещё более детальное исследование текстов, которое будет проведено в ближайшее время [От Нестора… 1994: 340].

Анализ нескольких «Слов…», принадлежащих Кириллу Туровскому (1130–1182), древнерусскому писателю, проповеднику, епископу г. Туров, дал основание авторам главы «Кирилл Туровский: творец или компилятор?!» отнести тексты епископа к разряду неоригинальных как пересказ сочинений других авторов.

Атрибуция «Писем к Фалалею», анонимного памятника публицистической литературы последней трети XVIII в., потребовала сопоставления текстов трёх претендентов на авторство — М.И. Попова, Н.И. Новикова и Д.И. Фонвизина. Исследователи подтвердили, что автором «Писем» был Д.И. Фонвизин, представший не только талантливым драматургом, но и талантливым публицистом.

В конце XVIII столетия популярностью пользовалась своеобразная крестьянская энциклопедия «Деревенское зеркало, или Общенародная книга». В сугубо популярной форме изложения в ней шла речь о том, как крестьянину можно достигнуть успехов в своей жизни и труде. Существовало мнение, что автором этой анонимной крестьянской энциклопедии был учёный-минеролог В.М. Северин. Привлечённые тексты других возможных авторов и использование квантитативной методики привели к убедительному выводу: автором книги является Андрей Тимофеевич Болотов (1738–1833), естествоиспытатель, один из основоположников отечественной агрономической науки, писатель.

Количественные методики стали более эффективными с появлением вычислительной техники, прежде всего персональных компьютеров.

Петербургский поэт и переводчик «Слова о полку Игореве» Андрей Чернов нашёл, что построение стихов загадочного древнерусского памятника подчиняется определенным математическим закономерностям, а именно — формуле «серебряного сечения». А. Чернов сделал заключение о том, что «Слово о полку Игореве» имеет девять песен и что в основу текста легла круговая композиция. Если в композиции «Слова» лежит круг, то у него должен быть «диаметр» и некая математическая закономерность. Число стихов во всех трёх частях «Слова» (их 804) А. Чернов разделил на число стихов в первой (или последней) части (256), в итоге получил 3,14, т.е. число «пи» с точностью до третьего знака. Эта же закономерность выявилась при изучении «Медного всадника» Пушкина, в котором использована круговая композиция, и храма Софии Полоцкой. А. Чернов сделал вывод: математический модуль автор «Слова» использовал интуитивно, неся внутри себя образ древнерусских архитектурных памятников. В те времена храм являл собой всеобъемлющий художественный идеал, оказывающий влияние на композицию и ритмику стихосложения. Исследователь назвал обнаруженную им закономерность в построении древнерусского литературного памятника и древнерусских храмов принципом «серебряного сечения» [Краюхин 1995: 7].

В многолетний спор по поводу того, кто является истинным автором романа «Тихий Дон», в свое время включились скандинавские ученые, норвежско-шведский коллектив под руководством Г. Хьетсо. Они взяли тексты, бесспорно принадлежащие М. Шолохову, и тексты донского писателя Ф. Крюкова, которому приписывалось авторство великого романа, и проанализировали их, выявляя особенности писательской манеры каждого. Учёные сравнили длину предложений, распределения длины предложений по количеству слов, распределение частей речи, сочетание частей речи в начале и в конце предложения, частоту применения союзов — в начале предложений, лексические спектры, повторяемость словарного запаса по богатству. Естественно, сделать это оказалось возможным только с помощью мощной вычислительной техники. Математическая статистика при контрольной выборке на ЭВМ 12 тыс. фраз при 164 637 словах представлена в 250 таблицах, формулах и графиках [Осипов 1999: 6]. Их вывод однозначен: из двух претендентов на авторство «Тихого Дона» Крюков явно обладает наименьшим правом. «…Применение математической статистики позволяет нам исключить возможность того, что роман написан Крюковым, тогда как авторство Шолохова исключить невозможно». Недавно найденная рукопись великого романа (885 рукописных страниц, 605 из которых написаны рукой самого Шолохова, а 285 страниц — женой писателя и её сестрой) окончательно утвердила авторство М.А. Шолохова и правоту скандинавских ученых [Ушаков 2000: 24–25].

В Эдинбурге (Шотландия) разработан аналитический метод, основывающийся на учёте зависимости частоты употребляемого слова и длины предложения, в котором оно появляется. Этот метод получил название «диаграммы накапливающихся сумм». С его помощью установлено, что каждому человеку свойствен прочно укоренившийся, неизменный стиль, который не поддаётся имитации. Например, стиль Т. Харди в «Руке Этельберты» (1876) убедительно совпадает со стилем «Джуда Неизвестного». Анализ показал, что авторы приобретают и сохраняют постоянный стиль, как бы ни сложилась их жизнь. Например, стиль В. Скотта в «Антикварии» (1816) полностью совпадает с его стилем в «Замке опасностей», написанном после того, как знаменитый английский писатель перенёс три инсульта, один из которых лишил его дара речи и нарушил двигательные способности. Метод выявляет в тексте инородные вставки, обнаруживает попытки подделать авторский стиль.

Английская писательница Джейн Остин не окончила повесть «Сандиция», которая обрывается на семьдесят третьем предложении одиннадцатой главы. Повесть была дописана другой писательницей. При чтении невозможно определить, где заканчивается текст Д. Остин, а метод позволяет точно найти инородную часть повести [Хоукс 1990: 20–21].

Тот факт, что объём активного лексикона Шекспира составляет от 15 до 24 тыс. слов и что количество новых слов, введенных в язык Шекспиром, превышает 3200 единиц, как будто свидетельствует в пользу тех, кто считает, что Шекспир — это псевдоним, под которым творил не один человек. У Ф. Бэкона, которому иногда приписывают авторство пьес и сонетов Шекспира, лексикон составлял 9–10 тыс. слов (у современного англичанина с высшим образованием словарный запас включает 4 тыс. лексем) [Бельская 2000: 109].

Д.С. Лихачёв, авторитетнейший отечественный текстолог, тоже размышлял о месте квантитативных методик в филологии, в частности в ситуации определения авторства: «Пастор Эндрю Мортон в Эдинбурге применил компьютер для установления авторства. Простой подсчёт слов ничего не дал, и не мог дать. Дало только подсчитывание пар слов, целых идиоматических выражений, сочетаний слов. Так, например, ему удалось доказать, что Бэкон не мог быть автором пьес Шекспира. Такие же бесспорные результаты достигнуты им в установлении авторства других произведений. Даже благодаря его подсчётам был оправдан в суде один из обвиняемых (четыре наиболее преступных письма оказались не его)» [Лихачёв 2006: 3: 504].

Лингвостатистический анализ был использован в исследовании «Илиады» Гомера. Чтобы доказать, что Гомера не было, и все 24 песни «Илиады» по происхождению — самостоятельные произведения, соединённые в эпос позднее без особой переработки с целью унификации, была использована статистика отношений внутри синонимических пар (имён собственных, просто лексических пар, формул и т.п.). По мнению автора исследования Л.С. Клейна, наиболее полные возможности для классификации текстов представляют главные этнонимы греков (ахейцы, данаи и аргивяне): они все три синонимичны, массовы (употребляемость исчисляется сотнями), неравномерно и неодинаково распределяются по книгам «Илиады». Окончательный вывод исследователя состоит в том, что разная употребительность имён, а также предлогов и частиц говорит о том, что это (песни. — А.Х.) были не просто и не только источники, а самостоятельные вклады, ставшие составными частями поэмы; сохранность в окончательном тексте первоначально выбранных этнонимов, топонимов, теонимов и служебных слов (и это при наличии других синонимов) говорит о том, что переработка поэтической ткани при объединении самостоятельных песен в поэму была незначительной [Клейн 1998: 18, 96, 112, 436]. Как показано исследователем, фольклорные песни, составленные в разных местах древнегреческого мира, воспевали подвиги разных героев — участников и троянской войны, и прочих мифических кампаний. Песни приспосабливались к ранее существующим сюжетам, взаимопересекаясь, часто противоречили друг другу. «Стыки» разных песен были обнаружены вдумчивым и тонко проведенным анализом.

В «New Journal of Physics» (2009, № 11) была опубликована статья трёх шведских учёных «Мета-книга и зависящие от длины текста особенности индивидуального литературного письма». На материале текстов трёх англоязычных романистов Мелвилла, Харди и Лоуренса исследователи подсчитывали, как растёт количество новых слов у данного автора по мере удлинения текста. С одной стороны, суммарное число новых слов растёт, с другой, растёт и число повторения для уже употреблённых слов. Возникает вопрос: с каким темпом будут расти эти числа по мере удлинения текста? Совершенно очевидно, что «числовые» характеристики языка зависят от уровня культуры и образованности автора, от богатства его словаря, от умения активизировать этот словарь, от индивидуальных пристрастий и степени сознательной склонности к словесным повторениям. Выяснилось, что характер нарастания новых слов и повтора прежних и, следовательно, вид кривых, изображающих это нарастание по мере удлинения текста, различен для разных писателей. Шведские учёные определили, что если проанализировать любой короткий текст автора, например, рассказ, и сравнить его с другим текстом той же длины, выделенным из целого романа, статистические характеристики (темп нарастания новых слов и повторов) будут одинаковы. Различие столь индивидуально устойчиво, что можно «численно опознать» того или иного автора, а также опознавать авторов анонимных произведений [Стариков 2010].

Вопрос применения математических методик в филологии дискутируется до сих пор. Любопытно сопоставить статьи филолога [Шапир 2005] и математика [Гладкий 2007], которые опубликованы в журнале «Вопросы языкознания». Полемика оказалась односторонней. Так получилось, что филолог трагически погиб и статьи математика не читал, а математик на статью весьма уважительно, но критически отреагировал.

М.И. Шапир, по словам знавших его, — человек исключительной филологической одарённости, в статье «“Тебе числа и меры нет”: О возможностях и границах “точных методов” в гуманитарных науках» утверждает, что точные методы в гуманитарных исследованиях не могут дать значимых результатов. Математизированная теория текста как такового неосуществима, поскольку каждый объект, будучи повторимым в самых разных своих деталях уникален как единство смысла во всей своей полноте и в любых тонкостях его материального воплощения в чувственно воспринимаемой форме. Подобная уникальность приводит к пропасти между естественными и гуманитарными науками. Очевиден парадокс: повторяемость языка и неповторимость мысли.

Статья А.В. Гладкого «О точных и математических методах в лингвистике и других гуманитарных науках» начинается с констатации ошибочных мнений гуманитариев, полагающих, что законы, господствующие в мире человеческого духа, принципиально отличаются от законов природы, что точные методы тождественны математическим, что число — главный предмет математики. Автор настаивает на том, что науки о человеческом духе и человеческом обществе могут и должны стремиться к точности и объективности так же, как науки о природе. «Главный признак точности в научном исследовании — не использование математического аппарата, а чёткое, не допускающее различных толкований определение понятий» [Гладкий 2007: 29]. В качестве примера автор статьи ссылается на исследовательский опыт лингвиста А.А. Зализняка, книги которого могут служить образцом лингвистического описания нового типа — описания, основанного на системе точных понятий [Там же: 25].

Использование точных понятий и строгая дисциплина мысли — такой должна стать филология. И в этой связи А.В. Гладкий утверждает: «…“профильное образование” в средней школе, уже в детстве разделяющее способных и интересующихся людей на “факультеты” и приучающее их гордиться невежеством в “чужих” науках — может очень сильно воспрепятствовать дальнейшему сближению естественных и гуманитарных наук, настоятельно необходимому для нормального развития тех и других» [Там же: 27]. Статья завершается словами Карла Поппера: «Рост знания зависит от существования разногласий».

Дискуссия на этом не завершилась. В 2009 г. была опубликована статья лингвиста Н.В. Перцова «О точности филологии», написанная в связи со статьями М.И. Шапира и А.В. Гладкого, в которой автор взял на себя роль третейского судьи. Пафос статьи: сдержанная оценка М.И. Шапиром перспектив математики в области построения общей теории в гуманитарных областях плодотворна, а «естественно-научный» оптимизм А.В. Гладкого по этому поводу сомнителен. В целом автор на стороне М.И. Шапира и считает, что «общую математизированную теорию текста как такового» построить невозможно.

Н.В. Перцов исходит из того, что точность — это фундаментальный принцип всякой — естественной или гуманитарной — науки. Обсуждается вопрос о специфике предметов гуманитарной и естественной областей и делается вывод, что объекты внутреннего мира человека обладают такой спецификой, которая кардинально отличает их от объектов материального мира. Этот тезис аргументируется рядом примеров, взятых из филологической сферы. В частности, рассматриваются такие особенности, как нестабильность языкового чутья; неопределённость понятий лингвистики; расхождение между дискретностью инструментов лингвистического описания и континуальностью смысла; скромный уровень моделирования языкового поведения человека в лингвистике; трудности при определении филологических понятий на примере метра в стиховедении; нарушение принципа точности научного знания в современной отечественной текстологии. Делается вывод, что степень сложности объектов гуманитарных наук в общем и целом неизмеримо выше таковой в области естественно-научной, а неточность гуманитарно-научного описания и моделирования связана с самой сложнейшей природой изучаемых объектов [Перцов 2009: 113].

Разобрав методологические принципы М.И. Шапира и ответив на критические замечания по их поводу со стороны А.В. Гладкого, автор статьи заключает, что обращённый к лингвистам призыв заняться математикой и усердно искать в ней средства для построения математизированных лингвистических моделей следует принять со сдержанным скептицизмом и призвал математиков, которых интересует филология, заняться гуманитарной проблематикой, чтобы вместе с филологами постараться сделать гуманитарную науку более точной, отдавая себе отчёт в том, что уровень точности, свойственный естественно-научному знанию, в филологии недостижим [Перцов 2009: 123].

Ограниченность квантитативных методик

Отдавая должное квантитативным методикам получения информации, не следует забывать и об их ограниченности. Известны три типа получения знаний: 1) интуитивный, 2) научный и 3) религиозный. Наука (по Хайдеггеру) есть знание, проверяющее себя, экспериментирующее со своим объектом и переделывающее его. Полагают, что наука в состоянии познать только те явления, свойства которых можно оценить числом. Например, работу гипнотизера нельзя описать математическими формулами, и тем не менее результаты её несомненны и воспроизводимы. Достижения индийских йогов — экспериментальный факт, многократно проверенный. Однако эти феномены не могут стать объектами точной науки, поскольку они не поддаются количественному описанию с помощью чисел и формул. Ограниченность науки также и в невозможности понять секрет искусства. И даже сам метод открытия глубоких научных истин лишь отчасти принадлежит науке и в значительной мере лежит в сфере искусства [Пономарёв 1989: 354–355].

Замечательный фольклорист В.Я. Пропп, давший блестящий образец научной точности в своей структуралистской работе «Морфология сказки», писал о том, что так называемые точные методы в объективном и точном изучении художественной литературы имеют свои пределы. Они возможны и применимы там, где есть повторяемость в больших масштабах, например в языке или фольклоре. Но там, где искусство становится объектом творчества неповторимого гения, применение точных методов даст положительные результаты в том случае, если «изучение повторяемости будет сочетаться с изучением единственности», перед которой наука стоит как перед проявлением непостижимого чуда. «Под какие бы рубрики мы не подводили «Божественную комедию»» или трагедии Шекспира, гений Данте и гений Шекспира неповторим, и ограничиваться в их изучении точными методами нельзя [Пропп 1983: 583–584].

«Литература <…> живёт в языке, который, в свою очередь, представляет универсум, размещённый в культуре, откуда на него изливается свет значений. Царство, где господствует система языка, простирается от пустоты формальных доказательств до полноты смыслов, и можно сказать так: в этом царстве один полюс, математический, характеризуется точностью без понимания; для другого же, напротив, характерно понимание при неточности формулировок» [Лем 2005: 643].

Если согласиться с мнением многих, что математика — это не наука, а язык науки, то логичен вывод о необходимости совершенствования этого языка, адаптации его к природе и задачам разных областей познания, включая и гуманитарные науки. В статье с интригующим названием «Возможна ли гуманитаризация математики?» [Панов 1989] автор анализирует взгляды Л. Брауэра (1881–1966), голландского учёного, логика, основоположника интуиционизма, автора книги «Жизнь, искусство, мистицизм» (1905), и останавливается на культурологических аспектах взглядов голландца («народы шлифуют друг друга культурами», «язык живёт лишь с культурой и посредством культуры»). Подчёркивается мысль Брауэра о математике, естественным образом вписанной в контекст человеческой культуры, о математике «более сходной по своей природе с музыкой или поэзией, чем с инструментом для инженеров и физиков» [Панов 1989: 79].

Статистика требует очень внимательного отношения к числу и предполагает адекватную интерпретацию. Об этом предупреждает расхожее изречение западного автора: «Есть ложь, есть гнусная ложь и статистика». Менее известен злой афоризм В.О. Ключевского: «Статистика есть наука о том, как, не умея мыслить и понимать, заставить делать это цифры». Да и Л.Н. Гумилёв советовал не переусердствовать с точностью: «Слишком большое стремление к точности не полезно, а часто бывает помехой в процессе исследования. Ведь рассматривать Гималаи в микроскоп бессмысленно» [Гумилев 1994: 58].

Приведённые примеры успешного применения квантитативных методик и других приёмов «точного знания» дают основание полагать, что формальный и количественный анализ может дать нетривиальные результаты в изучении текстов, однако главное для филологии — математизация знания, понимаемая как стремление к логической безупречности описания явления. Математика в этом случае служит своеобразным камертоном, идеалом такой безупречности.

367
08.02.2017 г.

Яндекс.Метрика
Рейтинг@Mail.ru


Индекс цитирования

Уважаемые посетители! С болью в сердце сообщаем вам, что этот сайт собирает метаданные пользователя (cookie, данные об IP-адресе и местоположении). И как ни прискорбно это признавать, но это необходимо для функционирования сайта и поддержания его жизнедеятельности.

Если вы никак, ни под каким предлогом и ни за какие коврижки не хотите предоставлять эти данные для обработки, - пожалуйста, покиньте сайт и забудьте о нём, как о кошмарном сне. Всем остальным - добра и печенек. С неизменной заботой, администрация сайта.