История приминения математических методов в лингвистике. Лингвистический энциклопедический словарь

математическая дисциплина, предметом которой является разработка формального аппарата для описания строения естественных и некоторых искусственных языков . Возникла в 50‑х гг. 20 в.; одним из главных стимулов появления М. л. послужила назревшая в языкознании потребность уточнения его основных понятий. Методы М. л. имеют много общего с методами математической логики - математической дисциплины, занимающейся изучением строения математических рассуж­де­ний, - и в особенности таких её разделов, как теория алгоритмов и теория автоматов. Широко исполь­зу­ют­ся в М. л. также алгебраические методы. М. л. разви­ва­ет­ся в тесном взаимо­дей­ствии с языкознанием . Иногда термин «М. л.» исполь­зу­ет­ся также для обозначения любых лингви­сти­че­ских исследований, в которых применяется какой-либо математи­че­ский аппарат.

Математическое описание языка основано на восходящем к Ф. де Соссюру представлении о языке как механизме, функционирование которого проявляется в речевой деятельности его носителей; её результатом являются «правильные тексты» - последовательности речевых единиц , подчиняющиеся определённым закономерностям, многие из которых допускают матема­ти­че­ское описание. Разработка и изучение способов математи­че­ско­го описания правиль­ных текстов (в первую очередь предложений) составляет содержание одного из разде­лов М. л. - теории способов описания синтаксической структуры . Для описания строения предло­же­ния - точнее, его синтаксической структуры - можно либо выделить в нём составляющие - группы слов , функционирующие как цельные синтакси­че­ские единицы, либо указать для каждого слова те слова, которые ему непосредственно подчинены (если такие есть). Так, в предложении «Ямщик сидит на облучке» (А. С. Пушкин) при описании по 1‑му способу составляющими будут все предложение П, каждое его отдельное слово и группы слов A = сидит на облучке и B = на облучке (см. рис. 1; стрелки означают «непосредственное вложение»); описание по 2‑му способу даёт схему, показанную на рис. 2. Возникающие при этом математические объекты называются системой составляющих (1‑й способ) и деревом синтаксического подчинения (2‑й способ).

Точнее, система составляющих - это множество отрезков предложения, содержащее в качестве элементов всё предложение и все вхождения слов в это предложение («однословные отрезки») и обладающее тем свойством, что каждые два входящих в него отрезка либо не пересекаются, либо один из них содержится в другом; дерево синтаксического подчинения, или просто дерево подчинения, есть дерево, множеством узлов которого служит множество вхождений слов в предложение. Деревом в математике называется множество, между элементами которого - их называют узлами - установлено бинарное отношение - его называют отношением подчинения и графически изображают стрелками, идущими от подчиняющих узлов к подчиненным, - такое, что: 1) среди узлов имеется точно один - его называют корнем , - не подчинённый никакому узлу; 2) каждый из остальных узлов подчинен точно одному узлу; 3) невозможно, отправившись из какого-либо узла вдоль стрелок, вернуться в тот же узел. Узлы дерева подчинения - это вхождения слов в предложения. При графическом изображении система составляющих (как на рис. 1) также приобретает вид дерева (дерева составляющих ). Построенное для предложения дерево подчинения или систему составляющих часто называют его синтаксической структурой в виде дерева подчинения (системы составляющих). Системы составляющих исполь­зу­ют­ся пре­иму­ще­ствен­но в описаниях языков с жёстким порядком слов , деревья подчинения - в описаниях языков со свободным порядком слов (в частности, русского), формально для каждого (не слишком короткого) предложения можно построить много разных синтаксических структур любого из двух видов, но среди них только одна или несколько являются правильными. Корнем правильного дерева подчинения служит обычно сказуемое. Предложение, имеющее более одной правильной синтаксической структуры (одного вида), назы­ва­ет­ся синтаксически омонимичным ; как правило, разные синтаксические структуры отвечают разным смыслам предложения. Например, предложение «Школьники из Ржева поехали в Торжок» допускает два правильных дерева подчинения (рис. 3, а, б); первое из них отвечает смыслу «Ржевские школьники поехали (не обязательно из Ржева) в Торжок», второе - «Школьники (не обязательно ржевские) поехали из Ржева в Торжок».

В русском и ряде других языков деревья подчинения предложений «делового стиля» подчи­ня­ют­ся, как правило, закону проективности , состоящему в том, что все стрелки можно провести над прямой, на которой записано предложение, таким образом, что никакие две из них не пересекутся и корень не будет лежать ни под какой стрелкой. В языке художественной литера­ту­ры , особенно в поэзии, отклонения от закона проективности допустимы и чаще всего служат задаче создания определённого художественного эффекта. Так, в предложении «Друзья кровавой старины народной чаяли войны» (Пушкин) непроективность приводит к эмфати­че­ско­му выде­ле­нию слова «народной» и одновременно как бы замедляет речь, создавая этим впечатление известной приподнятости, торжественности. Имеются и другие формаль­ные признаки деревьев подчинения, которые могут исполь­зо­вать­ся для характеризации стиля . Например, максимальное число вложенных друг в друга стрелок служит мерой «синтак­си­че­ской громоздкости» предло­же­ния (см. рис. 4).

Для более адекватного описания строения предложения составляющие обычно помечаются симво­ла­ми грамматических категорий («именная группа», «группа переходного глагола » и т. п.), а стрелки дерева подчинения - символами синтаксических отношений («предика­тив­ное », «определи­тель­ное» и т. п.).

Аппарат деревьев подчинения и систем составляющих исполь­зу­ет­ся также для представ­ле­ния глубинно-синтаксической структуры предложения , которая образует промежу­точ­ный уровень между семантической и обычной синтаксической структурой (послед­нюю часто называют поверхностно-синтаксической).

Более совершенное представление синтаксической структуры предложения (требующее, однако, более сложного математического аппарата) дают системы синтаксических групп , в которые входят как словосочетания, так и синтаксические связи, причём не только между словами, но и между словосочетаниями. Системы синтаксических групп позволяют совмещать строгость формального описания строения предложения с гибкостью, присущей традиционным, неформальным описаниям. Деревья подчинения и системы составляющих являются предельными частными случаями систем синтаксических групп.

Другой раздел М. л., занимающий в ней центральное место, - теория формальных грамматик , начало которой было положено работами Н. Хомского. Она изучает способы описания закономерностей, характеризующих уже не отдельный текст, а всю совокупность правильных текстов того или иного языка. Эти закономерности описываются с помощью формальной грамматики - абстрактного «механизма», позволяющего с помощью едино­образ­ной процедуры получать правильные тексты данного языка вместе с описаниями их структуры. Наиболее широко исполь­зу­е­мый тип формальной грамматики - порождающая грамматика , или грамматика Хомского, представляющая собой упорядоченную систему Г = ⟨ V, W, П, R ⟩, где V и W - непересекающиеся конечные множества, называемые соответственно основным , или терминальным , и вспомогательным , или нетерминальным , алфавитами (их элементы называются соответственно основными, или терминальными, и вспомогательными, или нетерминальными, символами ), П - элемент W, называемый начальным символом , и R - конечное множество правил вида φ → ψ, где φ и ψ - цепочки (конечные последовательности) из основных и вспомогательных символов. Если φ → ψ - правило грамматики Г и ω 1 , ω 2 - цепочки из основных и вспомогательных символов, говорят, что цепочка ω 1 ψω 2 непосредственно выводима в Г из ω 1 φω 2 . Если ξ 0 , ξ 1 , ..., ξ n - цепочки и для каждого i = 1, ..., n цепочка ξ i непосредственно выводима из ξ i−1 , говорят, что ξ n выводима в Г из ξ 0 . Множество тех цепочек из основных символов, которые выводимы в Г из её начального символа, называется языком, порождаемым грамматикой Г, и обозначается L(Г). Если все правила Г имеют вид η 1 Aη 2 → η 1 ωη 2 , то Г называется грамматикой составляющих (или непосредственно составляющих), сокра­щён­но НС-грамматикой ; если при этом в каждом правиле цепочки η 1 и η 2 (правый и левый контексты ) пусты, то грамматика называется бесконтекстной (или контекстно-свободной ), сокра­щён­но Б-грамматикой (или КС-грамматикой ). В наибо­лее обычной лингвистической интер­пре­та­ции основные символы представляют собой слова, вспомогательные - символы грамматических категорий, начальный символ - символ категории «предложение»; при этом язык, порождаемый грамматикой, интер­пре­ти­ру­ет­ся как множество всех грамматически правильных предложений данного естественного языка. В НС-грамматике вывод предложения даёт для неё дерево составляющих, в котором каждая составляющая состоит из слов, «происходящих» от одного вспомогательного символа, так что для каждой составляющей указывается её грамматическая категория. Так, если грамматика имеет, в числе прочих, правила П → S x, y, им, V y → V i y O, O → S x, y, предл, V i y → сидит, S муж, ед., им → на, ямщик, S муж, ед., предл. → облучке, то предложение «Ямщик сидит на облучке» имеет вывод, показанный на рис. 5, где стрелки идут от левых частей применяемых правил к элементам правых частей. Система составляющих, отвеча­ю­щая этому выводу, совпадает с изображенной на рис. 1. Возможны и другие интер­пре­та­ции: например, основные символы могут интер­пре­ти­ро­вать­ся как морфы , вспомогательные - как символы типов морф и допустимых цепочек морф, начальный символ - как символ типа «слово­фор­ма », а язык, порождаемый грамматикой, - как множество правильных словоформ (морфологическая интер­пре­та­ция); употребительны также морфонологическая и фонологическая интер­пре­та­ции. В реальных описаниях языков исполь­зу­ют­ся обычно «многоуровневые» грамма­ти­ки, которые содержат последо­ва­тель­но работающие синтаксические, морфологические и морфонологически-фонологические правила.

Другой важный тип формальной грамматики - доминационная грамматика , которая порождает множество цепочек, интер­пре­ти­ру­е­мых обычно как предложения вместе с их синтаксическими структурами в виде деревьев подчинения. Грамматика синтакси­че­ских групп порождает множество предложений вместе с их синтаксическими структу­ра­ми, имею­щи­ми вид систем синтаксических групп. Имеются также различные концепции трансформационной грамматики (грамматики деревьев ), служа­щей не для порожде­ния предложений, а для преобразования деревьев, интер­пре­ти­ру­е­мых как деревья подчинения или деревья составляющих. Примером может служить Δ-грамматика - система правил преобразования деревьев, интер­пре­ти­ру­е­мых как «чистые» деревья подчине­ния предложений, т. е. деревья подчине­ния без линейного порядка слов.

Особняком стоят грамматики Монтегю , служащие для одновременного описания синтак­си­че­ских и семантических структур предложения; в них исполь­зу­ет­ся сложный математико-логический аппарат (так называемая интенсиональная логика ).

Формальные грамматики находят применение для описания не только естественных, но и искусственных языков, в особенности языков программирования .

В М. л. разрабатываются также аналитические модели языка, в которых на основе тех или иных данных о речи, считающихся известными, производятся формальные построения, результатом которых является описание некоторых аспектов строения языка. В этих моделях обычно исполь­зу­ет­ся несложный математический аппарат - простые понятия теории множеств и алгебры; поэтому аналитические модели языка иногда называют теоретико-множественными . В анали­ти­че­ских моделях наиболее простого типа исходными данными служат множество правильных предло­же­ний и система окрестностей - совокупностей «слов», принадлежащих одной лексеме (напри­мер, {дом, до́ма, дому, домом, доме, дома́, домов, домам, домами, домах}). Простейшим произ­вод­ным понятием в таких моделях является замещаемость : слово a замещаемо на слово b , если всякое правильное предложение, содержащее вхождение слова a , остаётся правильным при замене этого вхождения вхождением слова b . Если а замещаемо на b и b на a , говорят, что a и b взаимозамещаемы . (Например, в русском языке слово «синий» замещаемо на слово «голубой»; слова «синего» и «голубого» взаимозамещаемы.) Класс слов, взаимозамещаемых между собой, называется семейством . Исходя из окрестностей и семейств, можно получить ряд других лингвистически значимых классификаций слов, одна из которых приблизительно соответствует традиционной системе частей речи . В другом типе аналитических моделей вместо множества правильных предло­же­ний исполь­зу­ет­ся отношение потенциального подчинения между словами, означа­ю­щее способ­ность одного из них подчинять себе другое в правильных предложениях. В таких моделях можно получить, в частности, формальные определения ряда традиционных граммати­че­ских катего­рий - например, формальное определение падежа существительного , представ­ля­ю­щее собой процедуру, которая позволяет восстановить падежную систему языка, зная только отношение потенциального подчинения, систему окрестностей и множество слов, явля­ю­щих­ся формами существительных.

В аналитических моделях языка исполь­зу­ют­ся простые понятия теории множеств и алгебры. К аналитическим моделям языка близки дешифровочные модели - процеду­ры, позво­ля­ю­щие по достаточно большому корпусу текстов на неизвестном языке без каких-либо предва­ри­тель­ных сведений о нём получить ряд данных о его структуре.

По своему назначению М. л. является прежде всего инструментом теоретического языко­ве­де­ния. В то же время ее методы находят широкое применение в прикладных лингвистических иссле­до­ва­ни­ях - автоматической обработке текста , автоматическом переводе и разработ­ках, связан­ных с так называемым общением между человеком и ЭВМ.

  • Кулагина О. С., Об одном способе определения грамматических понятий на базе теории множеств, в сб.: Проблемы кибернетики, в. 1, М., 1958;
  • Хомский Н., Синтаксические структуры, в сб.: «Новое в лингвистике», в. 2, М., 1962;
  • Гладкий А. В., Мельчук И. А., Элементы математической лингвистики, М., 1969 (лит.);
  • их же , Грамматики деревьев, I, II, в сб.: Информационные вопросы семиотики, лингвистики и автоматического перевода, в. 1, 4, М., 1971-74 (лит.);
  • Маркус С., Теоретико-множественные модели языков, пер. с англ., М., 1970 (лит.);
  • Гладкий А. В., Формальные грамматики и языки, М., 1973 (лит.);
  • его же , Попытка формального определения понятий падежа и рода существительного, в сб.: Проблемы грамматического моделирования, М., 1973 (лит.);
  • его же , Синтаксические структуры естественного языка в автоматизированных системах общения, М., 1985 (лит.);
  • Сухотин Б. В., Оптимизационные методы исследования языка. М., 1976 (лит.);
  • Севбо И. П., Графическое представление синтаксических структур и стилистическая диагностика, К., 1981;
  • Парти Б. Х., Грамматика Монтегю, мысленные представления и реальность, в кн.: Семиотика, М., 1983;
  • Montague R., Formal philosophy, New Haven - L., 1974 (лит.).

I МАТЕМАТИЧЕСКИЕ АСПЕКТЫ СТРУКТУРЫ ЯЗЫКА

В. Звегинцев ПРИМЕНЕНИЕ В ЛИНГВИСТИКЕ ЛОГИКО-МАТЕМАТИЧЕСКИХ МЕТОДОВ

].

Не подлежит сомнению, что использование в языкознании математических и логических методов в значительной степени было стимулировано задачами прикладной лингвистики. Если и делались попытки приложения этих методов к решению проблем, непосредственно относящихся к области теоретического языкознания, например для разграничения явлений языка и речи 1 , то в перспективе (хотя, может быть, и не всегда ясной и близкой) имелись в виду все же потребности прикладной лингвистики.

Успех использования этих методов в совершенно новой области с общей точки зрения во многом обусловливается ответом на вопрос о том, в какой мере допустимо отождествление логически правильного языка с естественным языком, или, в другой формулировке, возможно ли сведение второго к первому 2 . Ответ на этот вопрос обычно дается в практической форме - посредством построения статистических, теоретико-информационных, теоретико-множественных, теоретико-вероятностных и других моделей языка, не всегда, впрочем, ориентирующихся на конкретные задачи. При построении подобного рода моделей их авторы нередко исходят из того допущения (очевидного с их точки зрения), что любое приложение формальнологического или математического аппарата к лингвистическому описанию и исследованию автоматически способствует их совершенствованию. По этому поводу хорошо

1 См . G. Herdan, Language as Choice and Chance, Gronigen, 1956.

2 Ср. замечание Г. Карри: «То, что существует тесная связь между математикой и логикой, с одной стороны, и языком - с другой, стало очевидным уже довольно давно, а сейчас этот факт оказался в центре внимания в более строгом смысле...» (см. ниже, стр. 98).

сказал Уоррен Плат в своем обзоре работ по математической лингвистике: «Если рассматривать языковые модели как абстрактные системы дискретных элементов, то к ним можно применять различные математические понятия и методы, начиная от элементарной идеи числа и кончая сложными логическими, статистическими и теоретико-множественными операциями. Однако представление о том, что всякое привлечение чисел и математических операций для описания таких систем элементов делает утверждения более «точными» или более «научными», является абсолютно ошибочным. Нужно прежде всего показать, что новая система, полученная таким образом, является более удовлетворительной моделью, чем исходная система,- либо в том отношении, что она дает возможность формулировать более простые и более общие теоретические утверждения о некоторых аспектах моделируемой области, либо потому, что операции над моделью проливают свет на результаты соответствующих операций в моделируемой области. Одна из самых больших опасностей, связанных с построением математических моделей языка, в особенности количественных, состоит в том, что неразборчивое использование математического аппарата неизбежно приводит к бессмысленным и дезориентирующим результатам. Поэтому необходимо ясно понимать, что предпосылкой обогащения лингвистики с помощью математики является не только знание соответствующих областей математики, но и, кроме того, глубокое понимание сущности лингвистических проблем, на разрешение которых должны быть направлены математические методы» 3 .

С тем чтобы по возможности избежать указанной Уорреном Платом опасности, необходимо располагать не только чисто эмпирическими попытками ответа на сформулированный выше вопрос, но и стремиться к его общетеоретическому осмыслению. По сути дела вопрос о сводимости естественного языка к той или иной логико-математической его модели или интерпретации есть основной вопрос теории прикладной лингвистики, необходимость создания которой ощущается все более настоятельно. Для решения данного вопроса в первую очередь должна быть рассмотрена природа тех явлений, которые составляют предмет изучения, с одной стороны, логики и математики,

3 См. статью Плата в настоящем сборнике, стр. 202.

а с другой - естественного языка, а затем также возможности тех методов, которые использует каждая из этих наук. Уже из сопоставительного изучения этих моментов окажется возможным сделать некоторые общие выводы. Последние могут быть не бесполезными для всех тех, кому по необходимости приходится проводить свои исследования на пересечении указанных наук.

До известной степени эту цель преследовал и симпозиум «Структура языка и его математические аспекты», проведенный Американским математическим обществом. Избранные работы этого симпозиума и составляют нижеследующий раздел. Но все они, как это явствует и из самого названия симпозиума, затрагивают только отдельные и в ряде случаев весьма частные аспекты интересующей нас проблемы. Хотя в своей совокупности они и создают достаточно аргументированные предпосылки для ответа на поставленный нами вопрос, однако в них все же отсутствует четкое и недвусмысленное формулирование необходимых выводов. Во многом участники симпозиума продолжают линию эмпирических попыток разрешения данного вопроса, отнюдь не навязчиво предлагая свои опыты вниманию лингвистов в надежде, что последние уже сами разберутся в том, насколько предоставленные в их распоряжение гипотезы и решения окажутся пригодными для целей лингвистики.

2.

Как кажется, мы уже располагаем недвусмысленным ответом на наш вопрос. Так, Н. Д. Андреев и Л. Р. Зиндер пишут: «Математическое представление (модель) языков отнюдь не тождественно самому языку» 4 . Эту мысль развивает и автор книги «Модели языка» И. И. Ревзин, который указывает, что результатом моделирования может явиться лишь «более или менее близкая аппроксимация данных конкретной действительности» 5 . Однако сказать так, значит еще ничего не сказать, поскольку остается

4 Н. Д. Андреев, Л. Р. Зиндер, Основные проблемы прикладной лингвистики, «Вопросы языкознания», 1959, № 4, стр. 18

5 И. И. Р е в з и н, Модели языка, Москва, 1962, стр. 8. Кстати говоря, выражение «близкая аппроксимация» - прямая тавтология: близкая приближенность.

нераскрытым, почему это так, и следует ли все же обращаться к методу математического и логического моделирования, а если да, то в каких пределах и для какой цели.

Прежде чем приступить к решению этих вопросов, необходимо сначала установить, к каким наукам - индуктивным или дедуктивным - относятся лингвистика, логика и математика. Что касается последних двух наук, то их положение ясно - они, бесспорно, относятся к дедуктивным наукам, которые опираются в своей исследовательской методике на умозаключение. Лингвистику же традиционно определяют как эмпирическую науку, поскольку полагают, что ее главной научной целью является описание фактов. Это значит, видимо, что лингвистика должна быть отнесена к области индуктивных наук. Это значит также, что, стремясь использовать в лингвистике формальный аппарат логики и математики, пытаются применить в индуктивной науке дедуктивные методы исследования.

Впрочем, в последние годы индуктивная природа науки о языке косвенно или прямо стала подвергаться сомнению. В наиболее резкой форме это сделал Л. Ельмслев. Правда, используемая им терминология весьма сбивчива и, в частности, характеризуется своеобразным и очень личным пониманием терминов дедукция и индукция (фактически он истолковывает их в обратном смысле). Однако основы его лингвистической теории не оставляют никаких сомнений относительно ее методологической сущности. Так, он считает допустимым использование любых исходных операционных определений, что характерно для дедуктивных наук. И сам он в следующих выражениях характеризует свою теорию: «1. Теория в нашем смысле сама по себе независима от опыта. Сама по себе она ничего не говорит ни о возможности ее применения, ни об отношении к опытным данным. Она не включает постулата о существовании. Она представляет собой то, что было названо чисто дедуктивной системой, в том смысле, что она одна может быть использована для исчисления возможностей, вытекающих из ее предпосылок. 2. С другой стороны, теория включает ряд предпосылок, о которых из предшествующего опыта известно, что они удовлетворяют условиям применения к некоторым опытным данным. Эти предпосылки наиболее общи и могут поэтому удовлетворять условиям применения к большому числу экспериментальных данных» 6 .

Как явствует из этого высказывания, Л. Ельмслев стремится провести идею о двойственной методической природе объектов лингвистического исследования с преимущественным акцентом на их дедуктивные признаки. Ему следует приписать и тот довольно двусмысленный способ («с одной стороны.., но с другой стороны...»), который вообще стал характерным для рассмотрения данного вопроса (и который дает возможность повернуть в любую из сторон). Идея методической двойственности лингвистики получила в последнее время широкое распространение и даже послужила теоретической основой для формулирования принципов самого последнего по времени своего возникновения направления в науке о языке - лингвистики универсалий (универсалиализма). В «Меморандуме относительно лингвистических универсалий» говорится по этому поводу: «Изучение лингвистических универсалий ведет к целой серии эмпирических обобщений относительно языкового поведения - как еще требующих эксперимента, так и уже установленных. Эти обобщения представляют собой потенциальный материал для построения дедуктивной структуры научных законов. Впрочем, некоторые и, может быть, большинство из них пока располагают всего лишь статусом эмпирических обобщений, которые при современном состоянии наших знаний не представляется возможным соотнести с обобщениями или дедуктивно вывести из законов более общей значимости» 7 . С не меньшей определенностью выражается и Дж. Грян-берг в своем предисловии к сборнику, посвященному лингвистическим универсалиям. Полемизируя с известными словами Л. Блумфилда о том, что «единственно правомерными обобщениями относительно языка являются индуктивные обобщения», он пишет: «Все же, по-видимому, считается общепринятым, что научный метод должен быть-не только индуктивным, но и дедуктивным. Формулирование обобщений, полученных индуктивным исследованием, приводит к теоретическим гипотезам, на основе

6 Л. Е л ь м с л е в, Пролегомены к теории языка, Сб. «Новое-в лингвистике», вып. I , М., 1960, стр. 274-275.

7 «Memorandum Concerning Language Universals», в «Universals of Language», ed. by J. Greenberg, Cambridge, Mass., 1963, pp. 262 - 263.

которых путем дедукции в свою очередь могут быть выведены дальнейшие обобщения. Эти последние затем должны быть подвергнуты эмпирической проверке» 8 .

То обстоятельство, что история языкознания состоит не только из накопления фактов языка и их классификации, но и из смены точек зрения на сам язык, что неизбежно предполагает различие подходов к языковым фактам и даже различное их теоретическое истолкование, заставило и некоторых советских лингвистов также прийти к выводам о методической двойственности их науки. С. К. Шаумян предпочитает, правда, говорить при этом о методе гипотетико-дедуктивном, и следующим образом излагает его особенности: «Гипотетико-дедуктивный метод представляет собой циклическую процедуру, которая начинается с фактов и кончается фактами. В этой процедуре различаются четыре фазы:

1) фиксирование фактов, требующих объяснения;

2) выдвижение гипотез для объяснения данных фактов;

3) выведение из гипотез предсказаний о фактах, лежащих за пределами круга фактов, для объяснения которых были выдвинуты гипотезы;

4) проверка фактов, которые предсказываются гипотезами, и определение вероятности гипотез.

Гипотетико-дедуктивный метод принципиально отличается от индуктивного метода, применяемого в таких областях знания, как, например, описательная ботаника или зоология» 9 . Метод С. К. Шаумяна полностью повторяет метод лингвистики универсалий и Дж. Гринберга. Единственное различие состоит в наименовании. Если, например, Дж. Гринберг говорит о сочетании индуктивного и дедуктивного метода, то С. К. Шаумян именует свой метод гипотетико-дедуктивным - обозначение явно непоследовательное для метода, который «начинается с фактов и кончается фактами».

Вопросом о том, куда следует отнести языкознание, задается и И. И. Ревзин. «По самой своей природе,- от-

8 « Universals of Languages p . IX .

9 С. К- Шаумян, Проблемы теоретической фонологии, М., 1962, сгр. 18-19. Относительно гипотетико-дедуктивного метода см. также статью В. С. Ш в ы р е в а, Некоторые вопросы логико-методологического анализа отношения теоретического и эмпирического уровней научного знания, в сборнике «Проблемы логики науч-шого познания», М., «Наука», 1964, стр. 66-75 (3-й раздел статьи).

вечает он на этот вопрос,- языковедение должно прежде всего пользоваться индуктивными методами, оно описывает конкретные речевые акты конкретных языков...

С другой стороны, наличие бесконечного множества речевых актов, изучаемых лингвистом, едва ли дает возможность сформулировать основные понятия науки о языке обобщением по индукции.

Отсюда следует, что лингвисты нуждаются не только в индуктивных, но и в дедуктивных методах исследовав ния, чтобы получить систему общих знаний, помогающих осмыслить те данные, которые добываются при анализе конкретных языков...

В своей дедуктивной части языковедение, по-видимому, может быть построено так, как строится логика или математика, а именно: выделяется некоторое минимальное количество первичных, неопределяемых терминов, а все остальные термины определяются через первичные. При этом должны быть четко сформулированы некоторые первичные утверждения о связи этих терминов между собой (аксиомы), и все остальные утверждения должны доказываться, то есть сводиться к некоторым другим утверждениям» 10 .

Здесь метод дедукции, воплощающийся в логике и математике, выступает всего лишь как средство упорядочения «множества речевых актов», для целей создания «системы общих понятий». В прямом противоречии с этой задачей стоит, однако, изложение самого дедуктивного метода, рекомендуемого для использования в языкознании. Он полностью отмысливается и от актов и от фактов и за исходный момент построения системы общих лингвистических понятий принимает набор неопределяемых и, по-видимому, абсолютно условных первичных терминов, через посредство которых определяются все последующие термины.

Это противоречие не случайно, оно кроется в самой природе рассматриваемых нами наук. Казалось бы, вывод о том, что при изучении лингвистических объектов допустимо сочетание индуктивного и дедуктивного методов, открывает двери для использования в лингвистике логических и математических методов, а конкретной реализацией этого вывода является создание многочисленных

10 И. И. Р е в з и н, Модели языка, М., 1962, стр. 7-8.

формально-логических и математических моделей языка. Но, как будет показано в дальнейшем, такой упрощенный лодход не может дать удовлетворительных результатов. Можно согласиться с тем, что в лингвистическом исследовании допустимо и даже необходимо сочетать дедуктивную и индуктивную методику. В конце концов, как писал В. Брёндаль, «индукция есть не что иное, как замаскированная дедукция, и за чистыми связями, установленными между наблюдаемыми явлениями, совершенно неизбежно предполагается реальность, специфический объект данной науки» 11 . Но это еще не значит, что в лингвистику следует безоговорочно и механически переносить формальный аппарат логики и математики без всякого учета «специфического объекта данной науки». Как справедливо замечает тот же И. И. Ревзин, «доказательства, полученные дедуктивным путем, сколь бы безукоризненными они ни были с логической точки зрения, еще ничего не говорят о свойствах реального языка, описываемого моделью» 12 . И для определения действенности моделей он рекомендует обратиться к практике, каковую представляет машинный перевод и «другие практические приложения, языкознания».

А практика прикладной лингвистики свидетельствует, что на использование математических и логических методов при изучении явлений языка накладываются очень строгие ограничения.

Логика дает пример наиболее последовательного использования дедуктивного метода. Математика во многом следует в этом отношении за логикой, и поэтому они могут рассматриваться совместно.

Разумеется, и логика, и математика в отношении своих методов и интерпретации целей не представляют гомогенных систем. Так, например, применительно к логике мы можем говорить о логике диалектической, формальной, математической и в более узком смысле - о предметной, семантической, феноменологической, трансцедентальной, или конструктивной, комбинаторной, многозначной, мо-

11 В. Брёндаль, Структуральная лингвистика. Цит. по
книге В. А. Звегинцева «История языкознания XIX и XX вв. в очер-
ках и извлечениях», ч. II, М., Учпедгиз, 1960, стр. 41-42.

12 И. И. Ревзин, Модели языка, М., 1962, стр. 10.

дальной и пр. По необходимости, однако, придется от-мыслиться от всех подобных подразделений и говорить только о самых общих чертах, свойственных логике и математике в целом, и главным образом о тех, которые с наибольшей отчетливостью демонстрируют дедуктивный характер методов этих наук.

Став на эту позицию, мы, следовательно, не будем обращаться к индуктивной логике. Отметим только, что выводы в индуктивной логике не определяются предпосылками - тем самым они не являются тавтологическими. Выводы в индуктивной логике находятся в прямой зависимости от фактов, а эти последние определяются объемом наших знаний - таким образом, они устанавливаются на вероятностной основе. Вероятность является основным методическим орудием индуктивной логики.

Дедуктивную логику наиболее полным образом представляют формальная и математическая логики, имеющие много общего. Дедуктивная логика - наука, изучающая человеческое мышление или мыслительные акты со стороны их структуры или формы, отвлекаясь от их конкретного содержания. Таким образом, дедуктивная логика стремится сформулировать законы и принципы, соблюдение которых является обязательным условием для достижения истинных результатов в процессе получения выводного знания. Основным методическим орудием дедуктивной логики является импликация. Выводное зна-ние она получает без непосредственного обращения к опыту или к практике, лишь посредством применения законов логики. В процессе дедукции предпосылка обусловливает вывод: если предпосылка истинна, то и вывод должен быть истинным. Таким образом, вывод заключается уже в предпосылке, и цель дедукции - сделать очевидным то, что в скрытом состоянии заключено уже в предпосылке. Отсюда следует, что всякий полученный посредством дедукции вывод тавтологичен, то есть логически является пустым, хотя с иных точек зрения, например в случаях применения формально-логического аппарата для целей других наук, может быть новым, неожиданным и оригинальным.

Аналогичное положение имеет место в математике - обоснованность доводов в ней полностью покоится на дедукции. При этом в математике, как правило, приемлема любая исходная точка зрения, любой подход к решению проблемы - лишь бы они удовлетворяли условиям математической дедукции. Математика располагает богатым набором такого рода «исходных точек зрения» и «подходов», которые исследователь альтернативно может использовать для решения своей задачи. Математическая проблематика часто переводима в разные эквивалентные формы, а каждая из них предполагает использование различных областей математической теории с целью решения проблемы. Таким образом, математик обладает фактически неограниченной свободой выбора предпосылок - он выбирает те из них, которые, с его точки зрения, таят в себе самые обещающие возможности для наиболее простого, небанального, изящного решения задачи. Его талант и опыт проявляются именно в удачном выборе предпосылок, тех «допустим, что...» или «если..., то», которыми пестрят математические работы. Так же как и в логике, математические предпосылки - аксиомы или постулаты - обусловливают определения еще не определенных единиц.

Свобода выбора предпосылок в математике находится в прямой зависимости от тех нематериальных единиц или объектов, которыми она оперирует,- ее внимание направлено на отношения между ними. Математические объекты выступают в качестве символов, выражающих структуру чистых отношений. Математическую систему можно, таким образом, рассматривать как набор формальных отношений, существующих лишь в силу констатации этих отношений. Разумеется, в частности в прикладных целях, констатации отношений могут быть направлены на воплощение в них корреспонденции с внешней реальностью, что не окажет никакого воздействия на сами эти констатации, скорее, наоборот. Математики исследуют не «истинность» своих аксиом, хотя и требуют между ними взаимной согласованности. Исследование внутри математической системы есть исследование и установление связей, которые позволяют доказать, что факт теории А предполагает факт теории Б. Следовательно, основной вопрос в математике не «что такое А и Б», а «предполагает ли А (или обусловливает ли) Б?»

Совершенно иное положение в лингвистике - она в основном ориентируется на первый из этих вопросов, и это не дает ей возможности оторваться от реальности; она, следовательно, оперирует не абстрактными, а конкретными единицами, хотя и стремится в ряде случаев к созданию абстрагированных объектов вроде понятия фонемы или морфемы. Такое положение характерно не только для традиционной лингвистики, но в равной степени свойственно и новейшим ее направлениям, объединившимся под знаменем структурализма. Выше уже приводился ряд высказываний, авторы которых, пытаясь использовать в науке о языке не только индуктивные, но и дедуктивные методы (или математические и логические методы), не смогли все же обойти необходимость обращения к реальному лингвистическому факту. В дополнение к ним можно привести еще одно, которое вносит полную ясность в рассматриваемый вопрос. «Лингвистический анализ, - пишет в указанной связи П. Гарвин, - в основном индуктивный процесс в том смысле, что он стремится установить список элементов или набор констатации, исходя из лингвистических стимулов информантов или же из изучения текста. Он основывается на предположении, что в обоих этих источниках сведений окажется возможным распознать регулярно встречающиеся элементы различных типов и порядков сложности. Классификация этих типов и констатация их условий дистрибуции, полученные в результате анализа, образуют индуктивное описание языка» 13 .

В лингвистике, конечно, также можно использовать метод предпосылок, исходя из которых затем определяются частные объекты, факты или единицы языка. Но здесь мы сталкиваемся с двумя особенностями, которые вносят существенные коррективы в использование этого метода. В отличие от логики и математики в этом случае будет искаться «истинность» полученных таким способом определений, то есть их соответствие данным опыта. Таким образом, устанавливается взаимозависимость предпосылки и выводного знания: предпосылка определяет вывод (определение частного лингвистического объекта в терминах предпосылки), но если вывод не соответствует данным опыта, то возникает необходимость коррективы самой предпосылки. Но такого рода коррективы предпосылки не имеют ничего общего с той переводимостью в эквивалентные формы, которая, как указывалось выше, допустима в математике, так как они обусловливаются не

13 P. Garvin, A Study of Inductive Method in Syntax, «Word», vol. 18, 1962, p. 107.

формальными соображениями, а данными опыта. Все сказанное дает основание заключить, что само понятие предпосылки и свобода ее выбора обладают в лингвистическом анализе специфичностью, с которой нельзя не считаться при использовании в языкознании дедуктивного метода.

Лингвисты не могут пользоваться с такой свободой методом «если» или «допустим», как математики. Свобода предпосылок у них очень строго ограничена. История науки о языке знает немало смен «точек зрения» или, иными словами, исходных предпосылок, которые были подсказаны открытием новых фактов, распространением на лингвистику общенаучных идей или даже формированием оригинальных теорий. Но для лингвиста во всех подобных случаях смена «если», или исходной предпосылки, есть смена всей научной концепции. Поэтому лингвист говорит не «если», а постулирует свое понимание предпосылки, то есть фактически понимание предмета своего исследования, и, исходя из этого понимания, дает определение частных единиц языка, проверяя эти определения данными опыта. Последнее же обстоятельство, в силу взаимозависимости предпосылки и вывода в лингвистике, служит средством проверки и правомерности самой предпосылки, стоящей в начале дедуктивного по форме лингвистического анализа. Так, если обращаться к конкретным примерам, в прошлом язык истолковывался как выражение духовной сущности народа (у Гумбольдта), как естественный организм (у Шлейхера), как индивидуальная психофизиологическая деятельность (у младограмматиков) и т. д. Исследовательская практика, основывающаяся на этих концепциях, показала их недостаточность. Ныне исходной предпосылкой лингвистического анализа является постулат, что язык есть система знаков. Он подлежит такой же проверке опытом и практикой, как и любая другая концепция в науке о языке.

Уже эти предварительные и самые общие соображения показывают, что дедуктивные методы вовсе не противопоказаны лингвистике, но применение их требует соблюдения специфических условий. Именно эти специфические условия накладывают определенные ограничения на механическое перенесение методов логики и математики в область лингвистики. Однако, если мы ограничимся такой общей констатацией, многое останется все еще неясным. Именно поэтому следует углубить разбираемый нами «вопрос и для подкрепления потенциальных выводов обратиться к практике прикладной лингвистики, где с наибольшей отчетливостью проявляется правомерность предпосылок и соответствие опытным данным сделанных на их основе выводов.

Отношения между языком и логикой носят весьма своеобразный характер. Представители эмпирических наук, к которым относится и лингвистика, изучают тот или иной предмет или явление с целью описать или объяснить его. Полученные ими результаты они формулируют на языке, который именуется языком-объектом. Логик орудует доказательствами, умозаключениями, суждениями и пр., но они доступны ему только в языковой форме. Таким образом, получается, что логик на одну ступень находится дальше от реального мира, чем представители эмпирических наук. Его анализ направляется не непосредственно на реальный объект, изучаемый эмпирическими науками, а на их язык 14 . Иными словами, он исследует язык и формулирует полученные результаты на языке, который именуется метаязыком.

С логической точки зрения основной единицей языка является не знак и не обозначаемый им объект, а предложение, так как только в нем может развернуться логический процесс. Именно поэтому только предложение может быть истинным или ложным. А слова сами по себе не могут обладать этими качествами. Но прежде чем мы сможем установить, является ли предложение истинным или нет, мы должны констатировать, что оно имеет значение.

Понятия истинности и значения относятся к области семантики, изучающей отношения между языком и обозначаемыми им объектами. Через посредство этих отношений и определяется истинность или ложность предложения: если предложение описывает объекты правильно, оно истинно, а если неправильно - нет. Но языковые выражения могут вступать в отношения иные, чем те, которые

14 «Логический анализ научного знания,- пишут в этой связи П. В. Таванец и В. С. Швырев,- есть прежде всего и непосредственно анализ языка, в котором выражается это знание». См. статью «Логика научного познания» в сборнике «Проблемы логики научного познания», М., «Наука», 1964, стр. 161.

существуют между обозначаемыми ими объектами. Кроме того, предложения могут вступать в отношения с другими предложениями. Задача логика заключается в том, чтобы выяснить природу отношений между языковыми выражениями и предложениями и установить правила для определения того, выдерживается предписанная в данном случае процедура или нет. При решении этого последнего вопроса логик не обращается к объектам, описываемым предложением. Он интересуется лингвистической формой, а не ее содержанием, что, разумеется, не препятствует интерпретации ее содержания, в результате чего возникает формализованный язык. Формализованный язык может быть представлен в виде абстрактной системы, например исчисления предикатов.

Итак, логик может в зависимости от задач исследования работать на двух уровнях - синтаксическом (логический синтаксис) и семантическом (логическая семантика). Рассмотрим сначала приложение первого из этих уровней к естественному языку.

Если логик, занятый изучением языковых форм и существующих между ними отношений, может оставаться в пределах синтаксического уровня, оперируя несодержательными терминами, то лингвист этого сделать не может. Все уровни естественного языка (за исключением, может быть, фонематического) содержательны и поэтому вне семантики немыслимы. И более того, естественный язык не существует вне прагматики, которая не может быть легко отслоена от него в силу той простой причины, что в речевом акте она постоянно трансполируется в семантику. Поэтому естественный язык - всегда интерпретация и притом двуступенчатая, поскольку связана и с семантикой и с прагматикой 15 . И эта интерпретация не поддается пока никакой формализации.

Перейдем теперь ко второму уровню, когда исчислению посредством семантических правил приписывается интерпретация. И в этом случае мы получим образование, никак не сопоставимое с естественным языком. Правда,

15 Ср. замечания Нилса Бора о математическом языке, где «необходимая для объективного описания однозначность определений достигается при употреблении математических символов именно благодаря тому, что таким способом избегаются ссылки на сознательный субъект, которыми пронизан повседневный язык». (Ниле Бор, Атомная физика и человеческое познание, М., ИЛ, 1961, стр. 96.) здесь мы имеем дело с содержательными терминами, но в логическом и естественном языке они строят свое отношение к «истинности» на совершенно иных основаниях. Как пишет А. Тарский, «истинное», «во всяком случае, в его классической трактовке» является таковым в той мере, в какой оно «совпадает с действительностью» 16 . Но этот критерий истинности фактически применим лишь к естественным языкам, всегда ориентированным на действительность. По-иному обстоит дело в логической семантике. Семантический анализ опирается лишь на логическую интерпретацию системы и предполагает установление on - i ределенных правил, формулирующих условия истинности, i Он предписывает следование этим правилам, не отвечая на вопрос о том, в какой мере здесь имеет место «совпаде- i ние с действительностью». Кроме того, сама ориентированность на действительность осуществляется в естественном языке не непосредственно, а через человека, что опять-таки делает необходимым обращение к третьему уровню, - прагматическому. «...Переход на семантический уровень, - констатируют П. В. Таванец и В. С. Швырев, - не есть само по себе возвращение к живому языку в его конкретности, как может показаться на первый взгляд благодаря тому, что смысловая функция языка есть как будто существо языка как «непосредственной действительности мысли». На самом деле исходная схема семантики «язык - действительность» не дает еще конкретного образа языка как непосредственной действительности мысли по той простой причине, что язык связан с действительностью не сам по себе неким мистическим способом, а через человека, через его действия, его поведение. Поэтому, собственно говоря, конкретное представление о языке как носителе мысли может быть достигнуто лишь на уровне его прагматического анализа по схеме «язык - действия человека с языком и на основе языка - действительность» 17 .

Но и это еще не взе. Касаясь данного вопроса, В. M. | Глушков пишет: «Живой человеческий язык может рассматриваться как формальный язык лишь после того, как будет сформулирована строгая система правил, позволяю-

16 А . Т а г s k i, Grundlegung der Wissenschaftlichen Semantik
(Actes du
Congrès International de Philosophie Scientifique, 1936).

17 См. статью «Логика научного познания» в сборнике «Про-
блемы логики научного познания», М., «Наука»,
1964, стр. 16.

щая отличить выражения, допускаемые в языке, от всех прочих выражений, то есть осмысленные предложения От бессмысленных» 18 . Разъясняя трудности, возникающие при формализации естественного языка, он далее указывает, что «...никакой фиксированный формализованный язык не может быть адекватен живому человеческому языку, поскольку последний в отличие от первого непрерывно развивается и совершенствуется. Поэтому всякая формализация любого живого человеческого языка представляет собой лишь более или менее удачный его мгновенный слепок, утрачивающий сходство с оригиналом по мере развития последнего» 19 . Если бы все сводилось только к этому, то это было бы еще полбеды, В прикладной лингвистике отмысливаются от моментов развития языка, стремятся рассматривать его как совершенно стабильную систему и все же никак не удается добиться формализации естественного языка. Происходит это по весьма простой причине. Формальная система и естественный язык основывают свою действенность на полярно противоположных качествах. Всякая формальная система всегда тождественна самой себе. Именно это ее качество делает возможным выполнение ею своих функций во всех конкретных случаях ее приложения. А естественный язык - в плане своего содержания, своей семантики или, как в этих случаях принято говорить, в своем информативном плане - никогда не тождествен самому себе. Именно эта его способность дает возможность функционировать ему во всех конкретных случаях его применения. Оставаясь тем же самым языком, он в разных ситуациях всегда иной. При этом он не обладает ни эксплицитными, ни формативными правилами, ни правилами истинности, ни трансформационными правилами для определения того, какое из потенциальных значений или оттенков значений получит данное слово в той или иной ситуации. Более того, почти любое слово естественного языка может получить значение, которое не зафиксировано никаким языком,- оно может, возникнув, закрепиться в языке, но с таким же успехом, подобно беглому огоньку, вспыхнув, затеряться в лингвистическом космосе и погаснуть.

18 В. М. Г л у ш к о в, Мышление и кибернетика, «Вопросы фи-
лософии», 1963, № 1, стр. 37-38

19 Там же, стр. 38.

И при всех этих своих качествах естественный язык оказывается изумительно совершенным орудием, которое позволяет добиться полного взаимопонимания относительно самых сложных понятий и в любых ситуациях. Почему это происходит?

Видимо, ответ на этот вопрос частично следует искать в одной из мыслей основоположника семиотики Ч. Пирса, которую он настойчиво повторяет во многих своих работах. Она сводится к следующему. В современной лингвистике язык принято определять как систему знаков. Это исходная предпосылка для всего лингвистического анализа. Если это так, то язык не просто система знаков, а система взаимно интерпретирующих друг друга знаков, существующих в нем постольку, поскольку они интерпретированы в других знаках. Ч. Пирс формулирует это следующим образом: «Ни один знак не может функционировать в качестве знака, если он не интерпретирован в другом знаке. Следовательно, для знака абсолютно существенно, чтобы он воздействовал на другой знак» 20 . И в другом месте: «Все назначение знака состоит в том, что он будет интерпретирован в другом знаке» 21 . И, наконец, пожалуй, наиболее важное: «Знак не есть знак, если только он не переводит себя в другой знак, в котором он получает более полное развитие» 22 .

Следовательно, естественный язык есть система знаков, которые посредством взаимной интерпретации получают возможность отвечать на все потребности человека в смысловом выражении. Но здесь необходима одна существенная оговорка. Ведь все потребности этого рода обусловливаются отношением человека к явлениям внешнего мира и общественной средой, в которой протекает его жизнь. В силу этого обстоятельства трансформационная семантика, если бы ее удалось создать, не может опираться лишь на правила взаимной интерпретации знаков, то есть носить закрытый и конечный характер. Она оказывается производной от очень большого количества величин, которые всячески противятся формализации.

20 Ch. Р е i г с е , Collected Papers, Cambridge, Mass., vol. 8,
p. 225.

21 Там же, vol . 8, p . 191.

22 Там же, vol . 5, p . 594.

В связи со сказанным важно рассмотреть особенности процедуры решения задач и само понятие решаемости в логике и математике, с одной стороны, и в лингвистике - с другой.

Прежде чем приступить к решению проблемы в математике, эта проблема должна быть формулирована в точных терминах. Само это формулирование является предпосылкой успешного решения проблемы. При этом, как уже указывалось, математик может свободно трансформировать данное формулирование проблемы в эквивалентный вариант- она располагает для этого и соответствующими средствами. Уже на этой первой стадии исследовательской методики лингвистика существенно отличается от математики. При формулировании своих проблем лингвист располагает некоторым количеством наблюденных эмпирических данных, которым он не всегда может дать точную формулировку, но которые тем не менее он волей-неволей должен положить в основу своего исследования - уже в процессе самого этого исследования уточняются формулировки, нередко являющиеся целью самого исследования. Чтобы не идти далеко за примерами, можно сослаться на лингвистическое значение, которое лежит в основе исследований в области автоматической переработки речевой информации, но вместе с тем определяется весьма туманно и разноречиво. Именно это обстоятельство и заставляет исследователей данной области постоянно менять свою стратегию.

Но вот исследование начато и достигнуто какое-то решение. Что это значит применительно к логике и математике и применительно к лингвистике? Логика, как указывалось выше, дает возможность эксплицитно представить заключения, имплицитно присутствующие в предпосылке. Однако логика не располагает правилами, использование которых может гарантировать, что при этом будет добыто желаемое решение, так как она есть не средство достижения новых выводов, а всего лишь методика определения их правильности. Она - не волшебный ключ ко всем тайнам. Совершенно очевидно, что если бы логика обладала подобными правилами, то тогда бы не было и нерешенных проблем. Достаточно было бы приложить определенный набор логических правил, и мы бы автоматически получали готовый ответ на любой мучающий нас вопрос. В свете сказанного специфическое значение приобретает и понятие решаемости проблемы или задачи.

В логике и в математике всякий конечный результат признается истинным, если в процессе доказательства не было нарушено никакое формальное правило. Так как при этом возможны разные пути доказательства, допустимо существование различных решений. Но все они могут быть подвержены проверке с точки зрения требования логики или математики. По-иному обстоит дело в лингвистике. Она не располагает аппаратом, с помощью которого можно проверить или доказать правильность полученных выводов. Соответственно с этим определяется и истинность достигнутых решений - она устанавливается не формальными правилами, а своим соответствием данным опыта. При этих условиях теоретически следовало бы ожидать единого конечного решения. Однако практически, как свидетельствуют об этом разноречивые лингвистические определения даже основных категорий языка, это не имеет места. В данном случае всегда присутствует известный субъективизм оценок, который в немалой степени определяется объемом фактов, находящихся в распоряжении исследователя. Отсюда следует, что истинность решения в лингвистике всегда дается в некотором приближении и имеет не детерминативный, а вероятностный характер.

В этих условиях очень важно подвергнуть проверке на основе объективных критериев правильность лингвистических определений и истолкований. Возможность такой проверки дает широкая область прикладной лингвистики, где естественному языку противостоит машина, представляющая интересы логики и математики.

Для решения практических задач прикладной лингвистики используется цифровая вычислительная машина. Она способна воспринимать, хранить, передавать, перегруппировывать и выдавать информацию. Она интерпретирует и выполняет набор команд (программу команд), а также модифицирует их в процессе выполнения задания. Она в состоянии решать весьма сложные проблемы, но при этом весь процесс перехода от задания к решению должен быть исчерпывающе и непротиворечиво описан в терминах последовательности основных элементарных операций. Информация вводится в машину с помощью двузначного (бинарного) кода или языка. Машина оперирует закодированными таким образом словами, соответствующими основным логическим связям . или функциям исчисления высказываний или предикатов. Машина может решать сложные математические задачи именно в силу того, что сложные математические операции оказывается возможным свести к последовательности арифметических операций, а эти последние в свою очередь к логическим операциям. Следовательно, цифровую вычислительную машину можно рассматривать так же, как логическую машину.

Таким образом, какой бы сложности ни была задача, машина решает ее с помощью последовательности элементарных операций, программа которых должна быть формулирована абсолютно недвусмысленно (непротиворечиво), точно, детально и исчерпывающе полно. Другими словами, она не должна выходить за те пределы, которые устанавливаются логическим исчислением высказываний; и когда мы задаемся вопросом о том, может ли машина совладать с обработкой информации, заключенной в естественных языках, нам прежде всего нужно выяснить, в какой степени логическое исчисление высказываний является адекватной моделью для естественного языка.

Учитывая специфику цифровой вычислительной машины, описанную выше, первое, что необходимо сделать, чтобы машина «поняла» задание и начала обработку речевой информации в соответствии с этим заданием, это переформулировать информацию, содержащуюся в естественном языке, на логический язык. Речь идетю переводе естественного языка на язык логического исчисления высказываний.

При этом, как показал Бар-Хиллел 23 , приходится сталкиваться с такими трудностями, которые рисуют перспективы автоматической обработки информации в весьма мрачном свете, если не будет изменено все направление поисков решения данной проблемы. По меньшей мере придется считаться с перечисленными ниже препятствиями, для преодоления которых мы пока не располагаем необходимыми средствами.

А. Логическое исчисление высказываний слишком бедно для того, чтобы можно было бы, даже с далеким при-

23 Y. В а г - Н i 1 1 е 1, A Demonstration of the Non-feasibility of Fully Automatic High Quality Translation, «Advances in Compu-ters», ed. by F. Alt., vol. I , N . Y ., 1960, pp . 158-163.

ближением, произвести переформулировку естественного языка, невероятно сложного по своей семантической структуре, обладающего огромным объемом избыточных элементов и - самое главное - часто отличающегося такой неясностью и неопределенностью в выражении «смысла», что никакая двузначная логика не способна справиться с созданием искусственного двойника естественного языка 24 . Правда, логика, как указывалось, имеет дело лишь с лингвистической формой. Но поскольку дело идет об автоматической обработке информации, необходимо уметь различать и семантическую информацию, и если этого невозможно достичь с помощью имеющихся в нашем распоряжении логических средств, то откуда мы можем почерпнуть "уверенность, что наш перевод естественного языка на логический правилен?

Б. Машина не может учитывать того, что Бар-Хиллел называет «общими предварительными данными информации» (gênerai background of information), которые фактически остаются за пределами естественного языка и поэтому не подлежат переводу на логический язык. Лингвисты в этих случаях говорят о внеязыковом контексте (frame of référence), который неприметным для нас, но очень решительным образом корректирует или даже подвергает полному переосмыслению все наши слова. Ведь даже такая простая фраза, как «Я вернусь засветло», для точного ее понимания и определения содержащегося в ней временного указания как минимум требует предварительного знания того, где она была произнесена и в какое время дня и года. Только подобного рода предварительная информация часто является единственным средством для уяснения тех внутрифазовых отношений, с которыми не в состоянии справиться ни исчисление высказываний, ни исчисление предикатов. Так, привлекая для примера два промелькнувших в газетах предложения:

Аспирант университета из города Курска. Заслуженный рационализатор Сибири,

мы видим, что каждое из них может быть истолковано двояким образом. Если придерживаться лишь формально-

24 В статье Ч. Хоккетта «Грамматика для слушающего», включенной в настоящий раздел, приводится много примеров такого рода сложностей в «естественном» понимании предложения, которые разрешаются последующими и далеко уходящими шагами анализа.

грамматических признаков, то первое предложение с одинаковым успехом можно понять и как «Аспирант из университета, расположенного в городе Курске» и как «Аспирант университета, проживающий в городе Курске (или происходящий из города Курска)». А второе предложение может быть трактовано и как «Заслуженный рационализатор, полем деятельности которого является Сибирь» и как «Заслуженный рационализатор, являющийся жителем Сибири». И только предварительные и никак не выраженные в предложениях знания (предварительная информация), констатирующие, что в городе Курске нет университета и что заслуженный рационали затор есть почетное звание, присваиваемое в Советском Союзе отдельными административными округами, дают возможность правильного понимания этих предложений. Если внимательно приглядеться, то почти за каждой фразой разговорного языка стоит весьма основательная и разветвленная предварительная информация, само собой разумеющаяся для человека, но лежащая за пределами «разумения» машины, которая не знает ни рода, ни племени.

В. Машина не может делать внутритекстовые смысловые заключения, распространяющиеся на несколько предложений (а иногда даже намеренно на целый рассказ, чтобы до конца не раскрыть его персонажа или сюжетного хода). На это обстоятельство обратил внимание голландский лингвист А. Рейхлинг 25 , иллюстрируя свою мысль следующим примером. Допустим, что мы читаем некое повествование, которое начинается предложением: «Я играю с моим братом». Если мы на этом остановимся, то в нашем распоряжении не будет никаких данных для выяснения того, как же следует понимать эту фразу, о какой игре здесь идет речь. Ведь можно играть на деньги (в карты и пр.), на музыкальном инструменте, в театре или в кино, в игрушки, в футбол, играть для забавы, играть человеком и его судьбой и т. д. Но вот мы читаем дальше: «Я сказал это, когда Вильгельм однажды встретился мне

25 На коллоквиуме «Stichting Studiecentrum voor Administrative Automatisering», организованном в 1961 г. Имеется и немецкий перевод доклада: A. R е i с h 1 i n g, Möglichkeiten und Grenzen der mechanischen Obersetzung, aus der Sicht des Linguisten, «Beiträge zur Sprachkunde und Informationsverarbeitung», Heft I., Wien, 1963.

в баре». Теперь уже с большей вероятностью мы можем заключить, что, по-видимому, речь идет об игре на деньги. Но все же существуют и другие возможности. Далее следует: «Мой брат подошел к столу, и кости были брошены». Теперь ясно, о какой игре идет речь, хотя нигде в тексте точного указания на действительный смысл слова «игра» не был дан. Мы догадались о нем по совокупности тех внешних примет, которые даны в тексте в разных предложениях. Эти приметы следуют здесь одна за другой, но в письменном повествовании они могут значительно отстоять друг от друга. Человек может выбрать их из широкого языкового контекста, сопоставить их и затем уже сделать соответствующее умозаключение. Машина же лишена этой возможности.

Но, может быть, это не так важно? Действительно, при машинном переводе данных предложений на немецкий или французский языки особых трудностей не возникает (но трудности могут, конечно, возникнуть при переводе других предложений). При переводе на немецкий мы можем употребить буквализм: Ich spiele mit meinem Bruder. Точно так же и во французском мы можем начать: Je joue avec... При переводе же на английский возникают сложности грамматического порядка, потому что в приведенном тексте нет никаких указаний на то, какую форму должна выбрать машина: 1. I am playing with my brother, 2. I play with my brother, или 3. I ' ll play with my brother . И уж совсем плохо будет обстоять дело при переводе на испанский язык, так как машине придется выбирать по меньшей мере между тремя глаголами: jugar, tocar или trabajar.

Тут логический язык беспомощен.

Г. Машина фактически имеет дело с речью (или, точнее, с речевыми отрезками) - в ее письменной и устной форме. Каждая из этих форм речи имеет свою систему прагматических элементов, способных к тому же переходить в семантические (а правила такого перехода и не изучены и во многом произвольны). Так, например, устная речь обладает такой супрасегментной надстройкой, как интонация. Интонацию ныне представляется возможным классифицировать по функциональным типам, выделяя вопросительную, повествовательную и пр. интонации. Однако совершенно ясно, что интонация не существует в отрыве от предложений. Она, конечно, взаимодействует со смыслом, заключенным в них. В подтверждение этого достаточно сослаться на риторический вопрос, который является вопросом только по своей внешней структуре, но не по значению - он не требует ответа со стороны слушающих. Таковы новые трудности, с которыми логический язык не имеет возможности справиться.

Д. Но если даже удастся справиться с перечисленными языковыми трудностями, существуют еще препятствия собственно логического порядка - речь в данном случае идет о так называемых «правилах вывода решения» (decision rules ). Ведь если мы хотим быть уверенными, что машина будет действовать логически безукоризненно, мы должны снабдить ее набором правил, следуя которым она и сможет последовательно пройти путь от исходной информации к необходимым выводам. Применительно к логическим исчислениям высказываний мы располагаем такими правилами, но для более сложных логик таких правил нет, и, более того, есть основания полагать, что такие правила нельзя найти. Если же ориентироваться на правила, которые в нашем распоряжении уже имеются, то использование их сделает процесс разрешения настолько сложным (даже при применении усовершенствованных вычислительных машин), что игра не будет стоить свеч.

В таком виде рисуется проблема применения логических и математических методов в науке о языке на основании данных прикладной лингвистики. Каковы же выводы? Выводы уже формулировались выше - лингвистический анализ допускает сочетание индуктивных методов с дедуктивными, но когда мы говорим об использовании в лингвистике дедуктивных методов, не следует все сводить к слепому подчинению лингвистического исследования логико-математическим методам. Естественный язык восстает против такого насилия. И практика прикладной лингвистики подтверждает эти выводы, устанавливая, что между формализованным логическим языком и естественным языком существуют такие различия, что достаточно полный (в информативном плане) , перевод второго в первый невозможен. Значит ли это, что в лингвистике, и в частности в прикладной, следует отказаться от использования логико-математических методов? Конечно, нет. Но только не следует полагаться целиком на них, а сочетать их с другими. И чтобы не быть голословными, обратимся к свидетельству математиков и логиков, которым на практике приходится применять свои знания к исследованию естественного языка.

Вот что говорит математик: «Помощь математики в изучении естественного языка еще далека от очевидности... Прежде чем мы можем думать об использовании математики для исчисления, необходимо определить границы и функции лингвистических единиц... Это - внематемати-ческая задача, она является частью индуктивных методов в лингвистике.

Выяснилось, что математика не заменяет эмпирической методологии, хотя некоторые лингвисты и стремятся к этому. Наоборот, только после того, как единицы и отношения естественного языка будут установлены индуктивным методом и соответствующим образом подтверждены (верифицированы), будут созданы необходимые условия для реалистического применения математики к естественному языку. При этом математики либо обнаружат, что они имеют дело с новой манифестацией того, что по своей сущности уже знакомо им, либо получат стимул для математического мышления нового порядка» 26 .

А вот что говорит логик: «Перспективы автоматической обработки речевой информации очень хороши, но роль логики в этой области ограничена. Впрочем, как орудие лингвистического анализа, не как набор правил для выведения заключений, она дает реальные обещания» 27 . И далее он устанавливает, какая исследовательская стратегия при этом более предпочтительна: «Проблемы нужно решать не посредством непреклонного следования набору правил, установленных логиком, а скорее с помощью эвристической техники... Для автоматической обработки речевой информации предпочтителен эмпирический, индуктивный подход, при котором ищутся грубые правила для решения информационных проблем. Не следует пытаться переводить обычный язык на логический с целью дальнейшей его обработки, но скорее искать правила эвристического типа, которые позволят совладать с естественным языком. Необходимо прекратить поиски

26 P. Garvin and W. К а г u s h, Linguistics, Data Proces-
sing and Mathematics, «Natural language and the computer», N. Y.,
1963, pp. 368-369.
См . также в той же книге статью W. К а г u s h,
The use of mathematics in the behavioral sciences, pp. 64-83.

27 M. M a г о n, A Logician's View of Language-data Proces-
sing,
указанная книга , стр . 144.

абсолютной достоверности и обратиться к приближенным методам, которые с накоплением опыта будут уточнены и усовершенствованы. Мы предпочитаем рассматривать аппроксимации таким же образом, каким рассматривают теорию в науке, где видоизменения и усовершенствования производятся на основе данных, полученных в результате эксперимента» 28 .

Таковы общие выводы. Они говорят о том, что в совместной работе с логиками и математиками лингвистам принадлежит ведущая роль. В обязанность лингвистов входит подготовка языкового материала таким образом, чтобы сделать его доступным обработке логико-математическими методами. Именно в этом наЦравлении следует искать реалистического сочетания в лингвистике индуктивных методов с дедуктивными. А когда при решении задач прикладной лингвистики речь идет об эвристических гипотезах, то они в первую очередь должны исходить от лингвиста, так как он ближе к языку и по своей должности обязан лучше знать и понимать его.

С учетом изложенных соображений следует подходить к включенным в данный раздел статьям. Как уже указывалось, они взяты из сборника материалов симпозиума по прикладной математике «Структура языка и его математические аспекты» (симпозиум проходил в Нью-Йорке в апреле 1960 г., материалы симпозиума были опубликованы в 1961 г.).

В симпозиуме принимали участие математики, логики и лингвисты, то есть как раз представители тех наук, о совместной работе которых говорилось выше. Тема симпозиума, формулированная довольно свободно, давала его участникам возможность говорить как об очень частных и специальных вопросах, так и о достаточно общих, не связывая себя ни единым пониманием задач рассматриваемых вопросов, ни оценкой их удельного веса во всей проблеме в целом. Пожалуй, единственным объединяющим участников симпозиума теоретическим началом был тезис, приведенный Р. Якобсоном в «Предисловии» к материалам, в соответствии с которым лингвистику сле-

28 Там же, стр. 143-144.

дует рассматривать в качестве моста между математическими и гуманитарными дисциплинами. В остальном каждый автор сообщения выступал сообразно со своими индивидуальными интересами и в соответствии с направлением его исследовательской работы.

В связи с определенным лимитом листажа настоящего сборника не представилось возможным использовать все включенные в материалы симпозиума статьи. Пришлось произвести некоторый отбор работ, однако с таким расчетом, чтобы он давал советскому читателю возможность составить достаточно полное представление об общих тенденциях в изучении той проблемы, которая стоит в названии симпозиума. В своем информационном качестве все статьи настоящего раздела представляют бесспорный интерес и для теории языкознания и для исследовательской практики прикладной лингвистики.

В. Звегинцев

Ануфриева Анастасия, Ивлев Михаил, Мирошников Всеволод, Артюх Екатерина

Работа учащихся 5 класса. Исследовательский проект: "Математическая лингвистика". Групповая работа по предметам- математика и иностранный язык.

Скачать:

Предварительный просмотр:

Главное управление образования мэрии города Новосибирска

Дворец творчества детей и учащейся молодежи «Юниор»

Открытый городской конкурс исследовательских проектов

учащихся 5-8 классов

Направление: естественно-математический проект

Математическая лингвистика

Ивлев Михаил,

Мирошников Всеволод,

Артюх Екатерина

МБОУСОШ№26, 5 класс

Калининский район г. Новосибирска

Консультанты проекта: Ясюренко Майя Дмитриевна,

Учитель математики и информатики,

Севастьянова Татьяна Сергеевна,

учитель английского языка

I квалификационной категории.

Контактные телефоны руководителей:

8-952-924-02-66 (Ясюренко М.Д.)

8-913-896-81-77 (Севастьянова Т.С.)

г. Новосибирск 2013

Проект: «Математическая лингвистика»

Участники проекта: Ануфриева Анастасия, Ивлев Михаил, Мирошников Всеволод, Артюх Екатерина.

Консультанты проекта: Ясюренко Майя Дмитриевна, учитель математики и информатики. Севастьянова Татьяна Сергеевна, учитель английского языка I

квалификационной категории.

Класс: 5А

Название, номер учебного учреждения, где выполнялся проект: МБОУСОШ№26, Калининского района, города Новосибирска

Предметная область: математика, иностранный язык.

Время работы над проектом: ноябрь 2012г. - февраль 2013г.(долгосрочный)

Цель проекта: поиск точек соприкосновения математики и лингвистики.

Задачи:

  1. Познакомиться с историй развития математики и становления лингвистики.
  2. Найти отдельные примеры применения математики в лингвистике.
  3. Изучить перспективы применения математических методов в лингвистике. Сделать выводы.

Тип проекта (по виду деятельности): поисковый, исследовательский

Используемые технологии: мультимедия

Форма продукта проекта: «Математическая лингвистика» (мультимедийная презентация).

Исследование:

- отбор и изучение теоретического материала по данной теме;

- обработка полученной информации;

- определение перспектив применения математических методов в лингвистике.

Область применения результата проекта: учебная (математика, иностранный язык).

Введение…………………………………………………………………………..2

Глава 1. История применения математических методов в лингвистике

1.1. История математики………………………………………………………....3

1.2. Становление лингвистики…………………………………………………...4

1.3. Математическая лингвистика……………………………………………….8

Глава 2. Отдельные примеры использования математики в лингвистике

2.1. Изучение языка методами формальной логики…………………………11

2.2. Перспективы применения математических методов в лингвистике…...13

Заключение...……………………………………………………………………14

Литература………………………………………………………………………15

Введение.

В ХХ веке наметилась тенденция к взаимодействию и взаимопроникновению различных областей знаний. Постепенно стираются грани между отдельными науками; появляется всё больше отраслей умственной деятельности, находящихся «на стыке» гуманитарного, технического и естественнонаучного знания.

Другая очевидная особенность современности – стремление к изучению структур и составляющих их элементов. Поэтому всё большее место как в научной теории, так и на практике уделяется математике. Математика всё глубже проникает в те сферы, которые на протяжении долгого времени было принято считать чисто «гуманитарными», расширяя их эвристический потенциал (ответ на вопрос «сколько» часто помогает ответить и на вопросы «что» и «как). Исключением не стало и языкознание.

Цель нашей работы – кратко осветить связь математики с такой отраслью языкознания, как лингвистика. Первоначально математические методы в лингвистике стали использоваться для того, чтобы уточнить основные понятия языкознания, однако с развитием компьютерной техники подобная теоретическая посылка стала находить применение на практике. Разрешение таких задач, как машинный перевод, машинный поиск информации, автоматическая обработка текста требовало принципиально нового подхода к языку. Перед лингвистами назрел вопрос: как научиться представлять языковые закономерности в том виде, в котором их можно подавать непосредственно на технику. Популярным в наше время термином «математическая лингвистика» называют любые лингвистические исследования, в которых применяются точные методы (а понятие точных методов в науке всегда тесно связано с математикой). В лингвистике используются как количественные (алгебраические), так и неколичественные методы, что сближает её с математической логикой, а, следовательно, и с философией, и даже с психологией. Немецкий философ, лингвист Фридрих Шлегель отмечал взаимодействие языка и сознания, а видный лингвист начала ХХ века Фердинанд де Соссюр связывал структуру языка с его принадлежностью к народу. Взаимодействие математики и языкознания – тема многогранная, и в нашей работе мы остановимся не на всех, а, в первую очередь, на её прикладных аспектах.

Глава 1. История применения математических методов в лингвистике.

1.1. История математики.

В истории математики традиционно выделяются несколько этапов развития математических знаний:

  1. Формирование понятия геометрической фигуры и числа как идеализации реальных объектов и множеств однородных объектов. Появление счёта и измерения, которые позволили сравнивать различные числа, длины, площади и объёмы.
  2. Изобретение арифметических операций. Накопление эмпирическим путём (методом проб и ошибок) знаний о свойствах арифметических действий, о способах измерения площадей и объёмов простых фигур и тел. В этом направлении далеко продвинулись шумеро вавилонские , китайские и индийские математики древности.
  3. Появление в древней Греции дедуктивной математической системы, показавшей, как получать новые математические истины на основе уже имеющихся. Венцом достижений древнегреческой математики стали «Начала» Евклида , игравшие роль стандарта математической строгости в течение двух тысячелетий.
  4. Математики стран ислама не только сохранили античные достижения, но и смогли осуществить их синтез с открытиями индийских математиков, которые в теории чисел продвинулись дальше греков.
  5. В XVI-XVIII веках возрождается и уходит далеко вперёд европейская математика. Её концептуальной основой в этот период являлась уверенность в том, что математические модели являются своего рода идеальным скелетом Вселенной, и поэтому открытие математических истин является одновременно открытием новых свойств реального мира. Главным успехом на этом пути стала разработка математических моделей зависимости переменных величин (функция ) и общая теория движения (анализ бесконечно малых ). Все естественные науки были перестроены на базе новооткрытых математических моделей, и это привело к колоссальному их прогрессу .
  6. В XIX-XX веках становится понятно, что взаимоотношение математики и реальности далеко не столь просто, как ранее казалось. Не существует общепризнанного ответа на своего рода «основной вопрос философии математики»: найти причину «непостижимой эффективности математики в естественных науках». В этом, и не только в этом, отношении математики разделились на множество дискутирующих школ. Наметилось несколько опасных тенденций: чрезмерно узкая специализация, изоляция от практических задач и др. В то же время мощь математики и её престиж, поддержанный эффективностью применения, высоки как никогда прежде.

Помимо большого исторического интереса, анализ эволюции математики представляет огромную важность для развития философии и методологии математики. Нередко знание истории способствует и прогрессу конкретных математических дисциплин; например, древняя китайская задача (теорема) об остатках сформировала целый раздел теории чисел .

Обоснование математики

К началу XIX века относительно строгое логическое (дедуктивное) обоснование имела только евклидова геометрия, хотя строгость её уже тогда справедливо считалась недостаточной. Свойства новых объектов (например, комплексных чисел , бесконечно малых и т. д.) попросту считались в целом такими же, как у объектов уже известных; если же такая экстраполяция была невозможна, свойства подбирались опытным путём.

Огюстен Луи Коши

Построение фундамента математики началось с анализа. В 1821 году Коши опубликовал «Алгебраический анализ», где чётко определил основные понятия на основе концепции предела. Всё же он сделал ряд ошибок, например, почленно интегрировал и дифференцировал ряды, не доказывая допустимость таких операций. Завершил фундамент анализа Вейерштрасс , который выяснил роль важного понятия равномерной непрерывности . Одновременно Вейерштрасс (1860-е годы) и Дедекинд (1870-е) дали обоснование теории вещественных чисел .


Подписи к слайдам:

Математическая лингвистика Авторы: Ануфриева Анастасия, Ивлев Михаил, Мирошников Всеволод, Артюх Екатерина МБОУСОШ№26, 5 класс Калининский район г. Новосибирска Консультанты проекта: Ясюренко Майя Дмитриевна, учитель математики и информатики, Севастьянова Татьяна Сергеевна, учитель английского языка I квалификационной категории.

Цель проекта: поиск точек соприкосновения математики и лингвистики.

Задачи проекта: Познакомиться с историй развития математики и становления лингвистики. Найти отдельные примеры применения математики в лингвистике. Изучить перспективы применения математических методов в лингвистике. Сделать выводы.

В ХХ веке наметилась тенденция к взаимодействию и взаимопроникновению различных областей знаний. Постепенно стираются грани между отдельными науками; появляется всё больше отраслей умственной деятельности, находящихся «на стыке» гуманитарного, технического и естественнонаучного знания.

Этапы развития математических знаний: Формирование понятия геометрической фигуры и числа как идеализации реальных объектов и множеств однородных объектов. Появление счёта и измерения, которые позволили сравнивать различные числа, длины, площади и объёмы.

Изобретение арифметических операций. Появление в древней Греции дедуктивной математической системы. Математики стран ислама не только сохранили античные достижения, но и смогли осуществить их синтез с открытиями индийских математиков, которые в теории чисел продвинулись дальше греков.

В XVI-XVIII веках возрождается и уходит далеко вперёд европейская математика. В XIX-XX веках становится понятно, что взаимоотношение математики и реальности далеко не столь просто, как ранее казалось.

Огюстен Луи Коши

История языкознания в своём развитии прошла 5 периодов. 1 период – 5-4 вв. до н.э. – XVI вв. 2 период – XVII-XVIII вв. 3 период – конец XVIII-первая половина XIX вв. 4 период – период системного изучения языка – конец XIX – первая треть XX вв. 5 период – 30-е годы XX в. по настоящее время.

Математическая лингвистика: Изучает особенности семиотического и математического моделирования естественного языка (и речи) с целью перевода информации, содержащейся в неформализованном виде в тексте, на формализованный искусственный язык (например, на некоторый информационный язык) на основе такого математического аппарата, как теория множеств и алгебра отношений, теория нечетких множеств и лингвистической переменной, теория вероятностей и математическая статистика, а так же элементов теории информации. Тесно связана с инженерной лингвистикой. Отрасль языкознания, занимающаяся изучением возможностей применения математических методов к исследованию и описанию языка.

Метаязык – это язык, используемый для выражения суждений о другом языке, языке-объекте. С помощью метаязыка изучают структуру знакосочетаний (выражений) языка-объекта, доказывают теоремы о его выразительных свойствах, об отношении его к другим языкам и т. п.

Лингвистика в современном мире стала фундаментом для развития информационных технологий. Пока информатика остаётся бурно развивающейся отраслью человеческой деятельности, союз математики и лингвистики продолжит играть свою роль в развитии науки.

Математическое описание языка основано на представлении о языке как о механизме, восходящем к известному швейцарскому лингвисту начала ХХ века Фердинанду де Соссюру.

Начальное звено его концепции - теория языка как системы, cостоящей из трёх частей (собственно язык - langue , речь - parole , и речевую деятельность - langage ), в которой каждое слово (член системы) рассматривается не само по себе, а в связи с другими членами. Как впоследствии отметил другой видный лингвист, датчанин Луи Ельмслев, Соссюр «первый требовал структурного подхода к языку, то есть научного описания языка путём регистрации соотношений между единицами» .

Понимая язык как иерархическую структуру, Соссюр первым поставил проблему ценности, значимости языковых единиц. Отдельные явления и события (скажем, история происхождения отдельных индоевропейских слов) должны изучаться не сами по себе, а в системе, в которой они соотнесены с подобными же составляющими.

Структурной единицей языка Соссюр считал слово, «знак», в котором соединялись звучание и смысл. Ни один из этих элементов не существует друг без друга: поэтому носителю языка понятны различные оттенки значения многозначного слова как отдельного элемента в структурном целом, в языке.

Таким образом, в теории Ф. де Соссюра можно увидеть взаимодействие лингвистики, с одной стороны, с социологией и социальной психологией (следует отметить, что в это же время развиваются феноменология Гуссерля, психоанализ Фрейда, теория относительности Эйнштейна, происходят эксперименты над формой и содержанием в литературе, музыке и изобразительном искусстве), с другой стороны - с математикой (понятие системности соответствует алгебраической концепции языка). Подобная концепция изменила понятие языковой интерпретации как таковой: Явления стали трактоваться не относительно причин их возникновения, а относительно настоящего и будущего. Толкование перестало быть независимым от намерений человека (несмотря на то, что намерения могут быть безличными, «бессознательными» во фрейдистском понимании этого слова).

Функционирование же языкового механизма проявляется через речевую деятельность носителей языка. Результатом речи являются так называемые «правильные тексты» - последовательности речевых единиц, подчиняющиеся определённым закономерностям, многие из которых допускают математическое описание. Изучением способов математического описания правильных текстов (в первую очередь, предложений) занимается теория способов описания синтаксической структуры. В подобной структуре языковые аналогии определены не с помощью изначально присущих им качеств, а с помощью системных («структурных») отношений.

На Западе соссюровские идеи развивают младшие современники великого швейцарского лингвиста: в Дании - уже упомянутый мною Л. Ельмслев, давший начало алгебраической теории языка в своём труде «Основы лингвистической теории», в США - Э. Сепир, Л. Блумфилд, Ц. Харрис, в Чехии - русский учёный-эмигрант Н. Трубецкой.

Статистическими же закономерностями в изучении языка стал заниматься не кто иной, как основоположник генетики Георг Мендель. Только в 1968 году филологи обнаружили, что, оказывается, в последние годы жизни он был увлечен изучением лингвистических явлений с помощью методов математики. Этот метод Мендель привнёс в лингвистику из биологии; в девяностые годы девятнадцатого века лишь самые смелые лингвисты и биологи заявляли о целесообразности подобного анализа. В архиве монастыря св. Томаша в г. Брно, аббатом которого был Мендель, были найдены листки со столбцами фамилий, оканчивающимися на «mann», «bauer», «mayer», и с какими-то дробями и вычислениями. Стремясь обнаружить формальные законы происхождения фамильных имен, Мендель производит сложные подсчеты, в которых учитывает количество гласных и согласных в немецком языке, общее число рассматриваемых им слов, количество фамилий и т.д.

В нашей стране структурная лингвистика начала развиваться примерно в то же время, что и на Западе - на рубеже XIX-XX веков. Одновременно с Ф. де Соссюром понятие языка как системы разрабатывали в своих трудах профессора Казанского университета Ф.Ф. Фортунатов и И.А. Бодуэн де Куртенэ. Последний на протяжении долгого времени переписывался с де Соссюром, соответственно, женевская и казанская школы языкознания сотрудничали друг с другом. Если Соссюра можно назвать идеологом «точных» методов в лингвистике, то Бодуэн де Куртенэ заложил практические основы их применения. Он первым отделил лингвистику (как точную науку, использующую статистические методы и функциональную зависимость) от филологии (общности гуманитарных дисциплин, изучающих духовную культуру через язык и речь). Сам учёный считал, что «языкознание может принести пользу в ближайшем будущем, лишь освободившись от обязательного союза с филологией и историей литературы» . «Испытательным полигоном» для внедрения математических методов в лингвистику стала фонология - звуки как «атомы» языковой системы, обладающие ограниченным количеством легко измеримых свойств, были самым удобным материалом для формальных, строгих методов описания. Фонология отрицает наличие смысла у звука, так что в исследованиях устранялся «человеческий» фактор. В этом смысле фонемы подобны физическим или биологическим объектам.

Фонемы, как самые мелкие языковые элементы, приемлемые для восприятия, представляют собой отдельную сферу, отдельную «феноменологическую реальность». Например, в английском языке звук «т» может произноситься по-разному, но во всех случаях человек, владеющий английским, будет воспринимать его как «т». Главное, что фонема будет выполнять свою главную - смыслоразличительную - функцию. Более того - различия между языками таковы, что разновидности одного звука в одном языке могут соответствовать разным фонемам в другом; например «л» и «р» в английском различны, в то время как в других языках это разновидности одной фонемы (подобно английскому «т», произнесённому с придыханием или без). Обширный словарный запас любого естественного языка представляет собой набор сочетаний гораздо меньшего количества фонем. В английском, например, для произнесения и написания около миллиона слов используется всего 40 фонем.

Звуки языка представляют собой системно организованный набор черт. В 1920е -1930е, вслед за Соссюром, Якобсон и Н.С.Трубецкой выделили «отличительные черты» фонем. Эти черты основаны на строении органов речи - языка, зубов, голосовых связок. Скажем, в английском разница между «т» и «д» заключается в наличии или отсутствии «голоса» (напряжении голосовых связок) и в уровне голоса, отличающем одну фонему от другой. Таким образом, фонологию можно считать примером общего языкового правила, описанного Соссюром: «В языке есть только различия» . Более важно даже не это: различие обычно подразумевает точные условия, между которыми оно и находится; но в языке существуют только различия без точных условий. Рассматриваем ли мы «обозначение» или «обозначаемое» - в языке не существует ни понятий, ни звуков, которые существовали бы до того, как развилась языковая система.

Таким образом, в соссюровском языкознании изучаемый феномен понимается как свод сопоставлений и противопоставлений языка. Язык - это и выражение значения слов, и средство общения, причём эти две функции никогда не совпадают. Мы можем заметить чередование формы и содержания: языковые контрасты определяют его структурные единицы, и эти единицы взаимодействуют, чтобы создать определённое значимое содержание. Так как элементы языка случайны, ни контраст, ни сочетание не могут быть основой. Значит, в языке отличительные признаки формируют фонетический контраст на другом уровне понимания, фонемы соединяются в морфемы, морфемы - в слова, слова - в предложения и т.д. В любом случае, целая фонема, слово, предложение и т.д. представляет собой нечто большее, чем просто сумма составляющих.

Соссюр предложил идею новой науки двадцатого века, отдельно от лингвистики изучающей роль знаков в обществе. Соссюр назвал эту науку семиологией (от греческого «semeion» - знак). «Наука» семиотики, развивавшаяся в Восточной Европе в 1920е -1930е и в Париже в 1950е - 1960е, расширила изучение языка и лингвистических структур до литературных находок, составленных (или сформулированных) с помощью этих структур. Кроме того, на закате своей карьеры, параллельно совему курсу общей лингвистики, Соссюр занялся «семиотическим» анализом поздней римской поэзии, пытаясь открыть умышленно составленные анаграммы имён собственных. Этот метод был во многом противоположен рационализму в его лингвистическом анализе: он был попыткой, изучить в системе проблему «вероятности» в языке. Такое исследование помогает сосредоточиться на «вещественной стороне» вероятности; «ключевое слово», анаграмму которого ищет Соссюр, как утверждает Жан Старобинский, «инструмент для поэта, а не источник жизни стихотворения». Стихотворение служит для того, чтобы поменять местами звуки ключевого слова. По словам Старобинского, в этом анализе «Соссюр не углубляется в поиски скрытых смыслов». Напротив, в его работах заметно желание избежать вопросов, связанных с сознанием: «так как поэзия выражается не только в словах, но и в том, что порождают эти слова, она выходит из-под контроля сознания и зависит только от законов языка» (cм. Приложение 1).

Попытка Соссюра изучить имена собственные в поздней римской поэзии подчёркивает одну из составляющих его лингвистического анализа - произвольную природу знаков, а также формальную сущность соссюровской лингвистики, что исключает возможность анализа смысла. Тодоров делает вывод, что в наши дни труды Соссюра выглядят на редкость последовательными в нежелании изучать символы явления, имеющие чётко определённое значение [Приложение 1]. Исследуя анаграммы, Соссюр обращает внимание только на повторение, но не на предшествующие варианты. . . . Изучая «Песнь о Нибелунгах», он определяет символы только для того, чтобы присвоить их ошибочным чтениям: если они неумышленны, символов не существует. В конце концов, в своих трудах по общей лингвистике он делает предположение о существовании семиологии, описывающей не только лингвистические знаки; но это предположение ограничивается тем, что семиoлогия может описывать только случайные, произвольные знаки.

Раз это действительно так, то только потому, что не мог представить «намерение» без предмета; он не мог до конца преодолеть пропасть между формой и содержанием - в его трудах это превращалось в вопрос. Вместо этого он обращался к «языковой законности». Находясь между, с одной стороны, концепциями девятнадцатого века, основанными на истории и субъективных догадках, и методах случайной интерпретации, основанных на этих концепциях, и, с другой стороны, структуралистскими концепциями, стирающими противостояние между формой и содержанием (субъектом и объектом), значением и происхождением в структурализме, психоанализе и даже квантовой механике - труды Фердинанда де Соссюра по лингвистике и семиотике обозначают поворотный момент в изучении значений в языке и культуре.

Русские учёные были представлены и на Первом международном конгрессе лингвистов в Гааге в 1928 году. С. Карцевский, Р. Якобсон и Н. Трубецкой выступили с докладом, в котором рассматривалась иерархическая структура языка - в духе самых современных для начала прошлого века представлений. Якобсон в своих трудах развивал идеи Соссюра о том, что базовые элементы языка должны изучаться, в первую очередь, в связи со своими функциями, а не с причинами их возникновения.

К сожалению, после прихода в 1924 году к власти Сталина отечественное языкознание, как и многие другие науки, отбрасывает назад. Многие талантливые учёные вынуждены были эмигрировать, были высланы из страны или погибли в лагерях. Только с середины 1950-х годов стал возможен некоторый плюрализм теорий - об этом в разделе 1.2.

История применения математических методов в лингвистикеЛЕКЦИЯ № 1

план

Становление
структурной лингвистики
на рубеже XIX – ХХ веков.
Применение математических методов
в лингвистике во второй половине ХХ
века.
Перспективы
применения
математических методов в
лингвистике.

Фердинанд де Соссюр (1857-1913) язык как система

собственно язык langue
речь - parole
речевую деятельность
- langage

И.А. Бодуэн де Куртенэ (1845 - 1929)

«Звуки - «атомы» языковой
системы, обладающие
ограниченным количеством
легко измеримых свойств.
Это самый удобный
материал для формальных,
строгих методов
описания.»

Структурная лингвистика –

это совокупность воззрений на язык и
методов его исследования, в основе
которых лежит понимание языка как
знаковой системы с четко выделимыми
структурными элементами (единицами
языка, их классами и пр.) и стремление к
строгому (приближающемуся к точным
наукам) формальному описанию языка.

Ленинградская
фонологическая школа
(Л.В. Щерба) использовала в качестве
основного критерия обобщения звука в
виде фонемы психолингвистический
эксперимент, основанный на анализе
речи носителей языка.
Пражский лингвистический кружок
(Н.С. Трубецкой) разработал теорию
оппозиций – семантическая структура
языка была описана ими как набор
оппозитивно постороенных
семантических единиц – сем.

Применение математических методов в лингвистике во второй половине ХХ века

Американский
дескриптивизм
(Л. Блумфилд и Э. Сепир). Язык
представлялся дескриптивистам в виде
совокупности речевых высказываний.
Формальная грамматика Н. Хомского.
Московская
фонологическая школа,
представителями которой были А.А.
Реформатский, В.Н. Сидоров, П.С.
Кузнецов, А.М. Сухотин, Р.И. Аванесов.

системы машинного перевода

Алгоритм
последовательного перевода
«слово за словом», «фраза за фразой.»
Т-системы (от английского слова «transfer»
- преобразование), в которых перевод
осуществлялся на уровне синтаксических
структур.
И-системы (от слова «интерлингва») получение смыслового представления
входного предложения путём его
семантического анализа и синтеза
входного предложения по полученному
смысловому представлению.

10. Пракладная лингвистика

изучает
не язык в его состоянии (т.е.
системе), а язык в действии (т.е. в
общении);
решает конкретную прикладную задачу,
создавая языковые модели, и при этом не
претендует на объяснение фактов языка
(как теоретическая лингвистика);
ориентирована на конкретные подъязыки
(т.е. на выборочные знания о языке), а не
на весь язык в целом.

11. квантитативная лингвистика

- междисциплинарное направление в
прикладных исследованиях, в котором в
качестве основного инструмента изучения
языка и речи используются
количественные или статистические
методы анализа.

12. компьютерная лингвистика

– разработка методов, технологий и
конкретных систем, обеспечивающих
общение человека с ЭВМ на естественном
или ограниченном естественном языке.

13. компьютерная лингвистика

создание систем обработки естественного
языка (например, систем обработки связного
текста);
разработка информационно-поисковых систем
(документальных, т.е. в которых хранятся
тексты, и фактографических, т.е. в которых
хранятся факты, представленные не только в
текстовой форме, то и в форме таблиц,
формул и т.п.);
создание гипертекстовых систем (т.е.
множества текстов со связывающими их
отношениями);
разработка компьютерных технологий
составления и эксплуатации словарей.

14. Спасибо за внимание!

15. Доклады:

Законы
природы и «гуманитарные» законы.
Математическая революция в лингвистике.
Копенгагенская школа структурной
лингвистики.
Становление прикладной лингвистики как
научной дисциплины.

16. Практическое занятие:

Описание истории применения математических
методов в лингвистике от античности до наших
дней.
Проявление тенденций интеграции
математических, лингвистических и др. знаний в
истории развития науки о языке.
Сопоставительная характеристика прикладной и
теоретической лингвистики (заполните таблицу
Сравнительная характеристика прикладной и
теоретической лингвистики).
Корпусная лингвистика как раздел прикладной
лингвистики.
Прикладные аспекты квантитативной лингвистики.
Компьютерная лингвистика и ее инструментарий.