Математическая лингвистика

Математи́ческая лингви́стика

Математическая дисциплина, разрабатывающая формальный аппарат для описания строения естественных и некоторых искусственных языков. Возникла в 50-х годах 20 века в связи с назревшей в языкознании потребностью уточнения его основных понятий. В М. л. используются по преимуществу идеи и методы алгебры, алгоритмов теории (См. Алгоритмов теория) и автоматов теории (См. Автоматов теория). Не являясь частью лингвистики, М. л. развивается в тесном взаимодействии с ней. М. л. называют иногда лингвистические исследования, в которых применяется какой-либо математический аппарат.

Математическое описание языка основано на восходящем к Ф. де Соссюру представлении о языке как механизме, функционирование которого проявляется в речевой деятельности его носителей; её результатом являются «правильные тексты» — последовательности речевых единиц, подчиняющиеся определённым закономерностям, многие из которых допускают математическое описание. Изучение способов математического описания правильных текстов (в первую очередь предложений) составляет содержание одного из разделов М. л. — теории способов описания синтаксической структуры. Для описания строения (синтаксической структуры) предложения можно либо выделить в нём «составляющие» — группы слов, функционирующие как цельные синтаксические единицы, либо указать для каждого сло́ва те слова́, которые от него непосредственно зависят (если такие есть). Так, в предложении «Лошади кушают овёс» при описании по 1-му способу составляющими будут: всё предложение I, каждое отдельное слово и словосочетание С = «кушают овёс» (рис. 1; стрелки означают «непосредственное вложение»); описание по 2-му способу даёт схему, показанную на рисунке 2. Математические объекты, возникающие при таком описании структуры предложения, называются деревом составляющих (1-й способ) и деревом синтаксического подчинения (2-й способ).

Другой раздел М. л., занимающий в ней центр, место, — теория формальных грамматик, возникшая главным образом благодаря работам Н. Хомского (См. Хомский). Она изучает способы описания закономерностей, которые характеризуют уже не отдельный текст, а всю совокупность правильных текстов того или иного языка. Эти закономерности описываются путём построения «формальной грамматики» — абстрактного «механизма», позволяющего с помощью единообразной процедуры получать правильные тексты данного языка вместе с описаниями их структуры. Наиболее широко используемый тип формальной грамматики — так называемая порождающая грамматика, или грамматика Хомского, — упорядоченная система Γ = I, R>, где: V и W — непересекающиеся конечные множества; I — элемент W; R — конечное множество правил вида φ→ψ, где φ и ψ — цепочки (конечные последовательности) элементов V и W. Если φ→ψ правило грамматики Γ и ω 1, ω 2, — цепочки из элементов V и W, то говорят, что цепочка ω 1ψω 2 непосредственно выводима в Γ из ω 1φω 2. Если ξ0, ξ1, …, ξn — цепочки и для каждого i= 1, ..., n цепочка ξi, непосредственно выводима из ξi-1, то говорят, что ξn выводима из ξ0 в Γ. Множество цепочек из элементов V, выводимых в Γ из I, называется языком, порождаемым грамматикой Γ. Если все правила грамматики Γ имеют вид A→ψ, где А — элемент W, Γ называется бесконтекстной, или контекстно-свободной. В лингвистической интерпретации элементы V чаще всего представляют собой слова, элементы W — символы грамматических категорий, I — символ категории «предложение». В бесконтекстной грамматике вывод предложения даёт для него дерево составляющих, в котором каждая составляющая состоит из слов, «происходящих» от одного элемента W, так что для каждой составляющей указывается её грамматическая категория. Так, если грамматика имеет в числе прочих правила I → Sx, у, им Vy, Vy → VtySx, y’ вин, Sмyж, ед, вин → овёс, Sжен, мн, им → лошади, Vtмн → кушают, где Vy означает категорию «группа глагола в числе у», Vty — «переходный глагол в числе y», Sx,y,z — «существительное рода х в числе у и падеже z», то приведённое выше предложение имеет вывод, показанный на рис. 3, где стрелки идут из левых частей применяемых правил к элементам соответствующих правых частей. Формальные грамматики используются для описания не только естественных, но и искусственных языков, в особенности языков программирования.

М. л. изучает также аналитические модели языка, в которых на основе тех или иных данных о речи, считающихся известными (например, множества правильных предложений), производятся формальные построения, дающие некоторые сведения о структуре языка. Приложение методов М. л. к конкретным языкам относится к области лингвистики (см. Языкознание).

Лит.: Хомский Н., Синтаксические структуры, в сборнике: Новое в лингвистике, в. 2, М., 1962; Гладкий А. В.. Мельчук И. А., Элементы математической лингвистики, М., 1969; Маркус С., Теоретико-множественные модели языков, перевод с английского, М., 1970; Гладкий А. В., Формальные грамматики и языки, М., 1973.

А. В. Гладкий.

Математическая лингвистика

Рис. 1 к ст. Математическая лингвистика.

Математическая лингвистика. Рис. 2

Рис. 2 к ст. Математическая лингвистика.

Математическая лингвистика. Рис. 3

Рис. 3 к ст. Математическая лингвистика.

Источник: Большая советская энциклопедия на Gufo.me


Значения в других словарях

  1. Математическая Лингвистика — Математическая дисциплина, предметом к-рой является разработка и изучение понятий, образующих основу формального аппарата для описания строения естественных языков (т. е. метаязыка лингвистики). Возникновение М. л. можно отнести приблизительно к 50-м гг. Математическая энциклопедия
  2. МАТЕМАТИЧЕСКАЯ ЛИНГВИСТИКА — МАТЕМАТИЧЕСКАЯ ЛИНГВИСТИКА — математическая дисциплина, предметом которой является разработка формального аппарата для описания строения естественных и некоторых искусственных языков. Большой энциклопедический словарь
  3. математическая лингвистика — 1. Изучает особенности семиотического и математического моделирования естественного языка (и речи) с целью перевода информации, содержащейся в неформализованном виде в тексте, на формализованный искусственный язык (например... Толковый переводоведческий словарь
  4. математическая лингвистика — Направление, возникшее в XX в. на стыке языкознания, математики и математической логики и занимающееся разработкой формального аппарата описания языка, применяемого в частности, в диалоге "человек – ЭВМ". Словарь лингвистических терминов Жеребило
  5. математическая лингвистика — Отрасль языкознания, занимающаяся изучением возможностей применения математических методов к изучений и описанию языка. Словарь лингвистических терминов Розенталя