В качестве базы для формального описания языков принята теория формальных грамматик Хомского.
Словарь (алфавит) (V)
– конечное непустое множество символов (элементов). Элементы – буквы, слова, образы, математические знаки и др.
Цепочка w
– конечная последовательность символов. Цепочки образуются с помощью конкатенаций (объединений). |w|
- длина цепочки.
Язык – множество всех цепочек в словаре w
, задающееся грамматикой.
Формальная грамматика – система правил, порождающая все цепочки языка и только их. Виды:
Грамматика G = (T, N, P, S)
, где
«φ → ψ» означает «заменить на». w’ считается выводимой из w если w=α1φα2; w’=α1ψα2
Длина вывода – число применений правил вывода.
Вывод цепочки пси называется законченным, если не существуют никакой другой, выводимой из неё.
Морфема – элементарная единица слова.
Нетерминальные символы – названия классов слов или словосочетаний.
Пример
Пусть множество T = {несёт, тащит, торт, контейнер, портфель, человек, весёлый, грустный, странный}
N = {С (существительное), П (подлежащее), О (определение), Д (дополнение), ГС (группа сказуемого), ГП (группа подлежащего), ПР (предложение)}
ПР = (ГП)(ГС)
ГП = (О)(П)
ГС = (С)(Д)
О = (…)
П = (человек, ребёнок)
С = (…)
Д = (торт, контейнер, портфель)
Можно представить в виде дерева:
Оно удовлетворяет следующим условиям:
Маркер структуры составляющих (s-маркер) – структурное дерево.
В теории формальных грамматик приняты различные системы классификации, связанные с ограничениями на систему правил:
φ = φ1 А φ2
ψ = φ1 ω φ2
A → aB; A → b; a,b ∈ T; A,B ∈ N
Неукорачивающая грамматика — грамматика, для любого правила которой длина исходной цепочки не превосходит длину порождённой:
φ → ψ: |φ| ≤ |ψ|
В качестве базы для формального описания языков принята теория формальных грамматик Хомского.
Словарь (алфавит) (V)
– конечное непустое множество символов (элементов). Элементы – буквы, слова, образы, математические знаки и др.
Цепочка w
– конечная последовательность символов. Цепочки образуются с помощью конкатенаций (объединений). |w|
- длина цепочки.
Язык – множество всех цепочек в словаре w
, задающееся грамматикой.
Формальная грамматика – система правил, порождающая все цепочки языка и только их. Виды:
Грамматика G = (T, N, P, S)
, где
«φ → ψ» означает «заменить на». w’ считается выводимой из w если w=α1φα2; w’=α1ψα2
Длина вывода – число применений правил вывода.
Вывод цепочки пси называется законченным, если не существуют никакой другой, выводимой из неё.
Морфема – элементарная единица слова.
Нетерминальные символы – названия классов слов или словосочетаний.
Пример
Пусть множество T = {несёт, тащит, торт, контейнер, портфель, человек, весёлый, грустный, странный}
N = {С (существительное), П (подлежащее), О (определение), Д (дополнение), ГС (группа сказуемого), ГП (группа подлежащего), ПР (предложение)}
ПР = (ГП)(ГС)
ГП = (О)(П)
ГС = (С)(Д)
О = (…)
П = (человек, ребёнок)
С = (…)
Д = (торт, контейнер, портфель)
Можно представить в виде дерева:
Оно удовлетворяет следующим условиям:
Маркер структуры составляющих (s-маркер) – структурное дерево.
В теории формальных грамматик приняты различные системы классификации, связанные с ограничениями на систему правил:
φ = φ1 А φ2
ψ = φ1 ω φ2
A → aB; A → b; a,b ∈ T; A,B ∈ N
Неукорачивающая грамматика — грамматика, для любого правила которой длина исходной цепочки не превосходит длину порождённой:
φ → ψ: |φ| ≤ |ψ|