Merge pull request #10 from JetBrains-Research/dev

kajigor · web-flow · commit 9854672f1f28 · 2021-07-29T23:18:40.000+03:00
Сократил заголовки для 9.1 и 7
diff --git a/tex/Matrix-based_CFPQ.tex b/tex/Matrix-based_CFPQ.tex
@@ -1,9 +1,12 @@
-\chapter{КС и конъюнктивная достижимость через произведение матриц}\label{chpt:MatrixBasedAlgos}
+\chapter[Контекстно-свободная достижимость через произведение матриц]{Контекстно-свободная достижимость через произведение матриц}\label{chpt:MatrixBasedAlgos}
+\chaptermark{КС достижимость через произведение матриц}
 
-В данном разделе мы рассмотрим алгоритм решения задачи контекстно-свободной и конъюнктивной достижимости, основанный на произведении матриц. Будет показано, что при использовании конъюнктивных граммтик, представленный алгоритм находит переапроксимацию истинного решения задачи.
+В данном разделе мы рассмотрим алгоритм решения задачи контекстно-свободной достижимости, основанный на произведении матриц. Будет показано, что при использовании конъюнктивных граммтик, представленный алгоритм находит переапроксимацию истинного решения задачи.
 
-\section{КС достижимость через произведение матриц}
+\section[Алгоритм контекстно-свободной достижимости через произведение матриц]{Алгоритм контекстно-свободной достижимости через произведение матриц\sectionmark{Алгоритм КС достижимости через произведение матриц}}
+\sectionmark{Алгоритм КС достижимости через произведение матриц}
 \label{Matrix-CFPQ}
+
 В главе~\ref{graph:CYK}~был изложен алгоритм для решения задачи КС достижимости на основе CYK. Заметим, что обход матрицы напоминает умножение матриц в ячейках которых множества нетерминалов:
 
 \begin{align*}
diff --git a/tex/SPPF.tex b/tex/SPPF.tex
@@ -1,27 +1,28 @@
 \chapter{Сжатое представление леса разбора}
 
 Матричный алгоритм даёт нам ответ на вопрос о достижимости, но не предоставляет самих путей.
-Что делать, если мы хотим построить все пути, удовлетворяющие ограичениям?
+Что делать, если мы хотим построить все пути, удовлетворяющие ограничениям?
 
 Проблема в том, что искомое множество путей может быть бесконечным.
 Можем ли мы предложить конечную структуру, однозначно описывающую такое множество?
 Вспомним, что пересечение контекстно-свободного языка с регулярным --- это контекстно-свободный язык.
-Мы знаем, что конекстно-свободный язык можно описать коньекстно-своюодной граммтикой, которая конечна.
+Мы знаем, что контекстно-свободный язык можно описать контекстно-свободной грамматикой, которая конечна.
 Это и есть решение нашего вопроса.
-Осталось толко научиться строить такую грамматику.
+Осталось только научиться строить такую грамматику.
 
 Прежде, чем двинуться дальше, рекомендуется вспомнить всё, что касается деревьев вывода~\ref{sect:DerivTree}.
 
-\section{Лес разбора как представление контекстно-свободной грамматики}
+\section[Лес разбора как представление контекстно-свободной грамматики]{Лес разбора как представление контекстно-свободной грамматики\sectionmark{Лес разбора как представление КС грамматики}}
+\sectionmark{Лес разбора как представление КС грамматики}
 
 Для начала нам потребуется внести некоторые изменения в конструкцию дерева вывода.
 
-Во-первых, заметим, что в дереве вывода каждый узел соответсвует выводу какой-то подстроки с известными позициями начала и конца.
+Во-первых, заметим, что в дереве вывода каждый узел соответствует выводу какой-то подстроки с известными позициями начала и конца.
 Давайте будем сохранять эту информацию в узлах дерева.
 Таким образом, метка любого узла это тройка вида $(i,q,j)$, где $i$ --- координата начала подстроки, соответствующей этому узлу, $j$ --- координата конца, $q \in \Sigma \cup N$ --- метка как в исходном определении.
 
-Во-вторых, заметим, что внутренний узел со своими сыновьями связаны с продукцией в граммтике: узел появляется благодаря применению конкретной продукции в процессе вывода.
-Давайте занумеруем все продукции в граммтике и добавим в дерево вывода ещё один тип узлов (дополнительные узлы), в которых будем хранить номер применённой продукции.
+Во-вторых, заметим, что внутренний узел со своими сыновьями связаны с продукцией в грамматике: узел появляется благодаря применению конкретной продукции в процессе вывода.
+Давайте занумеруем все продукции в грамматике и добавим в дерево вывода ещё один тип узлов (дополнительные узлы), в которых будем хранить номер применённой продукции.
 Получим следующую конструкцию: непосредственный предок дополнительного узла --- это левая часть продукции, а непосредственные сыновья дополнительного узла --- это правая часть продукции.
 
 \begin{example}
@@ -150,15 +151,15 @@ \section{Лес разбора как представление контекс
   & \}  \rangle
   \end{align*}
 
-Пердположим, что мы строим левосторонний вывод.
-Тогда после первого применеия продукции 0 у нас есть два варианта переписывания первого нетерминала: либо с применением продукции 0, либо с применением продукции 1:
+Предположим, что мы строим левосторонний вывод.
+Тогда после первого применения продукции 0 у нас есть два варианта переписывания первого нетерминала: либо с применением продукции 0, либо с применением продукции 1:
 \begin{align*}
 &\textbf{S} \xrightarrow{0} \textbf{S}S \xrightarrow{0} \textbf{S}SS \xrightarrow{1} a\textbf{S}bSS \xrightarrow{2} ab\textbf{S}S \xrightarrow{1} aba\textbf{S}bS \xrightarrow{2} abab\textbf{S} \xrightarrow{1} ababa\textbf{S}b \xrightarrow{2} ababab
 \\
 &\textbf{S} \xrightarrow{0} \textbf{S}S \xrightarrow{1} a\textbf{S}bS \xrightarrow{2} ab\textbf{S} \xrightarrow{0} ab\textbf{S}S \xrightarrow{1} aba\textbf{S}bS \xrightarrow{2} abab\textbf{S} \xrightarrow{1} ababa\textbf{S}b \xrightarrow{2} ababab
 \end{align*}
 
-Сначал рассмотрим первый вариант (применили переписываение по подукции 0).
+Сначала рассмотрим первый вариант (применили переписывание по продукции 0).
 Все остальные шаги вывода деретерминированы и в результате мы получим следующее дерево разбора:
 
 \begin{center}
@@ -349,7 +350,7 @@ \section{Лес разбора как представление контекс
 
 В двух построенных деревьях большое количество одинаковых узлов.
 Построим структуру, которая содержит оба дерева и при этом никакие нетерминальные и терминальные узлы не встречаются дважды.
-В результате мы молучим следующий граф:
+В результате мы получим следующий граф:
 
 \begin{center}
 \resizebox{0.9\textwidth}{!}{
@@ -448,8 +449,8 @@ \section{Лес разбора как представление контекс
 
 Мы получили очень простой вариант сжатого представления леса разбора (Shared Packed Parse Forest, SPPF).
 Впервые подобная идея была предложена Джоаном Рекерсом в его кандидатской диссертации~\cite{SPPF}.
-В дальнейшем она нашла широкое применеие в обобщённом (generalized) синтаксическом анализе и получила серьёзное развитие.
-В частности, наш вариант, хоть и позволяет избежать экспоненциального разростания леса разбора, всё же не является оптимальным.
+В дальнейшем она нашла широкое применение в обобщённом (generalized) синтаксическом анализе и получила серьёзное развитие.
+В частности, наш вариант, хоть и позволяет избежать экспоненциального разрастания леса разбора, всё же не является оптимальным.
 Оптимальное асимптотическое поведение достигается при использовании бинаризованного SPPF~\cite{Billot:1989:SSF:981623.981641} --- в этом случае объём леса составляет $O(n^3)$, где $n$ --- это длина входной строки.
 
 Различные модификации SPPF применяются в таких алгоритмах синтаксического анализа, как RNGLR~\cite{Scott:2006:RNG:1146809.1146810}, бинаризованная верся SPPF в BRNGLR~\cite{Scott:2007:BCT:1289813.1289815} и GLL~\cite{Scott:2010:GP:1860132.1860320,10.1007/978-3-662-46663-6_5}\footnote{Ещё немного полезной информации про SPPF: \url{http://www.bramvandersanden.com/post/2014/06/shared-packed-parse-forest/}.}.
@@ -559,9 +560,8 @@ \section{Лес разбора как представление контекс
     }
     \end{center}
 
-
     Мы построили дерево вывода для одного пути из вершины 2 в неё же.
-    Но можно заметить, что таких путей бесконечно моного: мы можем бесконечное число раз повтроять уже выполненный обход и получать всё более длинные пути.
+    Но можно заметить, что таких путей бесконечно много: мы можем бесконечное число раз повторять уже выполненный обход и получать всё более длинные пути.
     В терминах дерева вывода это будет  означать, что к узлу $_1S_3$ мы добавим сына, соответствующего применению продукции 0, а не 1 для нетерминала $S$.
     В таком случае мы получим узел $_2S_2$, который уже существует в дереве и таким образом замкнём цикл.
 
@@ -656,7 +656,7 @@ \section{Лес разбора как представление контекс
     \end{example}
 
     \begin{note}
-    SPPF построенный для данной контекстно-свободной грамматки $G$ и графа $\mathcal{G}$
+    SPPF построенный для данной контекстно-свободной грамматики $G$ и графа $\mathcal{G}$
     \begin{enumerate}
       \item содержит терминальный узел вида $(i,t_k,j)$ тогда и только тогда, когда в графе $\mathcal{G}$ есть ребро $(i,t_k,j)$;
       \item содержит нетерминальный узел вида $(i,S_k,j)$ тогда и только тогда, когда в графе $\mathcal{G}$ есть путь из вершины $i$ в вершину $j$, выводимый из нетерминала $S_k$ в грамматике $G$.