[WIP] Раздел по регулярным языкам.

gsvgit · gsvgit · commit d722304ed25c · 2024-06-08T09:47:33.000+03:00
diff --git a/tex/RegularLanguages.tex b/tex/RegularLanguages.tex
@@ -1,11 +1,16 @@
 \chapter{Регулярные языки}
 
 
-Регулярные языки --- иерархии, связанные с конечные автоматы, взаимные конвертации, основные свойства регулярных языков, такие как замкнутость относительно различных операций.
+В данном разделе мы обсудим регулярные языки --- класс, лежащий на самом нижнем уровне иерархии Хомского.
+Будут рассмотрены основные способы задания таких языков: \textit{регулярные выражения}, \textit{конечные автоматы}, \textit{лево(право)линейные грамматики}.
+Обсудим основные свойства регулярных языков, такие как замкнутость относительно различных операций, а также различные свойства соответствующих автоматов и грамматик.
 
 
 \section{Регулярные выражения}
 
+Регулярные выражения --- один из классических способов задать регулярный язык\footnote{Замечание для программистов. Важно понимать, что речь идёт о формальной конструкции, а не о том, что называется регулярными выражениями в различных языках программирования или библиотеках, где под названием <<регулярные выражения>> могут скрываться конструкции, существенно более выразительные, чем обсуждаемые здесь.}.
+Основывается этот способ на предложении синтаксиса для описания \textit{регулярных множеств}\footnote{Помним, что язык --- это множество слов.}.
+
 \begin{definition}
     Регулярное множество (над алфавитом $\Sigma$) это:
     \begin{itemize}
@@ -18,34 +23,120 @@ \section{Регулярные выражения}
     \end{itemize}
 \end{definition}
 
+Для того, чтобы описывать такие множества, удобно пользоваться \textit{регулярными выражениями}.
 
 \begin{definition}
-    Регулярное выражение.
+    Регулярное выражение (над алфавитом $\Sigma$) это:
     \begin{itemize}
+        \item $\varnothing$
         \item $\varepsilon$
-        \item $t$
-        \item $R_1 \mid R_2$
-        \item $R_1 \cdot R_2$
-        \item $R^*$
+        \item $t$, $t \in \Sigma$
+        \item $R_1 \mid R_2$, где $R_1$ и $R_2$ --- регулярные выражения
+        \item $R_1 \cdot R_2$, где $R_1$ и $R_2$ --- регулярные выражения
+        \item $R^*$, где $R$ --- регулярное выражение
+        \item $(R)$, где $R$ --- регулярное выражение
     \end{itemize}
 \end{definition}
 
+Отметим несколько важных с прикладной точки зрения моментов.
+Во-первых, часто используется расширенный синтаксис, в который добавляются конструкции не увеличивающие выразительную силу, но упрощающие запись.
+Например, встречаются следующие расширения\footnote{Существуют и другие, однако их мы не будем использовать и, соответственно, рассматривать. Читатель может вспомнить, что называется регулярными выражениями в его любимом языке программирования и попробовать самостоятельно выразить имеющиеся там конструкции через базовые.}.
+\begin{itemize}
+    \item $R? = R \mid \varepsilon$, где $R$ --- регулярное выражение.
+    \item $R^+ = R \cdot R^*$, где $R$ --- регулярное выражение.
+\end{itemize}
+
+Во-вторых, конструкции $\varnothing$ и $\varepsilon$ используются крайне редко, особенно в случае расширенного синтаксиса, так как часто выражение, эквивалентное использующему данные конструкции, часто более компактно записывается с использованием расширенного синтаксиса.
+В-третьих, оператор конкатенации часто опускается\footnote{Как и знак умножения во многих математических записях.}.
+
+Рассмотрим несколько примеров регулярных выражений.
+\begin{example}
+    Регулярное выражение $a$ задаёт регулярное множество $\{a\}$ и, соответственно, язык из единственного слова $a$.
+\end{example}
+
+\begin{example}
+    Регулярное выражение $ab$ задаёт регулярное множество $\{ab\}$ и, соответственно, язык из единственного слова $ab$.    
+\end{example}
+
+
+\begin{example}
+    Регулярное выражение $a^*$ задаёт регулярное множество $$R = \bigcup_{i=0}^{\infty}{a^i} = \{\varepsilon, a, aa, aaa, \ldots \}$$ и, соответственно, бесконечный язык, содержащий для любого неотрицательного целого $n$ цепочку из символов $a$ длины $n$.
+\end{example}
+
+
+\begin{example}
+    $a^*b$
+\end{example}
+
+\begin{example}
+    $(a\mid b)^*$
+\end{example}
+
+\begin{example}
+    $(ab)^*c?$
+\end{example}
+
 \section{Конечные автоматы}
 
-\begin{definition}\label{def:FiniteAutomata}
-    \textit{Конечный автомат} --- это пятёрка $M = \langle Q, q_S, Q_F, \delta, \Sigma \rangle$, где
+\textit{Конечный автомат} --- вычислительная машина, которая имеет конечный набор состояний и может совершать переходы между ними, читая входные данные. 
+Важно отметить, что ни какой дополнительной памяти классический конечный автомат не имеет\footnote{Существуют автоматы с константной памятью, регистрами} и не производит дополнительных действий\footnote{Автоматы с записью на ленту, и т.д.}.
+
+\begin{definition}\label{def:NondeterminicticFiniteAutomata}
+    \textit{Недетерминированный конечный автомат, НКА} --- это пятёрка $M = \langle Q, Q_S, Q_F, \delta, \Sigma \rangle$, где
+    \begin{itemize}
+        \item $Q$ --- конечное множество состояний
+        \item $Q_S \in Q$ --- множество стартовых состояний
+        \item $Q_F \subseteq Q$ --- множество финальных состояний
+        \item $\delta \subseteq Q \times (\Sigma \cup \varepsilon) \times 2^Q$ --- функция переходов, а $\varepsilon \notin \Sigma$
+        \item $\Sigma$ --- конечный алфавит
+    \end{itemize}
+\end{definition}
+
+Так как нас интересуют конечные автоматы в контексте языков, то будем говорить, что на ленте автомата записано какое-то слово (или строка).
+Иными словами, будем говорить, что автомат принимает на вход слово или строку.
+
+
+Процесс вычислений, проделываемых конечным автоматом, удобно описывать в терминах переходов между \textit{конфигурациями}.
+
+\begin{definition}
+    Конфигурация $c$ конечного автомата $M = \langle Q, Q_S, Q_F, \delta, \Sigma \rangle$ --- это пара $(q,w)$, где $q\in Q$ --- это текущее состояние автомата, а $w \in \Sigma^*$ --- непросмотренная часть входной строки.
+\end{definition}
+
+\begin{definition}
+    Будем говорить, что автомат $M = \langle Q, Q_S, Q_F, \delta, \Sigma \rangle$ может перейти из конфигурации $c_1 = (q_1,w_1)$ в конфигурацию $c_2 = (q_2,w_2)$, если     
+        
+    $$c_2 \in \{(q_2,w_2) \mid w_1 = aw_2, (q_1,a, q_2) \in \delta\} \cup \{(q_2,w_1) \mid (q_1, \varepsilon, q_2) \in \delta\}.$$
+
+    Обозначать этот факт будем как $c_1 \to c_2$.
+\end{definition}
+
+$$С_2 = \{(q_2,w_2) \mid w_1 = aw_2, (q_1,a, q_2) \in \delta\} \cup \{(q_2,w_1) \mid (q_1, \varepsilon, q_2) \in \delta\}.$$
+$$ c_1 \Rightarrow C_2 $$
+
+Стартовая конфигурация.
+
+Финальная конфигурация.
+
+Ошибочная конфигурация.
+
+\begin{example}
+    Пример интерпретации конечного автомата.
+\end{example}
+    
+
+\begin{definition}\label{def:DeterminicticFiniteAutomata}
+    \textit{Детерминированный конечный автомат (ДКА, Deterministic Finite Automata, DFA)} --- это пятёрка $M = \langle Q, q_S, Q_F, \delta, \Sigma \rangle$, где
     \begin{itemize}
         \item $Q$ --- конечное множество состояний
         \item $q_S \in Q$ --- стартовое состояние
         \item $Q_F \subseteq Q$ --- множество финальных состояний
-        \item $\delta \subseteq Q \times (\Sigma \cup \varepsilon) \times Q$ --- функция переходов, а $\varepsilon \notin \Sigma$
+        \item $\delta \subseteq Q \times \Sigma \times Q$ --- функция переходов
         \item $\Sigma$ --- конечный алфавит
     \end{itemize}
 \end{definition}
 
-Заметим, что определение~\ref{def:FiniteAutomata} 
 
-В зависимости от того, как именно представлена функция переходов: список троек, матрица, граф.
+Заметим, что функцию переходов можно представить разными способами В зависимости от того, как именно представлена функция переходов: список троек, матрица, граф.
 
 \begin{example}
     Пример КА.    
@@ -55,16 +146,15 @@ \section{Конечные автоматы}
 \end{example}
 
 
-\begin{definition}
-    Конфигурация, переход между конфигурациями.
-\end{definition}
 
 \begin{example}
 Пример интерпретации конечного автомата.
 \end{example}
 
 Построение КА по регулярному выражению и регулярному выражению по КА. На производных.
 
+Построение регулярного выражения по КА.
+
 Алгоритмы: проверка пустоты ... 
 
 Примеры.
@@ -162,6 +252,8 @@ \section{Замкнутость регулярных языков относит
 
 Построение пересечения через тензорное произведение автоматов.
 
+Идея доказательства, что мы построили именно пересечение.
+
 Пересечение через синхронный обход в ширину.
 
 %\section{Вопросы и задачи}