Section on matrix multiplication complexity is added.

gsvgit · gsvgit · commit cef653098599 · 2021-07-15T16:19:10.000+03:00
diff --git a/tex/FormalLanguageConstrainedReachabilityLectureNotes.bib b/tex/FormalLanguageConstrainedReachabilityLectureNotes.bib
@@ -1370,3 +1370,60 @@ @misc{VavilovRings
   url = {http://www.add3d.ru/wp-content/uploads/2019/10/Vavilov-Rings.pdf},
   note = {Дата доступа: 29 июня 2021 г.}
 }
+
+@misc{das2018lower,
+      title={Lower bounds for Combinatorial Algorithms for Boolean Matrix Multiplication}, 
+      author={Debarati Das and Michal Koucký and Michael Saks},
+      year={2018},
+      eprint={1801.05202},
+      archivePrefix={arXiv},
+      primaryClass={cs.CC}
+}
+
+@misc{alman2020refined,
+      title={A Refined Laser Method and Faster Matrix Multiplication}, 
+      author={Josh Alman and Virginia Vassilevska Williams},
+      year={2020},
+      eprint={2010.05846},
+      archivePrefix={arXiv},
+      primaryClass={cs.DS}
+}
+
+@INPROCEEDINGS{5438580,
+  author={Bansal, Nikhil and Williams, Ryan},
+  booktitle={2009 50th Annual IEEE Symposium on Foundations of Computer Science}, 
+  title={Regularity Lemmas and Combinatorial Algorithms}, 
+  year={2009},
+  volume={},
+  number={},
+  pages={745-754},
+  doi={10.1109/FOCS.2009.76}}
+
+@InProceedings{10.1007/978-3-662-47672-7_89,
+author="Yu, Huacheng",
+editor="Halld{\'o}rsson, Magn{\'u}s M.
+and Iwama, Kazuo
+and Kobayashi, Naoki
+and Speckmann, Bettina",
+title="An Improved Combinatorial Algorithm for Boolean Matrix Multiplication",
+booktitle="Automata, Languages, and Programming",
+year="2015",
+publisher="Springer Berlin Heidelberg",
+address="Berlin, Heidelberg",
+pages="1094--1105",
+abstract="We present a new combinatorial algorithm for triangle finding and Boolean matrix multiplication that runs in {\$}{\$}{\backslash}hat{\{}O{\}}(n^3/{\backslash}log ^4 n){\$}{\$}O^(n3/log4n)time, where the {\$}{\$}{\backslash}hat{\{}O{\}}{\$}{\$}O^notation suppresses poly(loglog) factors. This improves the previous best combinatorial algorithm by Chan [4] that runs in {\$}{\$}{\backslash}hat{\{}O{\}}(n^3/{\backslash}log ^3 n){\$}{\$}O^(n3/log3n)time. Our algorithm generalizes the divide-and-conquer strategy of Chan's algorithm.",
+isbn="978-3-662-47672-7"
+}
+
+
+@article{ArlDinKro70,
+author = {{\CYRV}. Арлазаров and {\CYRE}. Диниц and {\CYRM}. Кронрод and {\CYRI}. Фараджев},
+title = {Об экономном построении транзитивного замыкания ориентированного графа},
+journal = {Докл. АН СССР},
+year = {1970},
+volume = {194},
+number = {3},
+pages = {487--488},
+url = {http://mi.mathnet.ru/dan35675}
+}
+
diff --git a/tex/GraphTheoryIntro.tex b/tex/GraphTheoryIntro.tex
@@ -373,49 +373,8 @@ \section{APSP и произведение матриц}
 \section{Умножение матриц с субкубической сложностью}
 В предыдущем подразделе мы свели проблему APSP к проблеме min-plus matrix multiplication, поэтому взглянем на эффективные алгоритмы матричного умножения.
 
-Сложность наивного произведения двух матриц составляет $O(n^3)$, это приемлемо только для малых матриц, для больших же лучше использовать алгоритмы с субкубической сложностью.
-Отметим, что мы называем сложность субкубической, если она равна $O(n^{3-\varepsilon})$, где $\varepsilon > 0$, иначе говоря, меньшей, чем $O(n^3)$.
-
-Первый субкубический алгоритм опубликовал Ф. Штрассен в 1969 году, его сложность --- $O(n^{\log_2 7}) \approx O(n^{2.81})$~\cite{Strassen1969}. Основная идея --- рекурсивное разбиение на блоки $2 \times 2$ и вычисление их произведения с помощью только 7 умножений, а не 8.
-Впоследствии алгоритмы усовершенствовались до ${\approx} O(n^{2.5})$~\cite{Pan1978,BiniCapoRoma1979,Schonhage1981,CoppWino1982}. В настоящее время наиболее асимптотически быстрым является алгоритм Копперсмита --- Винограда со сложностью $O(n^{2.376})$~\cite{CoppWino1990}.
-
-Несмотря на то, что у приведенных алгоритмов неплохая алгоритмическая сложность, мы всё же не можем использовать их для вычисления min-plus matrix multiplication, так как в субкубических алгоритмах требуется, чтобы элементы образовывали кольцо. Покажем, что $\mathbb{R} \cup \{+\infty\}$ с операциями min и + являются полукольцом, а не кольцом:
-\begin{enumerate}
-    \item $min(a, b) = min(b, a)$
-    \item $min(min(a, b)), c) = min(a, min(b, c)))$
-    \item $min(a, +\infty) = min(+\infty, a) = a$, т.е. $+\infty$ --- нейтральный элемент относительно операции min
-
-    \item $(a + b) + c = a + (b + c)$
-
-    \item $min(a, b) + c = min(a + c, b + c)$
-    \item $a + min(b, c) = min(a + b, a + c)$
-
-    \item $a + \infty = \infty + a = \infty$
-    \item Но для произвольного элемента $a$: $\nexists d$, т.ч. $min(a, d) = min(d, a) = +\infty$, т.е. для любого элемента нет обратного относительно операции min
-\end{enumerate}
-
 Таким образом, вопрос о субкубических алгоритмах решения APSP всё ещё открыт~\cite{Chan2010}.
-Кроме того, более простая задача APSP с булевыми матрицами также не решена за субкубическую сложность. Приведем обоснование этого факта.
-
-\begin{definition}
-  Матрица называется \textit{булевой}, если она состоит из 0 и 1.
-\end{definition}
-
-Булевы матрицы с поэлементными операциями дизъюнкции и конъюнкции являются полукольцом. Покажем это: пусть $A$, $B$ и $C$ --- булевы матрицы, тогда:
-\begin{enumerate}
-    \item $A \vee B = B \vee A$
-    \item $(A \vee B) \vee C = A \vee (B \vee C)$
-    \item $A \vee N = N \vee A = A$, где $N$ --- матрица, полностью состоящая из 0
-
-    \item $(A \wedge B) \wedge C = A \wedge (B \wedge C)$
-
-    \item $(A \vee B) \wedge C = (A \wedge C) \vee (B \wedge C)$
-    \item $A \wedge (B \vee C) = (A \wedge B) \vee (A \wedge C)$
-
-    \item $A \wedge N = N \wedge A = N$
-\end{enumerate}
 
-Булевы матрицы тоже не являются кольцом, т.к. не имеют обратный элемент относительно операции дизъюнкции (т.е. для произвольной булевой матрицы $A$: $\nexists D$, т.ч. $D$ --- булева матрица и $A \vee D = D \vee A = N$). Следовательно, субкубические алгоритмы не подходят для перемножения булевых матриц, т.к. в них используются обратные элементы (например, для разности). В частности, они не применимы к классической матрице смежности, которая ведёт себя как булева матрица.
 
 %\section{Вопросы и задачи}
 %\begin{enumerate}
diff --git a/tex/LinearAlgebra.tex b/tex/LinearAlgebra.tex
@@ -502,7 +502,7 @@ \section{Матрицы и вектора}
 \end{example}
 
 
-\begin{definition}[Матричное умножение]
+\begin{definition}[Матричное умножение]\label{def:MxM}
 
 Пусть $G = (S,\oplus, \otimes)$ --- полукольцо, $M_{n \times m}, N_{m\times k}$ --- две матрицы над этим полукольцом.
 Тогда 
@@ -604,7 +604,54 @@ \section{Матрицы и вектора}
 \end{align}
 \end{example}
 
-%Заметим, что скаларная операция --- это частный случай произвеления Кронекера: достаточно превратить элемент носителя полугруппы в матрицу размера $1\times 1$.
+
+\section{Теоретическая сложность умножения матриц}
+
+В рамках такого раздела теории сложности, как мелкозернистая сложность (fine-grained complexity) задача умножения двух матриц оказалась достаточно важной, так как через вычислительную сложность этой задачи можно оценить сложность большого класса различных задач. С примерами таких задач можно ознакомиться в работе~\cite{Williams:2010:SEP:1917827.1918339}. Поэтому рассмотрим алгоритмы нахождения произведения двух матриц более подробно.
+
+Для начал построим наивный алгоритм, сконструированный на основе определении произведения матриц~\ref{algo:MxM}.
+
+\begin{algorithm}
+  \floatname{algorithm}{Listing}
+\begin{algorithmic}[1]\label{algo:MxM}
+\caption{Наивное перемножение матриц}
+\Function{MatrixMult}{$M_1, M_2, G=(S,\oplus,\otimes)$}    
+    \If {(len$(\omega)=0$)}
+    \Comment{{\footnotesize Пустая цепочка выводима из $S$}}
+    \State{\Return \textit{(true, $\omega$)}}
+    \EndIf 
+       
+    \If{$(\omega = a :: tl)$}
+        \Comment{{\footnotesize Выводимая из $S$ подстрока должна начинаться с $a$}}
+        \State{$res,tl' = $ S($tl$)}
+        \Comment{{\footnotesize Затем должна идти подстрока, выводимая из $S$}}
+        \If{res \&\&  $tl' = b :: tl''$}
+           \Comment{{\footnotesize Если вызов закончился успешно, то надо проверить, что следующий символ --- это $b$}}
+           \State{\Return $S(tl'')$}
+           \Comment{{\footnotesize И снова попробовать вывести перфикс из $S$}}
+         \Else
+           \State{\Return \textit{(false, $tl'$)}}
+        \EndIf
+    \Else
+        \State{\Return \textit{(false, $\omega$)}}
+    \EndIf           
+\EndFunction
+\end{algorithmic}
+\end{algorithm}
+
+Сложность наивного произведения двух матриц составляет $O(n^3)$, что очевидным образом следует из псевдокода. Но можно ли улучшить этот алгоритм? Первый положительный ответ был опубликовал Ф. Штрассен в 1969 году~\cite{Strassen1969}. Сложность предложенного им алгоритма --- $O(n^{\log_2 7}) \approx O(n^{2.81})$. Основная идея --- рекурсивное разбиение на блоки $2 \times 2$ и вычисление их произведения с помощью только 7 умножений, а не 8.
+
+Рассмотрим предложенный им алгоритм более подробно !!!. Про вычитание блоков, чтобы было видно, откуда требуются обратные.
+
+Впоследствии сложность постепенно понижалась в ряде работ, таких как ~\cite{Pan1978,BiniCapoRoma1979,Schonhage1981,CoppWino1982,CoppWino1990}. Было введено специальное обозначение для показателя степени в данной оценке: $\omega$. То есть сложность умножения матриц --- это $O(n^\omega)$, и задача сводится к уменьшению значения $\omega$. В настоящее время работа над уменьшением показателя степени продолжается и сейчас уже предложены решения с $\omega < 2.373$\footnote{В данной области достаточно регулярно появляются новые результаты, дающие сравнительно небольшие, в терминах абсолютных величин, изменения. Так, в 2021 была педставлена работа, улучшающая значение $\omega$ в пятом знаке после запятой~\cite{alman2020refined}. Несмотря на кажущуюся несерьёзность результата, подобные работы имеют большое теоретическое значение, так как улучшают наше понимание исходной задачи и её свойств.}.
+
+Всё тем же Ф. Штрассеном ещё в 1969 году была выдвинута гипотеза о том, что для достатого больших $n$ существует алгоритм, который для любого сколь угодно маленького наперёд заданного $\varepsilon$ перемножает матрицы за $O(n^{2+\varepsilon})$. На текущий момент ни доказательства, ни опровержения этой гипотезы не предъявлено.
+
+Важной особенностью указанного выше направления улучшения алгоритмов является то, что оно допускает использования более богатых алгебраических структур, чем требуется для определения умножения двух матриц. Так, уже алгоритм Штрасеена использует операцию вычитания, что приводит к необходимости иметь обратные элеиенты по сложению, а значит определять матрицы над кольцом. Хотя для исходного определения (\ref{def:MxM}) достаточно более бедной структуры. При этом, часто, структуры, возникающие в прикладных задачах кольцами не являются. Напмриер, тропическое (или $\{min,+\}$) полукольцо, играющее ключевую роль в тропической математике, или булево ($\{\vee,\wedge\}$) полукольцо, возникающее, например, при работе с отношениями\footnote{Вообще говоря, в некоторых прикладных задачах возникают структуры, не являющиеся даже полукольцом. Предположим, что есть три различных множества $S_1, S_2$ и $S_3$ и две двухместные функции $f:S_1 \times S_2 \to S_3$ и $g: S_3 \times S_3 \to S_3$. Этого достаточно, чтобы определить произведение двух матриц $M_1$ и $M_2$, построенных из элементов множеств $S_1$ и $S_2$ соответственно. Результирующая матрица будет состоять из элеиентов $S_3$. Как видно, функции не являются бинарными операциями в смысле нашего определения. Несотря на кажущуюся экзотичность, подобные структуры возникают на практике при работе с графами и учитываются, например, в стандарте GraphBLAS (\url{https://graphblas.github.io/}), где, кстати, называются полукольцами, что выглядит не вполне корректно.}. Значит, описанные выше решения не применимы и вопрос о существовании алгоритма с менее чем кубической сложностью снова актуален. 
+
+В попытках ответить на этот вопрос появились так называемые комбинаторные алгориты умножения матриц\footnote{В противовес описанным выше, не являющимся комбинаторными. Стоит отметить, что строгое опредедение комбинаторных алгоритмов отсутствует, хотя этот термин и получил широкое употребление. В частности, Н.~Бансал (Nikhil Bansal) и Р.~Уильямс (Ryan Williams) в работе~\cite{5438580} дают определение комбинаторного алгоритма, но тут же замечают следющее: ``We would like to give a definition of ``combinatorial algorithm'', but this appears elusive. Although the term has been used in many of the cited references, nothing in the literature resembles a definition. For the purposes of this paper, let us think of a ``combinatorial algorithm'' simply as one that does not call an oracle for ring matrix multiplication.''. Ещё один вариант определения с обсуждением можно найти в~\cite{das2018lower}.}. Классический результат в данной области --- это алгоритм чеиырёх русских, предложенный  В. Л. Арлазаровым, Е. А. Диницем, М. А. Кронродом и И. А. Фараджевым в 1970 году~\cite{ArlDinKro70}, позволяющий перемножить матрицы над конечным полукольцом за $O(n^3/\log n)$. Лучшим результатом\footnote{В работе~\cite{das2018lower} предложен алгоритм со сложностью $\Omega(n^{7/3}/2^{O(\sqrt{\log n})})$, однако авторы утверждают, тчо сами не уверены в комбинаторности предложенного решения. По-видимому, полученные результаты ещё должны быть проверены сообществом.} в настоящее время является алгоритм со сложностью $\hat{O}(n^3/\log^4 n)$\footnote{Нотация $\hat{O}$ скрывает $poly(\log\log)$ коэффициенты.}~\cite{10.1007/978-3-662-47672-7_89}.
+
+%Заметим, что скалярная операция --- это частный случай произвеления Кронекера: достаточно превратить элемент носителя полугруппы в матрицу размера $1\times 1$.
 
 %\section{Вопросы и задачи}
 %\begin{enumerate}