add quickstart

HydrogenSulfate · HydrogenSulfate · commit 207c54fe0612 · 2023-05-08T07:39:59.000Z
diff --git a/docs/images/quickstart/u_pred_case1.png b/docs/images/quickstart/u_pred_case1.png
diff --git a/docs/images/quickstart/u_pred_case2.png b/docs/images/quickstart/u_pred_case2.png
diff --git a/docs/zh/install_setup.md b/docs/zh/install_setup.md
@@ -65,7 +65,7 @@ ppsci.utils.run_check()
 
 - 编写自己的案例（假设案例名为demo）
 
-    推荐在 `examples/` 下新建 `demo` 文件夹，然后在 `demo` 文件夹下新建 `demo.py`，最后在 `demo.py` 文件中使用 PaddleScience 提供的 [API](./zh/api/arch.md) 编写代码
+    推荐在 `examples/` 下新建 `demo` 文件夹，然后在 `demo` 文件夹下新建 `demo.py`，最后在 `demo.py` 文件中使用 PaddleScience 提供的 [API](./api/arch.md) 编写代码
 
     ``` py linenums="1" title="examples/demo/demo.py"
     import ppsci
diff --git a/docs/zh/overview.md b/docs/zh/overview.md
@@ -5,7 +5,7 @@ PaddleScience 在代码结构上划分为 12 个模块。从一般深度学习
 ## 1. 整体工作流
 
 <figure markdown>
-  ![workflow](./images/overview/workflow.jpg){ loading=lazy style="height:80%;width:80%"}
+  ![workflow](../images/overview/workflow.jpg){ loading=lazy style="height:80%;width:80%"}
 </figure>
 
 上图是 PaddleScience 的 workflow 示意图（以基于几何的问题求解为例），流程描述如下
@@ -21,18 +21,18 @@ PaddleScience 在代码结构上划分为 12 个模块。从一般深度学习
 
 ## 2. 模块简介
 
-### 2.1 [Arch](./zh/api/arch.md)
+### 2.1 [Arch](./api/arch.md)
 
 Arch 模块负责各种神经网络模型的组网、参数初始化、前向计算等功能，内置了多种模型供用户使用。
 
-### 2.2 [AutoDiff](./zh/api/autodiff.md)
+### 2.2 [AutoDiff](./api/autodiff.md)
 
 AutoDiff 模块负责计算高阶微分功能，内置基于 Paddle 自动微分机制的全局单例 `jacobian`、`hessian` 供用户使用。
 
-### 2.3 [Constraint](./zh/api/constraint.md)
+### 2.3 [Constraint](./api/constraint.md)
 
 <figure markdown>
-  ![constraint](./images/overview/constraint.jpg){ loading=lazy style="height:50%;width:50%"}
+  ![constraint](../images/overview/constraint.jpg){ loading=lazy style="height:50%;width:50%"}
 </figure>
 
 为了在套件中统一物理信息驱动、数据驱动、数理融合三种求解方式，我们将数据构造、输入到输出的计算过程、损失函数等必要接口在其定义完毕之后，统一记录在 Constraint 这一模块中，有了这些接口，Constraint 就能表示不同的训练目标，如：
@@ -48,54 +48,54 @@ AutoDiff 模块负责计算高阶微分功能，内置基于 Paddle 自动微分
 
 Data 模块负责数据的读取、包装和预处理，由以下 3 个子模块分别负责。
 
-#### 2.4.1 [Dataset](./zh/api/data/dataset.md)
+#### 2.4.1 [Dataset](./api/data/dataset.md)
 
 Dataset 模块存放各种数据集的包装类，将数据包装成统一的结构再用于读取。
 
-#### 2.4.2 [Transform](./zh/api/data/process/transform.md)
+#### 2.4.2 [Transform](./api/data/process/transform.md)
 
 Transform 模块存放各种基于单样本的数据预处理方法，包括数据平移 `Translate` 和数据缩放 `Scale`，一般与 `data.dataset` 结合使用。
 
-#### 2.4.3 [BatchTransform](./zh/api/data/process/batch_transform.md)
+#### 2.4.3 [BatchTransform](./api/data/process/batch_transform.md)
 
 BatchTransform 模块存放各种基于批样本的数据预处理方法。
 
-### 2.5 [Equation](./zh/api/equation.md)
+### 2.5 [Equation](./api/equation.md)
 
 <figure markdown>
-  ![equation](./images/overview/equation.jpg){ loading=lazy style="height:80%;width:80%" align="center" }
+  ![equation](../images/overview/equation.jpg){ loading=lazy style="height:80%;width:80%" align="center" }
 </figure>
 
 Equation 模块负责定义各种常见方程的计算函数，如 `NavierStokes` 表示 N-S 方程，`Vibration` 表示振动方程，每个方程内部含有相关变量的计算函数。
 
-### 2.6 [Geometry](./zh/api/geometry.md)
+### 2.6 [Geometry](./api/geometry.md)
 
 <figure markdown>
-  ![geometry](./images/overview/geometry.jpg#center){ loading=lazy style="height:50%;width:50%" }
+  ![geometry](../images/overview/geometry.jpg#center){ loading=lazy style="height:50%;width:50%" }
 </figure>
 
 Geometry 模块负责定义各种常见的几何形状，如 `Interval` 线段几何、`Rectangle` 矩形几何、`Sphere` 球面几何。
 
-### 2.7 [Loss](./zh/api/loss.md)
+### 2.7 [Loss](./api/loss.md)
 
 Loss 模块负责定义各种损失函数，在模型前向与方程计算完毕后，将结果与参考值计算损失值，供后续的梯度优化算法使用。
 
-### 2.8 [Optimizer](./zh/api/optimizer.md)
+### 2.8 [Optimizer](./api/optimizer.md)
 
 Optimizer 模块负责定义各种优化器，如 `SGD`、`Adam`、`LBFGS`。
 
-### 2.9 [Solver](./zh/api/solver.md)
+### 2.9 [Solver](./api/solver.md)
 
 Solver 模块负责定义求解器，作为训练、评估、推理、可视化的启动和管理引擎。
 
-### 2.10 [Utils](./zh/api/utils.md)
+### 2.10 [Utils](./api/utils.md)
 
 Utils 模块内部存放了一些适用于多种场景下的工具类、函数，如在 `reader.py` 下的数据读取函数，在 `logger.py` 下的日志打印函数，以及在 `expression.py` 下的方程计算类。
 
-### 2.11 [Validate](./zh/api/validate.md)
+### 2.11 [Validate](./api/validate.md)
 
 Validator 模块负责定义各种评估器，用于模型训练完一个 epoch 后自动在指定数据上进行评估（可选，默认不开启训练时评估）并得到评估指标。
 
-### 2.12 [Visualize](./zh/api/visualize.md)
+### 2.12 [Visualize](./api/visualize.md)
 
 Visualizer 模块负责定义各种可视化器，用于模型评估完后在指定数据上进行预测（可选，默认不开启训练时可视化）并将结果保存成可视化的文件。
diff --git a/docs/zh/quickstart.md b/docs/zh/quickstart.md
@@ -0,0 +1,231 @@
+# 快速开始
+
+本文通过一个简单的 demo 及其扩展问题，介绍如何使用 PaddleScience 训练模型，解决一类方程学习与预测问题，并可视化预测结果。
+
+## 1. 问题简介
+
+假设我们希望用神经网络模型去拟合 $x \in [-\pi, \pi]$ 区间内，$u=sin(x)$ 这一函数。在拟合函数已知和未知两种情形下，如何去尽可能地准确拟合 $u=sin(x)$。
+
+第一种场景下，假设已知目标函数 $u$ 的解析解就是 $u=sin(x)$，我们采用监督训练的思路，直接用该公式生成标签因变量 $u$，与自变量 $x$ 共同作为监督数据对模型进行训练。
+
+第二种场景下，假设不知道目标函数 $u$ 的解析解，但我们知道其满足某种微分关系，我们这里以其中一个满足条件的微分方程 $\dfrac{\partial u} {\partial x}=cos(x)$ 为例，介绍如何生成数据进行训练。
+
+## 2. 场景一
+
+目标拟合函数：
+
+$$
+u=sin(x), x \in [-\pi, \pi].
+$$
+
+我们生成 $N$ 组数据对 $(x_i, u_i), i=1,...,N$ 作为监督数据进行训练即可。
+
+在撰写代码之前，我们首先导入必要的包。
+
+``` py
+import numpy as np
+import paddle
+
+import ppsci
+from ppsci.utils import logger
+```
+
+然后创建日志和模型保存目录供训练过程记录和保存使用，这一步是绝大部分案例在正式开始前都需要进行的操作。
+
+``` py
+# set random seed for reproducibility
+ppsci.utils.misc.set_random_seed(42)
+
+# set output directory
+output_dir = "./output_quick_start"
+
+# initialize logger
+logger.init_logger("ppsci", f"{output_dir}/train.log", "info")
+```
+
+接下来正式开始撰写代码。
+
+首先定义问题区间，我们使用 `ppsci.geometry.Interval` 定义一个线段几何形状，方便后续在该线段上对 $x$ 进行采样。
+
+``` py
+# set input 1D-geometry([-π, π])
+l_limit, r_limit = -np.pi, np.pi
+x_domain = ppsci.geometry.Interval(l_limit, r_limit)
+geom = {"domain": x_domain}
+```
+
+然后定义一个简单的 3 层 MLP 模型。
+
+``` py
+# set model to 3-layer MLP
+model = ppsci.arch.MLP(("x",), ("u",), 3, 64)
+```
+
+上述代码表示模型接受自变量 $x$ 作为输入，输出预测结果 $\hat{u}$
+
+然后我们定义已知的 $u=sin(x)$ 计算函数，作为 `ppsci.constraint.InteriorConstraint` 的参数，用于生成标签数据，`InteriorConstraint` 表示以给定的几何形状或数据集中的数据作为输入，联合给定的标签数据，指导模型进行优化。
+
+``` py
+# set constraint on 1D-geometry([-π, π])
+iters_per_epoch = 100
+interior_constraint = ppsci.constraint.InteriorConstraint(
+    output_expr={"u": lambda out: out["u"]},
+    label_dict={"u": sin_compute_func},
+    geom=geom["domain"],
+    dataloader_cfg={
+        "dataset": "NamedArrayDataset",
+        "iters_per_epoch": iters_per_epoch,
+        "sampler": {
+            "name": "BatchSampler",
+            "shuffle": True,
+        },
+        "batch_size": 32,
+    },
+    loss=ppsci.loss.MSELoss(),
+)
+# wrap constraint(s) into one dict
+constraint = {interior_constraint.name: interior_constraint}
+```
+
+此处的 `interior_constraint` 表示一个训练目标，即我们希望在 $[-\pi, \pi]$ 这段区间内，优化模型让模型的预测结果 $\hat{u}$ 尽可能地接近它的标签值 $u$。
+
+接下来就可以开始定义模型训练相关的内容，比如训练轮数、优化器
+
+``` py
+# set training hyper-parameters
+epochs = 10
+# set optimizer
+optimizer = ppsci.optimizer.Adam(1e-3)((model,))
+```
+
+当训练完成，我们希望在 $[-\pi, \pi]$ 上取 1000 个点进行预测并将结果可视化，以此查看训练完毕的模型是否具备一定的预测能力。
+
+``` py
+# set visualizer
+visualize_input_dict = {"x": paddle.linspace(l_limit, r_limit, 1000).reshape([1000, 1])}
+visualize_input_dict["u_ref"] = paddle.sin(visualize_input_dict["x"])
+visualizer = {
+    "visualize_u": ppsci.visualize.VisualizerScatter1D(
+        visualize_input_dict,
+        ("x",),
+        {"u_pred": lambda out: out["u"], "u_ref": lambda out: out["u_ref"]},
+        prefix="u=sin(x)",
+    ),
+}
+```
+
+最后将上述定义的对象传递给训练调度类 `Solver`，即可开始模型训练
+
+``` py
+# initialize solver
+solver = ppsci.solver.Solver(
+    model,
+    constraint,
+    output_dir,
+    optimizer,
+    epochs=epochs,
+    iters_per_epoch=iters_per_epoch,
+    geom=geom,
+    visualizer=visualizer,
+)
+# train model
+solver.train()
+```
+
+训练完毕后再用刚才取的 1000 个点进行可视化
+
+``` py
+# visualize prediction after finished training
+solver.visualize()
+```
+
+训练记录下所示
+
+``` log
+...
+...
+ppsci INFO: [Train][Epoch 10/10][Iter: 60/100] lr: 0.00100000, loss: 0.00084, EQ: 0.00084, batch_cost: 0.00193s, reader_cost: 0.00017s, ips: 16607.08697 samples/s, eta: 0:00:00
+ppsci INFO: [Train][Epoch 10/10][Iter: 70/100] lr: 0.00100000, loss: 0.00082, EQ: 0.00082, batch_cost: 0.00193s, reader_cost: 0.00016s, ips: 16603.29541 samples/s, eta: 0:00:00
+ppsci INFO: [Train][Epoch 10/10][Iter: 80/100] lr: 0.00100000, loss: 0.00078, EQ: 0.00078, batch_cost: 0.00193s, reader_cost: 0.00016s, ips: 16612.34228 samples/s, eta: 0:00:00
+ppsci INFO: [Train][Epoch 10/10][Iter: 90/100] lr: 0.00100000, loss: 0.00076, EQ: 0.00076, batch_cost: 0.00193s, reader_cost: 0.00015s, ips: 16616.61847 samples/s, eta: 0:00:00
+ppsci INFO: [Train][Epoch 10/10][Iter: 100/100] lr: 0.00100000, loss: 0.00075, EQ: 0.00075, batch_cost: 0.00191s, reader_cost: 0.00015s, ips: 16715.53436 samples/s, eta: 0:00:00
+ppsci INFO: [Train][Epoch 10/10][Avg] loss: 0.00075, EQ: 0.00075
+ppsci INFO: Finish saving checkpoint to ./output_quick_start/checkpoints/latest
+ppsci INFO: 1D result is saved to ./output_quick_start/visual/epoch_0/u=sin(x).png
+ppsci INFO: [Visualize][Epoch 0] Finished visualization.
+```
+
+预测结果如下所示
+
+![u=sin(x) prediction](../images/quickstart/u_pred_case1.png)
+
+## 3. 场景二
+
+可以看到场景一的监督训练方式能较好地解决函数拟合问题，但一般情况下我们是无法得知拟合函数本身的解析式的，因此也无法直接构造因变量的监督数据。
+
+虽然无法求出解析式直接构造监督数据，但往往可以利用相关数学知识，推导出目标拟合函数符合的某种数学关系，以训练模型以满足这种数学关系的方式，达到“间接”优化模型的目的。
+
+假设我们不再使用 $u=sin(x)$ 这一先验公式，因而无法生成标签数据 $u$。因此我们使用 $\dfrac{\partial u} {\partial x}=cos(x)$ 这一方程，构造数据对 $(x_i, cos(x_i)), i=1,...,N$。
+这意味着我们仍然能保持模型的输入、输出不变，但优化目标变成了：让 $\dfrac{\partial \hat{u}} {\partial x}$ 尽可能地接近 $cos(x)$。即
+
+基于以上理论，我们对场景一的代码进行少量的改写即可得到本场景二的代码。
+
+首先由于我们需要使用一阶微分这一操作，因此在代码开头处需导入一阶微分 API
+
+``` py hl_lines="5"
+import numpy as np
+import paddle
+
+import ppsci
+from ppsci.autodiff import jacobian
+from ppsci.utils import logger
+```
+
+然后将原来的标签生成函数改为微分关系标签生成函数
+
+``` py
+# standard solution of cos(x)
+def cos_compute_func(data: dict):
+    return np.cos(data["x"])
+```
+
+最后将 `interior_constraint` 这一约束条件从约束“模型输出”，改为约束“模型输出对输入的一阶微分”
+
+``` py hl_lines="2 3"
+interior_constraint = ppsci.constraint.InteriorConstraint(
+    output_expr={"du_dx": lambda out: jacobian(out["u"], out["x"])},
+    label_dict={"du_dx": cos_compute_func},
+    geom=geom["domain"],
+    dataloader_cfg={
+        "dataset": "NamedArrayDataset",
+        "iters_per_epoch": iters_per_epoch,
+        "sampler": {
+            "name": "BatchSampler",
+            "shuffle": True,
+        },
+        "batch_size": 32,
+    },
+    loss=ppsci.loss.MSELoss(),
+)
+```
+
+修改完毕后执行训练，训练日志如下所示
+
+``` log
+...
+...
+ppsci INFO: [Train][Epoch 10/10][Iter: 70/100] lr: 0.00100000, loss: 0.00035, EQ: 0.00035, batch_cost: 0.01183s, reader_cost: 0.00017s, ips: 2705.18917 samples/s, eta: 0:00:00
+ppsci INFO: [Train][Epoch 10/10][Iter: 80/100] lr: 0.00100000, loss: 0.00035, EQ: 0.00035, batch_cost: 0.01133s, reader_cost: 0.00017s, ips: 2823.74760 samples/s, eta: 0:00:00
+ppsci INFO: [Train][Epoch 10/10][Iter: 90/100] lr: 0.00100000, loss: 0.00036, EQ: 0.00036, batch_cost: 0.01141s, reader_cost: 0.00017s, ips: 2803.77351 samples/s, eta: 0:00:00
+ppsci INFO: [Train][Epoch 10/10][Iter: 100/100] lr: 0.00100000, loss: 0.00036, EQ: 0.00036, batch_cost: 0.01106s, reader_cost: 0.00016s, ips: 2892.93859 samples/s, eta: 0:00:00
+ppsci INFO: [Train][Epoch 10/10][Avg] loss: 0.00036, EQ: 0.00036
+ppsci INFO: Finish saving checkpoint to ./output_quick_start_2/checkpoints/latest
+ppsci INFO: 1D result is saved to ./output_quick_start_2/visual/epoch_0/u=sin(x).png
+ppsci INFO: [Visualize][Epoch 0] Finished visualization.
+```
+
+预测结果如下所示
+
+![u=sin(x) prediction](../images/quickstart/u_pred_case2.png)
+
+可以发现利用微分关系训练的模型仍然具备良好的预测能力。
diff --git a/mkdocs.yml b/mkdocs.yml
@@ -30,8 +30,9 @@ copyright: Copyright &copy; 2022 - 2023 PaddlePaddle
 nav:
   - PaddleScience:
       - 主页: index.md
-      - 功能介绍: overview.md
-      - 安装使用: install_setup.md
+      - 功能介绍: zh/overview.md
+      - 安装使用: zh/install_setup.md
+      - 快速开始: zh/quickstart.md
   - 经典案例:
       - PINNs:
         - ViV: zh/examples/viv.md