optimize code

HydrogenSulfate · HydrogenSulfate · commit 02d5fd2cdbb8 · 2023-05-23T01:58:52.000+08:00
diff --git a/ppsci/solver/solver.py b/ppsci/solver/solver.py
@@ -29,6 +29,7 @@
 import visualdl as vdl
 from packaging import version
 from paddle import amp
+from paddle import jit
 from paddle import nn
 from paddle import optimizer as optim
 from paddle.distributed import fleet
@@ -218,6 +219,11 @@ def __init__(
         # choosing an appropriate training function for different optimizers
         if isinstance(self.optimizer, optim.LBFGS):
             self.train_epoch_func = ppsci.solver.train.train_LBFGS_epoch_func
+            if self.update_freq != 1:
+                self.update_freq = 1
+                logger.warning(
+                    f"Set update_freq from {self.update_freq} to 1 when using L-BFGS optimizer."
+                )
         else:
             self.train_epoch_func = ppsci.solver.train.train_epoch_func
 
@@ -511,11 +517,11 @@ def export(self):
 
         input_spec = copy.deepcopy(self.cfg["Export"]["input_shape"])
         config.replace_shape_with_inputspec_(input_spec)
-        static_model = paddle.jit.to_static(self.model, input_spec=input_spec)
+        static_model = jit.to_static(self.model, input_spec=input_spec)
 
         export_dir = self.cfg["Global"]["save_inference_dir"]
         save_path = os.path.join(export_dir, "inference")
-        paddle.jit.save(static_model, save_path)
+        jit.save(static_model, save_path)
         logger.info(f"The inference model has been exported to {export_dir}")
 
     def autocast_context_manager(self) -> contextlib.AbstractContextManager:
diff --git a/ppsci/solver/train.py b/ppsci/solver/train.py
@@ -34,7 +34,7 @@ def train_epoch_func(solver, epoch_id: int, log_freq: int):
         total_loss = 0
         loss_dict = misc.Prettydefaultdict(float)
         loss_dict["loss"] = 0.0
-        total_batch_size = []
+        total_batch_size = 0
         reader_cost = 0
         batch_cost = 0
         reader_tic = time.perf_counter()
@@ -48,7 +48,7 @@ def train_epoch_func(solver, epoch_id: int, log_freq: int):
                 for key in solver.train_time_info:
                     solver.train_time_info[key].reset()
             reader_cost += time.perf_counter() - reader_tic
-            total_batch_size.append(next(iter(input_dict.values())).shape[0])
+            total_batch_size += next(iter(input_dict.values())).shape[0]
 
             for v in input_dict.values():
                 v.stop_gradient = False
@@ -80,21 +80,20 @@ def train_epoch_func(solver, epoch_id: int, log_freq: int):
             if iter_id % solver.update_freq == 0:
                 solver.scaler.minimize(solver.optimizer, total_loss_scaled)
                 solver.optimizer.clear_grad()
-                if solver.lr_scheduler is not None and not solver.lr_scheduler.by_epoch:
-                    solver.lr_scheduler.step()
         else:
             total_loss.backward()
             if iter_id % solver.update_freq == 0:
                 solver.optimizer.step()
                 solver.optimizer.clear_grad()
-                if solver.lr_scheduler is not None and not solver.lr_scheduler.by_epoch:
-                    solver.lr_scheduler.step()
+
+        # update learning rate by step
+        if solver.lr_scheduler is not None and not solver.lr_scheduler.by_epoch:
+            solver.lr_scheduler.step()
 
         batch_cost += time.perf_counter() - batch_tic
 
         # update and log training information
         solver.global_step += 1
-        total_batch_size = sum(total_batch_size)
         solver.train_time_info["reader_cost"].update(reader_cost)
         solver.train_time_info["batch_cost"].update(batch_cost)
         printer.update_train_loss(solver, loss_dict, total_batch_size)
@@ -117,23 +116,26 @@ def train_LBFGS_epoch_func(solver, epoch_id: int, log_freq: int):
     for iter_id in range(1, solver.iters_per_epoch + 1):
         loss_dict = misc.Prettydefaultdict(float)
         loss_dict["loss"] = 0.0
-        total_batch_size = []
+        total_batch_size = 0
         reader_cost = 0
         batch_cost = 0
         reader_tic = time.perf_counter()
 
-        input_dict_list = []
-        label_dict_list = []
-        weight_dict_list = []
+        input_dicts = []
+        label_dicts = []
+        weight_dicts = []
         for _, _constraint in solver.constraint.items():
             input_dict, label_dict, weight_dict = next(_constraint.data_iter)
             reader_cost += time.perf_counter() - reader_tic
             for v in input_dict.values():
                 v.stop_gradient = False
-            input_dict_list.append(input_dict)
-            label_dict_list.append(label_dict)
-            weight_dict_list.append(weight_dict)
-            total_batch_size.append(next(iter(input_dict.values())).shape[0])
+
+            # gather all constraint data into list
+            input_dicts.append(input_dict)
+            label_dicts.append(label_dict)
+            weight_dicts.append(weight_dict)
+            total_batch_size += next(iter(input_dict.values())).shape[0]
+            reader_tic = time.perf_counter()
 
         def closure():
             """Forward-backward closure function for LBFGS optimizer.
@@ -147,13 +149,14 @@ def closure():
                     _constraint.input_keys, _constraint.output_keys, solver.model
                 )
                 for output_name, output_formula in _constraint.output_expr.items():
-                    evaluator.add_target_expr(output_formula, output_name)
+                    if output_name in label_dict:
+                        evaluator.add_target_expr(output_formula, output_name)
 
                 # forward for every batched data dict
                 with solver.autocast_context_manager():
-                    output_dict_i = evaluator(input_dict_list[i])
+                    output_dict_i = evaluator(input_dicts[i])
                     constraint_loss = _constraint.loss(
-                        output_dict_i, label_dict_list[i], weight_dict_list[i]
+                        output_dict_i, label_dicts[i], weight_dicts[i]
                     )
                     total_loss += constraint_loss
 
@@ -165,8 +168,6 @@ def closure():
 
             return total_loss
 
-        reader_tic = time.perf_counter()
-
         solver.optimizer.step(closure)
         if solver.lr_scheduler is not None and not solver.lr_scheduler.by_epoch:
             solver.lr_scheduler.step()
@@ -175,7 +176,6 @@ def closure():
 
         # update and log training information
         solver.global_step += 1
-        total_batch_size = sum(total_batch_size)
         solver.train_time_info["reader_cost"].update(reader_cost)
         solver.train_time_info["batch_cost"].update(batch_cost)
         printer.update_train_loss(solver, loss_dict, total_batch_size)
diff --git a/ppsci/utils/misc.py b/ppsci/utils/misc.py
@@ -157,7 +157,7 @@ def combine_array_with_time(x, t):
     return tx
 
 
-def set_random_seed(seed):
+def set_random_seed(seed: int):
     paddle.seed(seed)
     np.random.seed(seed)
     random.seed(seed)