PaddlePaddle
diff --git a/‎examples/fourcastnet/sample_data.py
Lines changed: 3 additions & 4 deletions b/‎examples/fourcastnet/sample_data.py
Lines changed: 3 additions & 4 deletions
diff --git a/‎examples/fourcastnet/train_finetune.py
Lines changed: 17 additions & 19 deletions b/‎examples/fourcastnet/train_finetune.py
Lines changed: 17 additions & 19 deletions
diff --git a/‎examples/fourcastnet/train_precip.py
Lines changed: 9 additions & 11 deletions b/‎examples/fourcastnet/train_precip.py
Lines changed: 9 additions & 11 deletions
diff --git a/‎examples/fourcastnet/train_pretrain.py
Lines changed: 0 additions & 2 deletions b/‎examples/fourcastnet/train_pretrain.py
Lines changed: 0 additions & 2 deletions
diff --git a/‎ppsci/arch/afno.py
Lines changed: 12 additions & 26 deletions b/‎ppsci/arch/afno.py
Lines changed: 12 additions & 26 deletions
diff --git a/‎ppsci/data/dataset/era5_dataset.py
Lines changed: 11 additions & 14 deletions b/‎ppsci/data/dataset/era5_dataset.py
Lines changed: 11 additions & 14 deletions
@@ -21,8 +21,7 @@
 from typing import Tuple
 
 import h5py
-import numpy as np
-from paddle.io import DistributedBatchSampler
+from paddle import io
 from tqdm import tqdm
 
 import examples.fourcastnet.utils as fourcast_utils
@@ -35,7 +34,7 @@ def sample_func(
 ):
     dataset = ppsci.data.dataset.build_dataset(dataset_cfg)
     for idx in tqdm(batch_idxs):
-        input_dict, label_dict, weight_dict = dataset.getitem(idx)
+        input_dict, label_dict, weight_dict = dataset[idx]
         fdest = h5py.File(f"{save_path}/{idx:0>8d}.h5", "w")
         for key, value in input_dict.items():
             fdest.create_dataset(f"input_dict/{key}", data=value, dtype="f")
@@ -99,7 +98,7 @@ def sample_data_epoch(epoch: int):
     }
     dataset = ppsci.data.dataset.build_dataset(dataset_cfg)
 
-    batch_sampler = DistributedBatchSampler(
+    batch_sampler = io.DistributedBatchSampler(
         dataset=dataset,
         batch_size=1,
         shuffle=False,
 
@@ -12,7 +12,7 @@
 # See the License for the specific language governing permissions and
 # limitations under the License.
 
-from functools import partial
+import functools
 from typing import Tuple
 
 import h5py
@@ -70,9 +70,9 @@ def get_vis_datas(
     DATA_TIME_MEAN_PATH = "./datasets/era5/stat/time_means.npy"
 
     # set training hyper-parameters
-    num_timestamps = 2
+    NUM_TIMESTAMPS = 2
     input_keys = ("input",)
-    output_keys = tuple([f"output_{i}" for i in range(num_timestamps)])
+    output_keys = tuple([f"output_{i}" for i in range(NUM_TIMESTAMPS)])
     IMG_H, IMG_W = 720, 1440
     EPOCHS = 50 if not args.epochs else args.epochs
     # FourCastNet use 20 atmospheric variable，their index in the dataset is from 0 to 19.
@@ -113,7 +113,7 @@ def get_vis_datas(
             "input_keys": input_keys,
             "label_keys": output_keys,
             "vars_channel": VARS_CHANNEL,
-            "num_label_timestamps": num_timestamps,
+            "num_label_timestamps": NUM_TIMESTAMPS,
             "transforms": transforms,
         },
         "sampler": {
@@ -144,7 +144,7 @@ def get_vis_datas(
             "label_keys": output_keys,
             "vars_channel": VARS_CHANNEL,
             "transforms": transforms,
-            "num_label_timestamps": num_timestamps,
+            "num_label_timestamps": NUM_TIMESTAMPS,
             "training": False,
         },
         "sampler": {
@@ -182,7 +182,7 @@ def get_vis_datas(
     validator = {sup_validator.name: sup_validator}
 
     # set model
-    model = ppsci.arch.AFNONet(input_keys, output_keys, num_timestamps=num_timestamps)
+    model = ppsci.arch.AFNONet(input_keys, output_keys, num_timestamps=NUM_TIMESTAMPS)
 
     # init optimizer and lr scheduler
     lr_scheduler = ppsci.optimizer.lr_scheduler.Cosine(
@@ -203,7 +203,6 @@ def get_vis_datas(
         EPOCHS,
         ITERS_PER_EPOCH,
         eval_during_train=True,
-        log_freq=1,
         validator=validator,
         pretrained_model_path=PRETRAINED_MODEL_PATH,
         compute_metric_by_batch=True,
@@ -215,18 +214,18 @@ def get_vis_datas(
     solver.eval()
 
     # set testing hyper-parameters
-    num_timestamps = 32
-    output_keys = tuple([f"output_{i}" for i in range(num_timestamps)])
+    NUM_TIMESTAMPS = 32
+    output_keys = tuple([f"output_{i}" for i in range(NUM_TIMESTAMPS)])
 
     # set model for testing
-    model = ppsci.arch.AFNONet(input_keys, output_keys, num_timestamps=num_timestamps)
+    model = ppsci.arch.AFNONet(input_keys, output_keys, num_timestamps=NUM_TIMESTAMPS)
 
     # update eval dataloader config
     eval_dataloader_cfg["dataset"].update(
         {
             "file_path": TEST_FILE_PATH,
             "label_keys": output_keys,
-            "num_label_timestamps": num_timestamps,
+            "num_label_timestamps": NUM_TIMESTAMPS,
             "stride": 8,
         }
     )
@@ -245,7 +244,7 @@ def get_vis_datas(
     vis_datas = get_vis_datas(
         TEST_FILE_PATH,
         DATE_STRINGS,
-        num_timestamps,
+        NUM_TIMESTAMPS,
         VARS_CHANNEL,
         IMG_H,
         data_mean,
@@ -257,16 +256,16 @@ def output_wind_func(d, var_name, data_mean, data_std):
         wind_data = []
         for i in range(output.shape[0]):
             wind_data.append((output[i][0] ** 2 + output[i][1] ** 2) ** 0.5)
-        return paddle.to_tensor(wind_data)
+        return paddle.to_tensor(wind_data, paddle.get_default_dtype())
 
     vis_output_expr = {}
-    for i in range(num_timestamps):
+    for i in range(NUM_TIMESTAMPS):
         hour = (i + 1) * 6
-        vis_output_expr[f"output_{hour}h"] = partial(
+        vis_output_expr[f"output_{hour}h"] = functools.partial(
             output_wind_func,
             var_name=f"output_{i}",
-            data_mean=paddle.to_tensor(data_mean),
-            data_std=paddle.to_tensor(data_std),
+            data_mean=paddle.to_tensor(data_mean, paddle.get_default_dtype()),
+            data_std=paddle.to_tensor(data_std, paddle.get_default_dtype()),
         )
         vis_output_expr[f"target_{hour}h"] = lambda d, hour=hour: d[f"target_{hour}h"]
     # set visualizer
@@ -282,7 +281,7 @@ def output_wind_func(d, var_name, data_mean, data_std):
             vmax=25,
             colorbar_label="m\s",
             batch_size=1,
-            num_timestamps=num_timestamps,
+            num_timestamps=NUM_TIMESTAMPS,
             prefix="wind",
         )
     }
@@ -292,7 +291,6 @@ def output_wind_func(d, var_name, data_mean, data_std):
     solver = ppsci.solver.Solver(
         model,
         output_dir=OUTPUT_DIR,
-        log_freq=1,
         validator=validator,
         visualizer=visualizer,
         pretrained_model_path=f"{OUTPUT_DIR}/checkpoints/latest",
 
@@ -12,7 +12,7 @@
 # See the License for the specific language governing permissions and
 # limitations under the License.
 
-from functools import partial
+import functools
 from typing import Tuple
 
 import h5py
@@ -208,7 +208,6 @@ def get_vis_datas(
         EPOCHS,
         ITERS_PER_EPOCH,
         eval_during_train=True,
-        log_freq=1,
         validator=validator,
         compute_metric_by_batch=True,
         eval_with_no_grad=True,
@@ -219,12 +218,12 @@ def get_vis_datas(
     solver.eval()
 
     # set testing hyper-parameters
-    num_timestamps = 6
-    output_keys = tuple([f"output_{i}" for i in range(num_timestamps)])
+    NUM_TIMESTAMPS = 6
+    output_keys = tuple([f"output_{i}" for i in range(NUM_TIMESTAMPS)])
 
     # set model for testing
     model = ppsci.arch.PrecipNet(
-        input_keys, output_keys, num_timestamps=num_timestamps, wind_model=wind_model
+        input_keys, output_keys, num_timestamps=NUM_TIMESTAMPS, wind_model=wind_model
     )
 
     # update eval dataloader config
@@ -233,7 +232,7 @@ def get_vis_datas(
             "file_path": WIND_TEST_FILE_PATH,
             "label_keys": output_keys,
             "precip_file_path": TEST_FILE_PATH,
-            "num_label_timestamps": num_timestamps,
+            "num_label_timestamps": NUM_TIMESTAMPS,
             "stride": 8,
         }
     )
@@ -253,7 +252,7 @@ def get_vis_datas(
         WIND_TEST_FILE_PATH,
         TEST_FILE_PATH,
         DATE_STRINGS,
-        num_timestamps,
+        NUM_TIMESTAMPS,
         VARS_CHANNEL,
         IMG_H,
         wind_data_mean,
@@ -265,9 +264,9 @@ def output_precip_func(d, var_name):
         return output
 
     visu_output_expr = {}
-    for i in range(num_timestamps):
+    for i in range(NUM_TIMESTAMPS):
         hour = (i + 1) * 6
-        visu_output_expr[f"output_{hour}h"] = partial(
+        visu_output_expr[f"output_{hour}h"] = functools.partial(
             output_precip_func,
             var_name=f"output_{i}",
         )
@@ -288,7 +287,7 @@ def output_precip_func(d, var_name):
             colorbar_label="mm",
             log_norm=True,
             batch_size=1,
-            num_timestamps=num_timestamps,
+            num_timestamps=NUM_TIMESTAMPS,
             prefix="precip",
         )
     }
@@ -298,7 +297,6 @@ def output_precip_func(d, var_name):
     solver = ppsci.solver.Solver(
         model,
         output_dir=OUTPUT_DIR,
-        log_freq=1,
         validator=validator,
         visualizer=visualizer,
         pretrained_model_path=f"{OUTPUT_DIR}/checkpoints/latest",
 
@@ -182,7 +182,6 @@
         EPOCHS,
         ITERS_PER_EPOCH,
         eval_during_train=True,
-        log_freq=1,
         validator=validator,
         compute_metric_by_batch=True,
         eval_with_no_grad=True,
@@ -198,7 +197,6 @@
         model,
         constraint,
         OUTPUT_DIR,
-        log_freq=1,
         validator=validator,
         pretrained_model_path=f"{OUTPUT_DIR}/checkpoints/latest",
         compute_metric_by_batch=True,
 
@@ -175,45 +175,31 @@ def __init__(
         self.hidden_size_factor = hidden_size_factor
         self.scale = scale
 
-        w1 = self.scale * paddle.randn(
-            (
+        self.w1 = self.create_parameter(
+            shape=(
                 2,
                 self.num_blocks,
                 self.block_size,
                 self.block_size * self.hidden_size_factor,
-            )
-        )
-        self.w1 = self.create_parameter(
-            shape=w1.shape,
-            dtype=w1.dtype,
-            default_initializer=nn.initializer.Assign(w1),
-        )
-        b1 = self.scale * paddle.randn(
-            (2, self.num_blocks, self.block_size * self.hidden_size_factor)
+            ),
+            default_initializer=nn.initializer.Normal(std=self.scale),
         )
         self.b1 = self.create_parameter(
-            shape=b1.shape,
-            dtype=b1.dtype,
-            default_initializer=nn.initializer.Assign(b1),
+            shape=(2, self.num_blocks, self.block_size * self.hidden_size_factor),
+            default_initializer=nn.initializer.Normal(std=self.scale),
         )
-        w2 = self.scale * paddle.randn(
-            (
+        self.w2 = self.create_parameter(
+            shape=(
                 2,
                 self.num_blocks,
                 self.block_size * self.hidden_size_factor,
                 self.block_size,
-            )
-        )
-        self.w2 = self.create_parameter(
-            shape=w2.shape,
-            dtype=w2.dtype,
-            default_initializer=paddle.nn.initializer.Assign(w2),
+            ),
+            default_initializer=nn.initializer.Normal(std=self.scale),
         )
-        b2 = self.scale * paddle.randn((2, self.num_blocks, self.block_size))
         self.b2 = self.create_parameter(
-            shape=b2.shape,
-            dtype=b2.dtype,
-            default_initializer=paddle.nn.initializer.Assign(b2),
+            shape=(2, self.num_blocks, self.block_size),
+            default_initializer=nn.initializer.Normal(std=self.scale),
         )
 
     def forward(self, x):
 
@@ -83,8 +83,8 @@ def __init__(
 
         self.files = self.read_data(file_path)
         self.n_years = len(self.files)
-        self.n_samples_per_year = self.files[0].shape[0]
-        self.n_samples_total = self.n_years * self.n_samples_per_year
+        self.num_samples_per_year = self.files[0].shape[0]
+        self.num_samples = self.n_years * self.num_samples_per_year
         if self.precip_file_path is not None:
             self.precip_files = self.read_data(precip_file_path, "tp")
 
@@ -98,17 +98,17 @@ def read_data(self, path: str, var="fields"):
         return files
 
     def __len__(self):
-        return self.n_samples_total // self.stride
+        return self.num_samples // self.stride
 
     def __getitem__(self, global_idx):
         global_idx *= self.stride
-        year_idx = global_idx // self.n_samples_per_year
-        local_idx = global_idx % self.n_samples_per_year
-        step = 0 if local_idx >= self.n_samples_per_year - 1 else 1
+        year_idx = global_idx // self.num_samples_per_year
+        local_idx = global_idx % self.num_samples_per_year
+        step = 0 if local_idx >= self.num_samples_per_year - 1 else 1
 
         if self.num_label_timestamps > 1:
-            if local_idx >= self.n_samples_per_year - self.num_label_timestamps:
-                local_idx = self.n_samples_per_year - self.num_label_timestamps - 1
+            if local_idx >= self.num_samples_per_year - self.num_label_timestamps:
+                local_idx = self.num_samples_per_year - self.num_label_timestamps - 1
 
         input_file = self.files[year_idx]
         label_file = (
@@ -118,7 +118,7 @@ def __getitem__(self, global_idx):
         )
         if self.precip_file_path is not None and year_idx == 0 and self.training:
             # first year has 2 missing samples in precip (they are first two time points)
-            lim = self.n_samples_per_year - 2
+            lim = self.num_samples_per_year - 2
             local_idx = local_idx % lim
             step = 0 if local_idx >= lim - 1 else 1
             input_idx = local_idx + 2
@@ -154,9 +154,6 @@ def __getitem__(self, global_idx):
 
         return input_item, label_item, weight_item
 
-    def getitem(self, global_idx):
-        return self.__getitem__(global_idx)
-
 
 class ERA5SampledDataset(io.Dataset):
     """Class for ERA5 sampled dataset.
@@ -198,7 +195,7 @@ def __init__(
         self.transforms = transforms
 
         self.files = self.read_data(file_path)
-        self.n_samples_total = len(self.files)
+        self.num_samples = len(self.files)
 
     def read_data(self, path: str):
         paths = glob.glob(path + "/*.h5")
@@ -210,7 +207,7 @@ def read_data(self, path: str):
         return files
 
     def __len__(self):
-        return self.n_samples_total
+        return self.num_samples
 
     def __getitem__(self, global_idx):
         _file = self.files[global_idx]