refactor: rename daa parallel dataclasses DistributedType the same as accelerate package

Tridu33 · Tridu33 · commit bbfdeb4bf600 · 2024-12-04T00:28:04.000+08:00
diff --git a/mindnlp/accelerate/accelerator.py b/mindnlp/accelerate/accelerator.py
@@ -105,20 +105,13 @@ def prepare(self, *args):
         """
         result = []
 
-        # Only support mindsormers and MULTI_NPU_DP now
+        # Only support mindsormers and MULTI_NPU now
         if self.distributed_type == DistributedType.MINDFORMERS:
             result = self._prepare_mindformers(*args)
-        elif self.distributed_type == DistributedType.MULTI_NPU_DP:
-            result = self._prepare_data_parallel_native_minspore(*args)
+        elif self.distributed_type == DistributedType.MULTI_NPU:
+            pass # nothing prepare for data parallel
         return result
 
-    def _prepare_data_parallel_native_minspore(self, *args):
-        # initialize data parallel for native mindspore
-        mindspore.set_context(mode=mindspore.GRAPH_MODE)
-        mindspore.set_auto_parallel_context(parallel_mode=mindspore.ParallelMode.DATA_PARALLEL, gradients_mean=True)
-        mindspore.communication.init()
-        mindspore.set_seed(numpy.random.seed())
-
     def _prepare_mindformers(self, *args):
         mindformers_plugin = self.state.mindformers_plugin
 
diff --git a/mindnlp/accelerate/state.py b/mindnlp/accelerate/state.py
@@ -347,9 +347,9 @@ def _prepare_backend(self):
         if accelerate_distributed_type == DistributedType.MINDFORMERS and is_mindformers_available():
             self.backend = "hccl"
             self.distributed_type = DistributedType.MINDFORMERS
-        elif accelerate_distributed_type == DistributedType.MULTI_NPU_DP:
+        elif accelerate_distributed_type == DistributedType.MULTI_NPU:
             self.backend = "hccl"
-            self.distributed_type = DistributedType.MULTI_NPU_DP
+            self.distributed_type = DistributedType.MULTI_NPU
             
     @num_processes.setter
     def num_processes(self, value):
@@ -372,8 +372,8 @@ def __init__(self, mindformers_plugin=None, **kwargs):
             PartialState(**kwargs)
         self.__dict__.update(PartialState._shared_state)
         # set distributed_type
-        if accelerate_distributed_type == DistributedType.MULTI_NPU_DP:
-            self.distributed_type = DistributedType.MULTI_NPU_DP
+        if accelerate_distributed_type == DistributedType.MULTI_NPU:
+            self.distributed_type = DistributedType.MULTI_NPU
         elif accelerate_distributed_type == DistributedType.MINDFORMERS:
             self.distributed_type = DistributedType.MINDFORMERS
             self.mindformers_plugin = mindformers_plugin
diff --git a/mindnlp/accelerate/utils/constants.py b/mindnlp/accelerate/utils/constants.py
@@ -1,7 +1,18 @@
 """constants"""
 import os
+import mindspore
+import numpy
 from .dataclasses import DistributedType
 
+
+def _prepare_data_parallel_native_minspore():
+    # initialize data parallel hcc backend for data_loader and Trainer API
+    mindspore.set_context(mode=mindspore.GRAPH_MODE)
+    mindspore.set_auto_parallel_context(parallel_mode=mindspore.ParallelMode.DATA_PARALLEL, gradients_mean=True)
+    mindspore.communication.init()
+    random_seed = numpy.random.randint(10000)
+    mindspore.set_seed(random_seed)
+    
 def detect_accelerate_distributed_type():
     """
     detect distributed_type
@@ -10,8 +21,9 @@ def detect_accelerate_distributed_type():
         _type_: According to the factors such as the available parallel software and hardware environment of the current system and the user-specified parallel scheme,
           the optimal parallel strategy is comprehensively decided in different situations.
     """
-    if os.environ.get("MULTI_NPU_DP", None) == "true": 
-        return DistributedType.MULTI_NPU_DP
+    if os.environ.get("MULTI_NPU", None) == "true": 
+        _prepare_data_parallel_native_minspore()
+        return DistributedType.MULTI_NPU
     if os.environ.get("ACCELERATE_USE_MINDFORMERS", "false") == "true": 
         return DistributedType.MINDFORMERS
     else:
diff --git a/mindnlp/accelerate/utils/dataclasses.py b/mindnlp/accelerate/utils/dataclasses.py
@@ -18,10 +18,10 @@ class DistributedType(str, enum.Enum):
     Values:
         - **MINDFORMERS** -- Using mindformers
         - **NO** -- Not a distributed environment, just a single process.
-        - **MULTI_NPU_DP** -- Distributed data parallel on multiple NPUs.
+        - **MULTI_NPU** -- Distributed data parallel on multiple NPUs.
     """
 
-    MULTI_NPU_DP = "MULTI_NPU_DP"
+    MULTI_NPU = "MULTI_NPU"
     MINDFORMERS = "MINDFORMERS"
     NO = "NO"
 
diff --git a/mindnlp/dataset/load.py b/mindnlp/dataset/load.py
@@ -335,7 +335,7 @@ def load_dataset(
         column_names = list(raw_ds.features.keys())
         source = TransferDataset(raw_ds, column_names) if isinstance(raw_ds, Dataset) \
             else TransferIterableDataset(raw_ds, column_names)
-        if accelerate_distributed_type == DistributedType.MULTI_NPU_DP:
+        if accelerate_distributed_type == DistributedType.MULTI_NPU:
             ms_ds = GeneratorDataset(source=source, 
             column_names=column_names, 
             shuffle=shuffle,