mindspore-lab
diff --git a/‎mindnlp/peft/__init__.py
Lines changed: 1 addition & 1 deletion b/‎mindnlp/peft/__init__.py
Lines changed: 1 addition & 1 deletion
diff --git a/‎mindnlp/peft/peft_model.py
Lines changed: 105 additions & 0 deletions b/‎mindnlp/peft/peft_model.py
Lines changed: 105 additions & 0 deletions
diff --git a/‎mindnlp/sentence/models/__init__.py
Lines changed: 4 additions & 2 deletions b/‎mindnlp/sentence/models/__init__.py
Lines changed: 4 additions & 2 deletions
diff --git a/‎mindnlp/sentence/models/normalize.py
Lines changed: 21 additions & 0 deletions b/‎mindnlp/sentence/models/normalize.py
Lines changed: 21 additions & 0 deletions
@@ -24,7 +24,7 @@
 from .peft_model import (
     PeftModel,
     PeftModelForCausalLM,
-    # PeftModelForFeatureExtraction,
+    PeftModelForFeatureExtraction,
     # PeftModelForQuestionAnswering,
     PeftModelForSeq2SeqLM,
     PeftModelForSequenceClassification,
 
@@ -1095,3 +1095,108 @@ def _prefix_tuning_forward(
 
             output = (logits,) + outputs[2:]
             return ((loss,) + output) if loss is not None else output
+
+
+class PeftModelForFeatureExtraction(PeftModel):
+    """
+    Peft model for extracting features/embeddings from transformer models
+
+    Args:
+        model ([`~transformers.PreTrainedModel`]): Base transformer model.
+        peft_config ([`PeftConfig`]): Peft config.
+        adapter_name (`str`,  *optional*): The name of the adapter, defaults to `"default"`.
+        autocast_adapter_dtype (`bool`, *optional*):
+            Whether to autocast the adapter dtype. Defaults to `True`. Right now, this will only cast adapter weights
+            using float16 and bfloat16 to float32, as this is typically required for stable training, and only affect
+            select PEFT tuners.
+
+    **Attributes**:
+        - **config** ([`~transformers.PretrainedConfig`]) -- The configuration object of the base model.
+
+    Example:
+
+        ```py
+        >>> from transformers import AutoModel
+        >>> from peft import PeftModelForFeatureExtraction, get_peft_config
+
+        >>> config = {
+        ...     "peft_type": "LORA",
+        ...     "task_type": "FEATURE_EXTRACTION",
+        ...     "inference_mode": False,
+        ...     "r": 16,
+        ...     "target_modules": ["query", "value"],
+        ...     "lora_alpha": 32,
+        ...     "lora_dropout": 0.05,
+        ...     "fan_in_fan_out": False,
+        ...     "bias": "none",
+        ... }
+        >>> peft_config = get_peft_config(config)
+        >>> model = AutoModel.from_pretrained("bert-base-cased")
+        >>> peft_model = PeftModelForFeatureExtraction(model, peft_config)
+        >>> peft_model.print_trainable_parameters()
+        ```
+    """
+
+    def __init__(self, model: nn.Module, peft_config: PeftConfig, adapter_name: str = "default", **kwargs):
+        super().__init__(model, peft_config, adapter_name, **kwargs)
+
+    def forward(
+        self,
+        input_ids=None,
+        attention_mask=None,
+        inputs_embeds=None,
+        output_attentions=None,
+        output_hidden_states=None,
+        return_dict=None,
+        task_ids=None,
+        **kwargs,
+    ):
+        peft_config = self.active_peft_config
+        if not peft_config.is_prompt_learning:
+            if peft_config.peft_type == PeftType.POLY:
+                kwargs["task_ids"] = task_ids
+
+            with self._enable_peft_forward_hooks(**kwargs):
+                kwargs = {k: v for k, v in kwargs.items() if k not in self.special_peft_forward_args}
+                return self.base_model(
+                    input_ids=input_ids,
+                    attention_mask=attention_mask,
+                    inputs_embeds=inputs_embeds,
+                    output_attentions=output_attentions,
+                    output_hidden_states=output_hidden_states,
+                    return_dict=return_dict,
+                    **kwargs,
+                )
+
+        batch_size = _get_batch_size(input_ids, inputs_embeds)
+        if attention_mask is not None:
+            # concat prompt attention mask
+            prefix_attention_mask = ops.ones(batch_size, peft_config.num_virtual_tokens)
+            attention_mask = ops.cat((prefix_attention_mask, attention_mask), dim=1)
+
+        if kwargs.get("position_ids", None) is not None:
+            warnings.warn("Position ids are not supported for parameter efficient tuning. Ignoring position ids.")
+            kwargs["position_ids"] = None
+        if kwargs.get("token_type_ids", None) is not None:
+            warnings.warn("Token type ids are not supported for parameter efficient tuning. Ignoring token type ids")
+            kwargs["token_type_ids"] = None
+        kwargs.update(
+            {
+                "attention_mask": attention_mask,
+                "output_attentions": output_attentions,
+                "output_hidden_states": output_hidden_states,
+                "return_dict": return_dict,
+            }
+        )
+
+        if peft_config.peft_type == PeftType.PREFIX_TUNING:
+            # overwrite past_kv in kwargs
+            kwargs["past_key_values"] = self.get_prompt(batch_size)
+            return self.base_model(input_ids=input_ids, **kwargs)
+        else:
+            if inputs_embeds is None:
+                inputs_embeds = self.word_embeddings(input_ids)
+            prompts = self.get_prompt(batch_size=batch_size)
+            prompts = prompts.to(inputs_embeds.dtype)
+            inputs_embeds = ops.cat((prompts, inputs_embeds), dim=1)
+            return self.base_model(inputs_embeds=inputs_embeds, **kwargs)
@@ -16,8 +16,10 @@
 
 from .transformer import Transformer
 from .pooling import Pooling
+from .normalize import Normalize
 
 __all__ = [
-    "transformer",
-    "pooling",
+    "Transformer",
+    "Pooling",
+    "Normalize",
 ]
@@ -0,0 +1,21 @@
+"""normalize model"""
+from __future__ import annotations
+
+from mindspore import Tensor
+from mindnlp.core.nn import functional as F
+from mindnlp.core import nn
+
+
+class Normalize(nn.Module):
+    """This layer normalizes embeddings to unit length"""
+
+    def forward(self, features: dict[str, Tensor]) -> dict[str, Tensor]:
+        features.update({"sentence_embedding": F.normalize(features["sentence_embedding"], p=2, dim=1)})
+        return features
+
+    def save(self, output_path) -> None:
+        pass
+
+    @staticmethod
+    def load(input_path) -> Normalize:
+        return Normalize()