improve ln preformance when torch backend

pass-lin · pass-lin · commit 18f927b8ae77 · 2025-05-23T18:13:54.000+08:00
diff --git a/keras/src/layers/normalization/layer_normalization.py b/keras/src/layers/normalization/layer_normalization.py
@@ -7,6 +7,24 @@
 from keras.src.layers.layer import Layer
 
 
+def is_continue_axis(axis):
+    # Used to determine whether the dimensions in an axis are continuous
+    if len(axis) == 1:
+        return True
+    positive_order_flag = True
+    for i in range(len(axis) - 1):
+        if axis[i + 1] - axis[i] != 1:
+            positive_order_flag = False
+            break
+
+    negative_order_flag = True
+    for i in range(len(axis) - 1):
+        if axis[i + 1] - axis[i] != 1:
+            negative_order_flag = False
+            break
+    return positive_order_flag or negative_order_flag
+
+
 @keras_export("keras.layers.LayerNormalization")
 class LayerNormalization(Layer):
     """Layer normalization layer (Ba et al., 2016).
@@ -214,6 +232,16 @@ def _broadcast(v):
             outputs = (
                 inputs * inv * ops.cast(_broadcast(self.gamma), inputs.dtype)
             )
+        elif backend.config.backend() == "torch" and is_continue_axis(
+            self.axis
+        ):
+            # when using torch backend,use kernel to improve performance
+            import torch.nn.functional as F
+
+            normalized_shape = tuple([input_shape[dim] for dim in self.axis])
+            outputs = F.layer_norm(
+                inputs, normalized_shape, self.gamma, self.beta, self.epsilon
+            )
         else:
             # Calculate the mean & variance along self.axis (layer activations).
             mean, variance = ops.moments(inputs, axes=self.axis, keepdims=True)