HabanaAI · czhu15 · Jun 23, 2025 · Jun 18, 2025
@@ -136,7 +136,7 @@ class EngineArgs:
     tokenizer_revision: Optional[str] = None
     quantization: Optional[str] = None
     enforce_eager: Optional[bool] = None
-    max_seq_len_to_capture: int = 8192
+    max_seq_len_to_capture: int = 4096
     disable_custom_all_reduce: bool = False
     tokenizer_pool_size: int = 0
     # Note: Specifying a tokenizer pool by passing a class