Kiln-AI · scosman · May 1, 2025 · Apr 22, 2025 · Apr 24, 2025 · Apr 25, 2025
diff --git a/app/desktop/studio_server/finetune_api.py b/app/desktop/studio_server/finetune_api.py
@@ -8,27 +8,26 @@
 from kiln_ai.adapters.fine_tune.dataset_formatter import DatasetFormat, DatasetFormatter
 from kiln_ai.adapters.fine_tune.finetune_registry import finetune_registry
 from kiln_ai.adapters.ml_model_list import (
+    KilnModel,
+    KilnModelProvider,
+    ModelParserID,
     ModelProviderName,
     built_in_models,
 )
 from kiln_ai.adapters.prompt_builders import (
     chain_of_thought_prompt,
     prompt_builder_from_id,
 )
-from kiln_ai.adapters.provider_tools import (
-    provider_enabled,
-    provider_name_from_id,
-)
+from kiln_ai.adapters.provider_tools import provider_enabled, provider_name_from_id
 from kiln_ai.datamodel import (
     DatasetSplit,
     Finetune,
     FinetuneDataStrategy,
     FineTuneStatusType,
     Task,
 )
-from kiln_ai.datamodel.dataset_filters import (
-    DatasetFilterId,
-)
+from kiln_ai.datamodel.datamodel_enums import THINKING_DATA_STRATEGIES
+from kiln_ai.datamodel.dataset_filters import DatasetFilterId
 from kiln_ai.datamodel.dataset_split import (
     AllSplitDefinition,
     Train60Test20Val20SplitDefinition,
@@ -38,7 +37,7 @@
 from kiln_ai.utils.config import Config
 from kiln_ai.utils.name_generator import generate_memorable_name
 from kiln_server.task_api import task_from_id
-from pydantic import BaseModel
+from pydantic import BaseModel, Field, model_validator
 
 logger = logging.getLogger(__name__)
 
@@ -48,6 +47,12 @@ class FinetuneProviderModel(BaseModel):
 
     name: str
     id: str
+    data_strategies_supported: list[FinetuneDataStrategy] = Field(
+        default_factory=lambda: [
+            FinetuneDataStrategy.final_only,
+            FinetuneDataStrategy.final_and_intermediate,
+        ]
+    )
 
 
 class FinetuneProvider(BaseModel):
@@ -101,6 +106,16 @@ class CreateFinetuneRequest(BaseModel):
     custom_thinking_instructions: str | None = None
     data_strategy: FinetuneDataStrategy
 
+    @model_validator(mode="after")
+    def validate_data_strategy(self) -> "CreateFinetuneRequest":
+        if self.data_strategy not in infer_data_strategies_for_model(
+            built_in_models, self.base_model_id, self.provider
+        ):
+            raise ValueError(
+                f"The data strategy {self.data_strategy} is not supported for the provider model {self.base_model_id}"
+            )
+        return self
+
 
 class FinetuneWithStatus(BaseModel):
     """Finetune with status"""
@@ -198,7 +213,8 @@ async def finetune_providers() -> list[FinetuneProvider]:
                         provider_models[provider.name] = []
                     provider_models[provider.name].append(
                         FinetuneProviderModel(
-                            name=model.friendly_name, id=provider.provider_finetune_id
+                            name=model.friendly_name,
+                            id=provider.provider_finetune_id,
                         )
                     )
 
@@ -212,14 +228,19 @@ async def finetune_providers() -> list[FinetuneProvider]:
         # Create provider entries
         providers: list[FinetuneProvider] = []
         for provider_name, models in provider_models.items():
-            providers.append(
-                FinetuneProvider(
-                    name=provider_name_from_id(provider_name),
-                    id=provider_name,
-                    enabled=await provider_enabled(provider_name),
-                    models=models,
+            # attach the compatible data strategies to each model
+            for model in models:
+                model.data_strategies_supported = infer_data_strategies_for_model(
+                    built_in_models, model.id, provider_name
                 )
+
+            provider = FinetuneProvider(
+                name=provider_name_from_id(provider_name),
+                id=provider_name,
+                enabled=await provider_enabled(provider_name),
+                models=models,
             )
+            providers.append(provider)
 
         return providers
 
@@ -326,6 +347,7 @@ async def download_dataset_jsonl(
                 status_code=400,
                 detail=f"Data strategy '{data_strategy}' not found",
             )
+
         data_strategy_typed = FinetuneDataStrategy(data_strategy)
 
         task = task_from_id(project_id, task_id)
@@ -406,7 +428,7 @@ def thinking_instructions_from_request(
     data_strategy: FinetuneDataStrategy,
     custom_thinking_instructions: str | None,
 ) -> str | None:
-    if data_strategy != FinetuneDataStrategy.final_and_intermediate:
+    if data_strategy not in THINKING_DATA_STRATEGIES:
         # Not using COT/Thinking style
         return None
 
@@ -477,3 +499,52 @@ async def fetch_fireworks_finetune_models() -> list[FinetuneProviderModel]:
             )
 
     return tuneable_models
+
+
+DEFAULT_DATA_STRATEGIES = [
+    FinetuneDataStrategy.final_only,
+    FinetuneDataStrategy.final_and_intermediate,
+]
+
+
+def data_strategies_from_model_provider(
+    provider: KilnModelProvider,
+) -> list[FinetuneDataStrategy]:
+    if provider.parser == ModelParserID.r1_thinking:
+        return [
+            FinetuneDataStrategy.final_and_intermediate_r1_compatible,
+        ]
+    return DEFAULT_DATA_STRATEGIES
+
+
+def data_strategies_from_finetune_id(
+    provider_finetune_id: str,
+) -> list[FinetuneDataStrategy]:
+    r1_must_include = ["r1", "qwq"]
+    if any(substring in provider_finetune_id.lower() for substring in r1_must_include):
+        return [
+            FinetuneDataStrategy.final_and_intermediate_r1_compatible,
+        ]
+    return DEFAULT_DATA_STRATEGIES
+
+
+def infer_data_strategies_for_model(
+    available_models: list[KilnModel],
+    provider_finetune_id: str,
+    provider_name: str,
+) -> list[FinetuneDataStrategy]:
+    # we don't have built-in models for fireworks models, so we infer the data strategy from the model name
+    if provider_name == ModelProviderName.fireworks_ai:
+        return data_strategies_from_finetune_id(provider_finetune_id)
+
+    # where we have built-in models, we can infer the data strategy from the object itself
+    for model in available_models:
+        for provider in model.providers:
+            if (
+                provider.name == provider_name
+                and provider.provider_finetune_id == provider_finetune_id
+            ):
+                return data_strategies_from_model_provider(provider)
+
+    # for everything else, we don't know what the data strategy is, so we use the default
+    return DEFAULT_DATA_STRATEGIES
diff --git a/app/desktop/studio_server/test_finetune_api.py b/app/desktop/studio_server/test_finetune_api.py
@@ -8,7 +8,15 @@
 from fastapi.testclient import TestClient
 from kiln_ai.adapters.fine_tune.base_finetune import FineTuneParameter
 from kiln_ai.adapters.fine_tune.dataset_formatter import DatasetFormat
-from kiln_ai.adapters.ml_model_list import KilnModel, KilnModelProvider
+from kiln_ai.adapters.ml_model_list import (
+    KilnModel,
+    KilnModelProvider,
+    ModelFamily,
+    ModelName,
+    ModelParserID,
+    ModelProviderName,
+    StructuredOutputMode,
+)
 from kiln_ai.datamodel import (
     DatasetSplit,
     Finetune,
@@ -32,6 +40,7 @@
     FinetuneProviderModel,
     connect_fine_tune_api,
     fetch_fireworks_finetune_models,
+    infer_data_strategies_for_model,
     thinking_instructions_from_request,
 )
 
@@ -110,6 +119,18 @@ def client():
     return TestClient(app)
 
 
+def test_finetune_provider_model_defaults():
+    model = FinetuneProviderModel(
+        name="Test Provider",
+        id="test_provider",
+    )
+
+    assert model.data_strategies_supported == [
+        FinetuneDataStrategy.final_only,
+        FinetuneDataStrategy.final_and_intermediate,
+    ]
+
+
 def test_get_dataset_splits(client, mock_task_from_id_disk_backed, test_task):
     response = client.get("/api/projects/project1/tasks/task1/dataset_splits")
 
@@ -1260,3 +1281,141 @@ async def test_fetch_fireworks_finetune_models_http_error(
         await fetch_fireworks_finetune_models()
 
     mock_httpx_client.get.assert_called_once()
+
+
+@pytest.fixture
+def mock_available_models():
+    return [
+        KilnModel(
+            family=ModelFamily.gpt,
+            name=ModelName.gpt_4_1,
+            friendly_name="GPT 4.1",
+            providers=[
+                KilnModelProvider(
+                    name=ModelProviderName.openai,
+                    model_id="gpt-4.1",
+                    provider_finetune_id="gpt-4.1-2025-04-14",
+                ),
+                KilnModelProvider(
+                    name=ModelProviderName.openrouter,
+                    model_id="openai/gpt-4.1",
+                ),
+                KilnModelProvider(
+                    name=ModelProviderName.azure_openai,
+                    model_id="gpt-4.1",
+                ),
+            ],
+        ),
+        KilnModel(
+            family=ModelFamily.gpt,
+            name=ModelName.gpt_4_1_mini,
+            friendly_name="GPT 4.1 Mini",
+            providers=[
+                KilnModelProvider(
+                    name=ModelProviderName.openai,
+                    model_id="gpt-4.1-mini",
+                    provider_finetune_id="gpt-4.1-mini-2025-04-14",
+                ),
+                KilnModelProvider(
+                    name=ModelProviderName.openrouter,
+                    model_id="openai/gpt-4.1-mini",
+                ),
+                KilnModelProvider(
+                    name=ModelProviderName.azure_openai,
+                    model_id="gpt-4.1-mini",
+                ),
+            ],
+        ),
+        KilnModel(
+            family=ModelFamily.qwen,
+            name=ModelName.qwq_32b,
+            friendly_name="QwQ 32B",
+            providers=[
+                KilnModelProvider(
+                    name=ModelProviderName.huggingface,
+                    model_id="qwen/qwq-32b",
+                    provider_finetune_id="qwq-32b-xxx",
+                    parser=ModelParserID.r1_thinking,
+                )
+            ],
+        ),
+    ]
+
+
+@pytest.mark.parametrize(
+    "model_id, provider, expected_data_strategies",
+    [
+        # for models where we have built-in models, we can infer the data strategies from the object itself
+        (
+            # does not have a parser, so should be defaults
+            "gpt-4.1-2025-04-14",
+            "openai",
+            [
+                FinetuneDataStrategy.final_only,
+                FinetuneDataStrategy.final_and_intermediate,
+            ],
+        ),
+        (
+            # does not have a parser, so should be defaults
+            "gpt-4.1-mini-2025-04-14",
+            "openai",
+            [
+                FinetuneDataStrategy.final_only,
+                FinetuneDataStrategy.final_and_intermediate,
+            ],
+        ),
+        (
+            # this model is not in any list, so should be defaults
+            "fake-model-id",
+            "fake-provider",
+            [
+                FinetuneDataStrategy.final_only,
+                FinetuneDataStrategy.final_and_intermediate,
+            ],
+        ),
+        # this model has an R1 parser, should be r1 compatible
+        (
+            "qwq-32b-xxx",
+            "huggingface",
+            [
+                FinetuneDataStrategy.final_and_intermediate_r1_compatible,
+            ],
+        ),
+        # for fireworks_ai models, we infer the data strategies from the model name
+        (
+            # does not contain r1 or qwq in the id so it should be defaults
+            "some-model-id",
+            "fireworks_ai",
+            [
+                FinetuneDataStrategy.final_only,
+                FinetuneDataStrategy.final_and_intermediate,
+            ],
+        ),
+        (
+            # contains r1 in the id so it should be r1 compatible
+            "some-model-with-r1-in-id",
+            "fireworks_ai",
+            [
+                FinetuneDataStrategy.final_and_intermediate_r1_compatible,
+            ],
+        ),
+        (
+            # contains qwq in the id so it should be r1 compatible
+            "some-model-with-qwq-in-id",
+            "fireworks_ai",
+            [
+                FinetuneDataStrategy.final_and_intermediate_r1_compatible,
+            ],
+        ),
+    ],
+)
+def test_infer_data_strategies(
+    mock_available_models,
+    model_id: str,
+    provider: str,
+    expected_data_strategies: list[FinetuneDataStrategy],
+):
+    assert (
+        infer_data_strategies_for_model(mock_available_models, model_id, provider)
+        == expected_data_strategies
+    )