Add FactCheckingTool

Val Brodsky · Val Brodsky · commit 45601d4e653d · 2024-10-29T12:18:20.000-07:00
diff --git a/docs/labelbox/fact-checking-tool.rst b/docs/labelbox/fact-checking-tool.rst
@@ -0,0 +1,6 @@
+Fact Checking Tool
+===============================================================================================
+
+.. automodule:: labelbox.schema.tool_building.fact_checking_tool
+   :members:
+   :show-inheritance:
diff --git a/docs/labelbox/index.rst b/docs/labelbox/index.rst
@@ -19,6 +19,7 @@ Labelbox Python SDK Documentation
     enums
     exceptions
     export-task
+    fact-checking-tool
     foundry-client
     foundry-model
     identifiable
diff --git a/libs/labelbox/src/labelbox/schema/ontology.py b/libs/labelbox/src/labelbox/schema/ontology.py
@@ -12,8 +12,12 @@
 
 from labelbox.orm.db_object import DbObject
 from labelbox.orm.model import Field, Relationship
+from labelbox.schema.tool_building.fact_checking_tool import FactCheckingTool
 from labelbox.schema.tool_building.step_reasoning_tool import StepReasoningTool
 from labelbox.schema.tool_building.tool_type import ToolType
+from labelbox.schema.tool_building.tool_type_mapping import (
+    map_tool_type_to_tool_cls,
+)
 
 FeatureSchemaId: Type[str] = Annotated[
     str, StringConstraints(min_length=25, max_length=25)
@@ -491,13 +495,14 @@ def add_classification(self, classification: Classification) -> None:
 
 
 def tool_cls_from_type(tool_type: str):
-    if tool_type.lower() == ToolType.STEP_REASONING.value:
-        return StepReasoningTool
+    tool_cls = map_tool_type_to_tool_cls(tool_type)
+    if tool_cls is not None:
+        return tool_cls
     return Tool
 
 
 def tool_type_cls_from_type(tool_type: str):
-    if tool_type.lower() == ToolType.STEP_REASONING.value:
+    if ToolType.valid(tool_type):
         return ToolType
     return Tool.Type
 
@@ -596,7 +601,9 @@ class OntologyBuilder:
 
     """
 
-    tools: List[Union[Tool, StepReasoningTool]] = field(default_factory=list)
+    tools: List[Union[Tool, StepReasoningTool, FactCheckingTool]] = field(
+        default_factory=list
+    )
     classifications: List[
         Union[Classification, PromptResponseClassification]
     ] = field(default_factory=list)
diff --git a/libs/labelbox/src/labelbox/schema/tool_building/__init__.py b/libs/labelbox/src/labelbox/schema/tool_building/__init__.py
@@ -1,2 +1,5 @@
 import labelbox.schema.tool_building.tool_type
+import labelbox.schema.tool_building.variant
 import labelbox.schema.tool_building.step_reasoning_tool
+import labelbox.schema.tool_building.fact_checking_tool
+import labelbox.schema.tool_building.tool_type_mapping
diff --git a/libs/labelbox/src/labelbox/schema/tool_building/fact_checking_tool.py b/libs/labelbox/src/labelbox/schema/tool_building/fact_checking_tool.py
@@ -0,0 +1,180 @@
+from dataclasses import dataclass, field
+from typing import Any, Dict, List, Optional, Set
+
+from labelbox.schema.tool_building.tool_type import ToolType
+from labelbox.schema.tool_building.variant import (
+    Variant,
+    VariantWithActions,
+)
+
+
+@dataclass
+class FactCheckingVariants:
+    """
+    This class is used to define the possible options for evaluating a step
+    Currently the options are correct, neutral, and incorrect
+    """
+
+    accurate_step: Variant = field(
+        default_factory=lambda: Variant(id=0, name="Accurate")
+    )
+    inaccurate_step: Variant = field(
+        default_factory=lambda: Variant(id=1, name="Inaccurate")
+    )
+    disputed_step: Variant = field(
+        default_factory=lambda: Variant(id=2, name="Disputed")
+    )
+    unsupported_step: VariantWithActions = field(
+        default_factory=lambda: VariantWithActions(
+            id=3, name="Unsupported", _available_actions={"writeJustification"}
+        )
+    )
+    cant_confidently_assess_step: VariantWithActions = field(
+        default_factory=lambda: VariantWithActions(
+            id=4,
+            name="Can't confidently assess",
+            _available_actions={"writeJustification"},
+        )
+    )
+    no_factual_information_step: VariantWithActions = field(
+        default_factory=lambda: VariantWithActions(
+            id=5,
+            name="No factual information",
+            _available_actions={"writeJustification"},
+        )
+    )
+
+    def asdict(self):
+        return [
+            self.accurate_step.asdict(),
+            self.inaccurate_step.asdict(),
+            self.disputed_step.asdict(),
+            self.unsupported_step.asdict(),
+            self.cant_confidently_assess_step.asdict(),
+            self.no_factual_information_step.asdict(),
+        ]
+
+    @classmethod
+    def from_dict(cls, dictionary: List[Dict[str, Any]]):
+        accurate_step = None
+        inaccurate_step = None
+        disputed_step = None
+        unsupported_step = None
+        cant_confidently_assess_step = None
+        no_factual_information_step = None
+
+        for variant in dictionary:
+            if variant["id"] == 0:
+                accurate_step = Variant(**variant)
+            elif variant["id"] == 1:
+                inaccurate_step = Variant(**variant)
+            elif variant["id"] == 2:
+                disputed_step = Variant(**variant)
+            elif variant["id"] == 3:
+                unsupported_step = VariantWithActions(**variant)
+            elif variant["id"] == 4:
+                cant_confidently_assess_step = VariantWithActions(**variant)
+            elif variant["id"] == 5:
+                no_factual_information_step = VariantWithActions(**variant)
+
+        if not all(
+            [
+                accurate_step,
+                inaccurate_step,
+                disputed_step,
+                unsupported_step,
+                cant_confidently_assess_step,
+                no_factual_information_step,
+            ]
+        ):
+            raise ValueError("Missing variant")
+
+        return cls(
+            accurate_step=accurate_step,
+            inaccurate_step=inaccurate_step,
+            disputed_step=disputed_step,
+            unsupported_step=unsupported_step,
+            cant_confidently_assess_step=cant_confidently_assess_step,
+            no_factual_information_step=no_factual_information_step,
+        )  # type: ignore
+
+
+@dataclass
+class FactCheckingDefinition:
+    variants: FactCheckingVariants = field(default_factory=FactCheckingVariants)
+    version: int = field(default=1)
+    title: Optional[str] = None
+    value: Optional[str] = None
+
+    def asdict(self) -> Dict[str, Any]:
+        result = {"variants": self.variants.asdict(), "version": self.version}
+        if self.title is not None:
+            result["title"] = self.title
+        if self.value is not None:
+            result["value"] = self.value
+        return result
+
+    @classmethod
+    def from_dict(cls, dictionary: Dict[str, Any]) -> "FactCheckingDefinition":
+        variants = FactCheckingVariants.from_dict(dictionary["variants"])
+        title = dictionary.get("title", None)
+        value = dictionary.get("value", None)
+        return cls(variants=variants, title=title, value=value)
+
+
+@dataclass
+class FactCheckingTool:
+    """
+    Use this class in OntologyBuilder to create a tool for step fact checking
+    """
+
+    name: str
+    type: ToolType = field(default=ToolType.FACT_CHECKING, init=False)
+    required: bool = False
+    schema_id: Optional[str] = None
+    feature_schema_id: Optional[str] = None
+    color: Optional[str] = None
+    definition: FactCheckingDefinition = field(
+        default_factory=FactCheckingDefinition
+    )
+
+    def set_unsupported_step_actions(
+        self, actions: Set[str] = {"writeJustification"}
+    ) -> None:
+        self.definition.variants.unsupported_step.set_actions(actions)
+
+    def set_cant_confidently_assess_step_actions(
+        self, actions: Set[str] = {"writeJustification"}
+    ) -> None:
+        self.definition.variants.cant_confidently_assess_step.set_actions(
+            actions
+        )
+
+    def set_no_factual_information_step_actions(
+        self, actions: Set[str] = {"writeJustification"}
+    ) -> None:
+        self.definition.variants.no_factual_information_step.set_actions(
+            actions
+        )
+
+    def asdict(self) -> Dict[str, Any]:
+        return {
+            "tool": self.type.value,
+            "name": self.name,
+            "required": self.required,
+            "schemaNodeId": self.schema_id,
+            "featureSchemaId": self.feature_schema_id,
+            "definition": self.definition.asdict(),
+        }
+
+    @classmethod
+    def from_dict(cls, dictionary: Dict[str, Any]) -> "FactCheckingTool":
+        return cls(
+            name=dictionary["name"],
+            schema_id=dictionary.get("schemaNodeId", None),
+            feature_schema_id=dictionary.get("featureSchemaId", None),
+            required=dictionary.get("required", False),
+            definition=FactCheckingDefinition.from_dict(
+                dictionary["definition"]
+            ),
+        )
diff --git a/libs/labelbox/src/labelbox/schema/tool_building/tool_type.py b/libs/labelbox/src/labelbox/schema/tool_building/tool_type.py
@@ -3,3 +3,12 @@
 
 class ToolType(Enum):
     STEP_REASONING = "step-reasoning"
+    FACT_CHECKING = "fact-checking"
+
+    @classmethod
+    def valid(cls, tool_type: str) -> bool:
+        try:
+            ToolType(tool_type.lower())
+            return True
+        except ValueError:
+            return False
diff --git a/libs/labelbox/src/labelbox/schema/tool_building/tool_type_mapping.py b/libs/labelbox/src/labelbox/schema/tool_building/tool_type_mapping.py
@@ -0,0 +1,16 @@
+from labelbox.schema.tool_building.fact_checking_tool import FactCheckingTool
+from labelbox.schema.tool_building.step_reasoning_tool import StepReasoningTool
+from labelbox.schema.tool_building.tool_type import ToolType
+
+
+def map_tool_type_to_tool_cls(tool_type_str: str):
+    if not ToolType.valid(tool_type_str):
+        raise ValueError(f"Invalid tool type {tool_type_str}")
+
+    tool_type = ToolType(tool_type_str.lower())
+    if tool_type == ToolType.STEP_REASONING:
+        return StepReasoningTool
+    elif tool_type == ToolType.FACT_CHECKING:
+        return FactCheckingTool
+
+    return None
diff --git a/libs/labelbox/src/labelbox/schema/tool_building/variant.py b/libs/labelbox/src/labelbox/schema/tool_building/variant.py
@@ -0,0 +1,38 @@
+from dataclasses import dataclass, field
+from typing import Any, Dict, List, Set
+
+
+@dataclass
+class Variant:
+    """
+    A variant is a single option in step-by-step reasoning or fact-checking tool.
+    """
+
+    id: int
+    name: str
+
+    def asdict(self) -> Dict[str, Any]:
+        return {"id": self.id, "name": self.name}
+
+
+@dataclass
+class VariantWithActions:
+    id: int
+    name: str
+    actions: List[str] = field(default_factory=list)
+    _available_actions: Set[str] = field(default_factory=set)
+
+    def set_actions(self, actions: Set[str]) -> None:
+        for action in actions:
+            if action in self._available_actions:
+                self.actions.append(action)
+
+    def reset_actions(self) -> None:
+        self.actions = []
+
+    def asdict(self) -> Dict[str, Any]:
+        return {
+            "id": self.id,
+            "name": self.name,
+            "actions": list(set(self.actions)),
+        }
diff --git a/libs/labelbox/tests/integration/conftest.py b/libs/labelbox/tests/integration/conftest.py
@@ -21,6 +21,7 @@
 )
 from labelbox.schema.data_row import DataRowMetadataField
 from labelbox.schema.ontology_kind import OntologyKind
+from labelbox.schema.tool_building.fact_checking_tool import FactCheckingTool
 from labelbox.schema.tool_building.step_reasoning_tool import StepReasoningTool
 from labelbox.schema.user import User
 
@@ -579,6 +580,7 @@ def chat_evaluation_ontology(client, rand_gen):
                 name="model output multi ranking",
             ),
             StepReasoningTool(name="step reasoning"),
+            FactCheckingTool(name="fact checking"),
         ],
         classifications=[
             Classification(
diff --git a/libs/labelbox/tests/unit/test_unit_fact_checking_tool.py b/libs/labelbox/tests/unit/test_unit_fact_checking_tool.py