bhklab · strixy16 · May 23, 2025 · May 23, 2025 · May 23, 2025 · May 23, 2025
diff --git a/pixi.lock b/pixi.lock
diff --git a/src/readii/utils/__init__.py b/src/readii/utils/__init__.py
@@ -1,5 +1,7 @@
 from .logging_config import logger
+from .dataset_config import get_full_data_name
 
 __all__ = [
     'logger',
+    'get_full_data_name'
 ]
diff --git a/src/readii/utils/dataset_config.py b/src/readii/utils/dataset_config.py
@@ -0,0 +1,27 @@
+from pathlib import Path
+from typing import Dict, Union
+
+from readii.io.loaders import loadImageDatasetConfig
+from readii.utils import logger
+
+def get_full_data_name(config: Union[Dict | Path]):
+    """Combine DATA_SOURCE and DATASET_NAME config variables into a single string."""
+
+    match type(config):
+        case Path():
+            dataset_config = loadImageDatasetConfig(config.stem, config.parent)
+        case Dict():
+            dataset_config = config
+        case _:
+            message = "Error getting full data name: config must be of type Path or Dict."
+            logger.debug(message)
+            raise TypeError(message) 
-    match type(config):
-        case Path():
-            dataset_config = loadImageDatasetConfig(config.stem, config.parent)
-        case Dict():
-            dataset_config = config
-        case _:
-            message = "Error getting full data name: config must be of type Path or Dict."
-            logger.debug(message)
-            raise TypeError(message) 
+    match type(config):
+        case Path():
+            # Enforce filename stem == parent directory name == dataset name
+            if config.parent.name != config.stem:
+                raise ValueError(
+                    f"Dataset config file stem '{config.stem}' must match its parent directory name "
+                    f"'{config.parent.name}'"
+                )
+            dataset_config = loadImageDatasetConfig(config.stem, config.parent)
+        case Dict():
+            dataset_config = config
+        case _:
+            message = "Error getting full data name: config must be of type Path or Dict."
+            logger.debug(message)
+            raise TypeError(message)
-    match type(config):
-        case Path():
-            dataset_config = loadImageDatasetConfig(config.stem, config.parent)
-        case Dict():
-            dataset_config = config
-        case _:
-            message = "Error getting full data name: config must be of type Path or Dict."
-            logger.debug(message)
-            raise TypeError(message) 
+    match type(config):
+        case Path():
+            # Enforce filename stem == parent directory name == dataset name
+            if config.parent.name != config.stem:
+                raise ValueError(
+                    f"Dataset config file stem '{config.stem}' must match its parent directory name "
+                    f"'{config.parent.name}'"
+                )
+            dataset_config = loadImageDatasetConfig(config.stem, config.parent)
+        case Dict():
+            dataset_config = config
+        case _:
+            message = "Error getting full data name: config must be of type Path or Dict."
+            logger.debug(message)
+            raise TypeError(message)
+
+    try:
+        data_source = dataset_config['DATA_SOURCE']
+        dataset_name = dataset_config['DATASET_NAME']
+        return f"{data_source}_{dataset_name}"
+    except KeyError as e:
+        message = f"Missing required key in dataset configuration: {e}"
+        logger.error(message)
+        raise ValueError(message) from e