fixed embedding extraction

robogast · robogast · commit 80d784305517 · 2021-11-25T11:33:39.000+01:00
diff --git a/load-asap.sh b/load-asap.sh
@@ -9,4 +9,4 @@ source deactivate
 source deactivate
 source activate 2D-VQ-AE-2
 
-export PYTHONPATH=$PYTHONPATH:~/.conda/envs/2D-VQ-AE-2/lib/python3.9/site-packages/
+export PYTHONPATH=~/.conda/envs/2D-VQ-AE-2/lib/python3.9/site-packages/:$PYTHONPATH
diff --git a/scripts/extract_embeddings/conf/camelyon16_embeddings.yaml b/scripts/extract_embeddings/conf/camelyon16_embeddings.yaml
@@ -1,3 +1,6 @@
+defaults:
+  - override hydra/launcher: submitit_snellius
+
 run_path: ???
 force_outputs_or_multirun_root: True
 dataset_target_hotswap: datamodules.camelyon16.CAMELYON16SlicePatchDataSet
diff --git a/scripts/extract_embeddings/conf/hydra/launcher/node/gpu_a100.yaml b/scripts/extract_embeddings/conf/hydra/launcher/node/gpu_a100.yaml
@@ -0,0 +1,5 @@
+timeout_min: 7200 # 5 days
+partition: 'gpu'
+cpus_per_task: 18
+tasks_per_node: 4
+gpus_per_node: 4
diff --git a/scripts/extract_embeddings/conf/hydra/launcher/node/gpu_a100_shared.yaml b/scripts/extract_embeddings/conf/hydra/launcher/node/gpu_a100_shared.yaml
@@ -0,0 +1,7 @@
+timeout_min: 7200 # 5 days
+partition: 'gpu'
+tasks_per_node: 1
+gpus_per_task: 1
+cpus_per_gpu: 18
+additional_parameters:
+  gpu_bind: closest
diff --git a/scripts/extract_embeddings/conf/hydra/launcher/setup/camelyon16_setup.yaml b/scripts/extract_embeddings/conf/hydra/launcher/setup/camelyon16_setup.yaml
@@ -0,0 +1,19 @@
+- set -e
+
+- echo "Loading modules"
+# TODO: remove this hacky relative path finding
+- source ${hydra.runtime.config_sources.1.path}/../../load-asap.sh
+
+- echo "Setting environment variables"
+- export OMP_NUM_THREADS=18
+- export PYTHONFAULTHANDLER=1
+- export NCCL_DEBUG=INFO
+- export NCCL_ASYNC_ERROR_HANDLING=1
+
+- if [[ -d ${oc.env:CAMELYON16_PATH} ]]; then
+- echo "Detected folder ${oc.env:CAMELYON16_PATH}, skipping copy"
+- else
+- echo "${oc.env:CAMELYON16_PATH} is not a valid file"
+- exit 1
+- fi
+
diff --git a/scripts/extract_embeddings/conf/hydra/launcher/submitit_snellius.yaml b/scripts/extract_embeddings/conf/hydra/launcher/submitit_snellius.yaml
@@ -0,0 +1,4 @@
+defaults:
+  - submitit_slurm
+  - node@_here_: gpu_a100_shared
+  - setup: camelyon16_setup
diff --git a/scripts/extract_embeddings/extract_embeddings.py b/scripts/extract_embeddings/extract_embeddings.py
@@ -1,6 +1,7 @@
 from __future__ import annotations
 
 import functools
+import logging
 from collections.abc import Iterable
 from dataclasses import dataclass
 from functools import partial
@@ -50,6 +51,13 @@ def get_slices(patch_idx):
             for dim in (torch.cat([patch_idx[None], patch_idx[None]+1]).T.swapaxes(0, 1) * patch_size)
         ])
 
+    def cast_to_lowest_dtype(array: np.ndarray) -> np.ndarray:
+        return array.astype(
+            bool
+            if (array_min := array.min()) == 0 and (array_max := array.max()) == 1
+            else np.result_type(*map(np.min_scalar_type, (array_min, array_max)))
+        )
+
     arrays, counts, patch_size = {}, {}, None
 
     for ret_values in run_eval(model, dataset):
@@ -60,8 +68,8 @@ def get_slices(patch_idx):
 
             slices = get_slices(patch_idx)
 
-            u_names, u_idx, u_inverse, u_counts = np.unique(
-                names, return_counts=True, return_index=True, return_inverse=True
+            u_names, u_idx, u_counts = np.unique(
+                names, return_counts=True, return_index=True
             )
 
             for name, image_index, count in zip(u_names, img_idx[u_idx], u_counts):
@@ -72,23 +80,23 @@ def get_slices(patch_idx):
                     device=encodings.device
                 ))
 
-                mask = u_inverse == int(image_index)
+                mask = img_idx == image_index
                 current_array[slices[mask].swapaxes(0, 1)] = encodings[mask]
                 current_count -= count  # persistent because of np.array
 
                 if current_count == 0:
                     counts.pop(name)
-                    yield name, (arr := arrays.pop(name).cpu().numpy()).astype(np.min_scalar_type(arr.max()))
+                    yield name, cast_to_lowest_dtype(arrays.pop(name).cpu().numpy())
 
 
 @torch.no_grad()
-def run_eval(model, dataset, batch_size=1800):
+def run_eval(model, dataset, batch_size=2500):
 
     dataloader = DataLoader(
         dataset,
         batch_size=batch_size,
         pin_memory=True,
-        num_workers=6,
+        num_workers=18,
         prefetch_factor=10
     )
 
@@ -103,11 +111,13 @@ def extract_path(path: str) -> str:
 
     max_pool = None
 
+    logging.info("Setup complete, starting encoding")
+
     for imgs, labels, (img_index, patch_index, img_path, label_path) in dataloader:
 
         imgs, labels = (
-            imgs.to(device, non_blocking=True, dtype=torch.half),
-            labels.to(device, non_blocking=True, dtype=torch.int16)
+            imgs.to(device, non_blocking=True),
+            labels.to(device, non_blocking=True)
         )
 
         with torch.autocast('cuda'):
@@ -121,7 +131,7 @@ def extract_path(path: str) -> str:
         yield (
             (data, list(map(extract_path, paths)), img_index, patch_index)
             for data, paths in (
-                (encoding_indices.to(torch.int16), img_path),  # make a ndim < 2**15 assumption
+                (encoding_indices, img_path),
                 (labels_pooled, label_path)
             )
         )