ufal
diff --git a/‎neuralmonkey/checking.py
Lines changed: 1 addition & 1 deletion b/‎neuralmonkey/checking.py
Lines changed: 1 addition & 1 deletion
diff --git a/‎neuralmonkey/dataset.py
Lines changed: 5 additions & 5 deletions b/‎neuralmonkey/dataset.py
Lines changed: 5 additions & 5 deletions
diff --git a/‎neuralmonkey/experiment.py
Lines changed: 20 additions & 29 deletions b/‎neuralmonkey/experiment.py
Lines changed: 20 additions & 29 deletions
@@ -47,7 +47,7 @@ def check_dataset_and_coders(dataset: Dataset,
     missing = []
 
     for (serie, coder) in data_list:
-        if not dataset.has_series(serie):
+        if serie not in dataset:
             log("dataset {} does not have serie {}".format(
                 dataset.name, serie))
             missing.append((coder, serie))
 
@@ -467,11 +467,7 @@ def __len__(self) -> int:
         assert self.length is not None
         return self.length
 
-    @property
-    def series(self) -> List[str]:
-        return list(sorted(self.iterators.keys()))
-
-    def has_series(self, name: str) -> bool:
+    def __contains__(self, name: str) -> bool:
         """Check if the dataset contains a series of a given name.
 
         Arguments:
@@ -482,6 +478,10 @@ def has_series(self, name: str) -> bool:
         """
         return name in self.iterators
 
+    @property
+    def series(self) -> List[str]:
+        return list(sorted(self.iterators.keys()))
+
     def get_series(self, name: str) -> Iterator:
         """Get the data series with a given name.
 
 
@@ -25,6 +25,7 @@
                                          print_final_evaluation)
 from neuralmonkey.model.sequence import EmbeddedFactorSequence
 from neuralmonkey.runners.base_runner import ExecutionResult
+from neuralmonkey.runners.dataset_runner import DatasetRunner
 
 
 _TRAIN_ARGS = [
@@ -160,6 +161,8 @@ def register_inputs(self) -> None:
         for feedable in feedables:
             feedable.register_input()
 
+        self.model.dataset_runner.register_input()
+
     def build_model(self) -> None:
         """Build the configuration and the computational graph.
 
@@ -197,6 +200,9 @@ def build_model(self) -> None:
             self._model = self.config.model
             self._model_built = True
 
+            # prepare dataset runner
+            self.model.dataset_runner = DatasetRunner()
+
             # build dataset
             self.register_inputs()
 
@@ -257,27 +263,6 @@ def train(self) -> None:
             log("Saving final variables in {}".format(final_variables))
             self.model.tf_manager.save(final_variables)
 
-            if self.model.test_datasets:
-                self.model.tf_manager.restore_best_vars()
-
-                for dataset in self.model.test_datasets:
-                    test_results, test_outputs = run_on_dataset(
-                        self.model.tf_manager,
-                        self.model.runners,
-                        dataset,
-                        self.model.postprocess,
-                        write_out=True,
-                        batching_scheme=self.model.runners_batching_scheme)
-
-                    # ensure test outputs are iterable more than once
-                    test_outputs = {
-                        k: list(v) for k, v in test_outputs.items()}
-                    eval_result = evaluation(
-                        self.model.evaluation, dataset,
-                        self.model.runners, test_results, test_outputs)
-
-                    print_final_evaluation(dataset.name, eval_result)
-
             log("Finished.")
             self._vars_loaded = True
 
@@ -321,8 +306,8 @@ def run_model(self,
                   dataset: Dataset,
                   write_out: bool = False,
                   batch_size: int = None,
-                  log_progress: int = 0) -> Tuple[List[ExecutionResult],
-                                                  Dict[str, List[Any]]]:
+                  log_progress: int = 0) -> Tuple[
+                      List[ExecutionResult], Dict[str, List], Dict[str, List]]:
         """Run the model on a given dataset.
 
         Args:
@@ -352,16 +337,21 @@ def run_model(self,
         with self.graph.as_default():
             # TODO: check_dataset_and_coders(dataset, self.model.runners)
             return run_on_dataset(
-                self.model.tf_manager, self.model.runners, dataset,
+                self.model.tf_manager,
+                self.model.runners,
+                self.model.dataset_runner,
+                dataset,
                 self.model.postprocess,
-                write_out=write_out, log_progress=log_progress,
+                write_out=write_out,
+                log_progress=log_progress,
                 batching_scheme=batching_scheme)
 
     def evaluate(self,
                  dataset: Dataset,
                  write_out: bool = False,
                  batch_size: int = None,
-                 log_progress: int = 0) -> Dict[str, Any]:
+                 log_progress: int = 0,
+                 name: str = None) -> Dict[str, Any]:
         """Run the model on a given dataset and evaluate the outputs.
 
         Args:
@@ -370,23 +360,24 @@ def evaluate(self,
                 defined in the dataset object.
             batch_size: size of the minibatch
             log_progress: log progress every X seconds
+            name: The name of the evaluated dataset
 
         Returns:
             Dictionary of evaluation names and their values which includes the
             metrics applied on respective series loss and loss values from the
             run.
         """
-        execution_results, output_data = self.run_model(
+        execution_results, output_data, f_dataset = self.run_model(
             dataset, write_out, batch_size, log_progress)
 
         evaluators = [(e[0], e[0], e[1]) if len(e) == 2 else e
                       for e in self.model.evaluation]
         with self.graph.as_default():
             eval_result = evaluation(
-                evaluators, dataset, self.model.runners,
+                evaluators, f_dataset, self.model.runners,
                 execution_results, output_data)
         if eval_result:
-            print_final_evaluation(dataset.name, eval_result)
+            print_final_evaluation(eval_result, name)
 
         return eval_result