"Метрики опираются на predicted плоскости, а если их мало, то получается качетсво высокое и только OSR, USR орет, но он у нас на краях валится так как плохо настроен", -- Д. С. Ярош
Here is an example where Prediction 2 gives better results on all metrics except recall and under_segmented than Prediction 1, but has poorer quality of extraction
Ground truth, Prediction 1, Prediction 2:


