Merge pull request #55 from marklogic/feature/count-comment

rjrudin · web-flow · commit 9981bc2f9864 · 2023-06-01T10:43:00.000-07:00
Added comment to clarify the "count" label
diff --git a/src/main/java/com/marklogic/spark/reader/PlanUtil.java b/src/main/java/com/marklogic/spark/reader/PlanUtil.java
@@ -42,19 +42,27 @@ public abstract class PlanUtil {
     private final static ObjectMapper objectMapper = new ObjectMapper();
 
     static ObjectNode buildGroupByCount() {
-        return newOperation("group-by", args -> args
-            .add(objectMapper.nullNode())
-            .addObject().put("ns", "op").put("fn", "count").putArray("args").add("count").add(objectMapper.nullNode()));
+        return newOperation("group-by", args -> {
+            args.add(objectMapper.nullNode());
+            addCountArg(args);
+        });
     }
 
     static ObjectNode buildGroupByCount(String columnName) {
         return newOperation("group-by", args -> {
             populateSchemaCol(args.addObject(), columnName);
-            // Using "null" is the equivalent of "count(*)" - it counts rows, not values.
-            args.addObject().put("ns", "op").put("fn", "count").putArray("args").add("count").add(objectMapper.nullNode());
+            addCountArg(args);
         });
     }
 
+    private static void addCountArg(ArrayNode args) {
+        args.addObject().put("ns", "op").put("fn", "count").putArray("args")
+            // "count" is used as the column name as that's what Spark uses when the operation is not pushed down.
+            .add("count")
+            // Using "null" is the equivalent of "count(*)" - it counts rows, not values.
+            .add(objectMapper.nullNode());
+    }
+
     static ObjectNode buildLimit(int limit) {
         return newOperation("limit", args -> args.add(limit));
     }