run-llama · mdciri · Apr 12, 2025 · Apr 12, 2025 · Apr 14, 2025 · Apr 22, 2025
diff --git a/llama-index-integrations/postprocessor/llama-index-postprocessor-google-rerank/BUILD b/llama-index-integrations/postprocessor/llama-index-postprocessor-google-rerank/BUILD
@@ -0,0 +1 @@
+poetry_requirements(name="poetry", module_mapping={"google-genai": ["google"]})
diff --git a/...ex-integrations/postprocessor/llama-index-postprocessor-google-rerank/README.md b/...ex-integrations/postprocessor/llama-index-postprocessor-google-rerank/README.md
@@ -0,0 +1,31 @@
+# LlamaIndex Postprocessor Integration: Google Rerankers
+
+Integrating llama-index with [Google rerankers](https://cloud.google.com/generative-ai-app-builder/docs/ranking#genappbuilder_rank-python).
+
+It is essential to have a project in Google Cloud Platform (GCP) and loads its credentials as explained in [here](https://google-auth.readthedocs.io/en/master/reference/google.oauth2.service_account.html).
+
+## Sample Usage
+
+```python
+from llama_index.core import VectorStoreIndex, SimpleDirectoryReader
+from llama_index.postprocessor.google_rerank import GoogleRerank
+
+
+documents = SimpleDirectoryReader("./data/paul_graham/").load_data()
+index = VectorStoreIndex.from_documents(documents=documents)
+reranker = GoogleRerank(
+    top_n=3,
+    model_id="semantic-ranker-512-003",
+)
+query_engine = index.as_query_engine(
+    similarity_top_k=10,
+    node_postprocessors=[reranker],
+)
+response = query_engine.query(
+    "What did Sam Altman do in this essay?",
+)
+
+print(response)
+
+print(response.source_nodes)
+```
diff --git a/...sor/llama-index-postprocessor-google-rerank/llama_index/postprocessor/google_rerank/BUILD b/...sor/llama-index-postprocessor-google-rerank/llama_index/postprocessor/google_rerank/BUILD
@@ -0,0 +1,6 @@
+python_sources()
+
+resource(
+    name="py_typed",
+    source="py.typed",
+)
diff --git a/...ama-index-postprocessor-google-rerank/llama_index/postprocessor/google_rerank/__init__.py b/...ama-index-postprocessor-google-rerank/llama_index/postprocessor/google_rerank/__init__.py
@@ -0,0 +1,3 @@
+from llama_index.postprocessor.google_rerank.base import GoogleRerank
+
+__all__ = ["GoogleRerank"]
diff --git a/...r/llama-index-postprocessor-google-rerank/llama_index/postprocessor/google_rerank/base.py b/...r/llama-index-postprocessor-google-rerank/llama_index/postprocessor/google_rerank/base.py
@@ -0,0 +1,141 @@
+import os
+import json
+from enum import Enum
+from typing import Any, List, Optional
+
+from llama_index.core.bridge.pydantic import Field, PrivateAttr
+from llama_index.core.callbacks import CBEventType, EventPayload
+from llama_index.core.instrumentation import get_dispatcher
+from llama_index.core.instrumentation.events.rerank import (
+    ReRankEndEvent,
+    ReRankStartEvent,
+)
+from llama_index.core.postprocessor.types import BaseNodePostprocessor
+from llama_index.core.schema import MetadataMode, NodeWithScore, QueryBundle
+
+from google.oauth2 import service_account
+from google.cloud import discoveryengine_v1 as discoveryengine
+
+
+GOOGLE_SERVICE_ACCOUNT_INFO = json.load(open("google-service-account.json"))
+GOOGLE_CREDENTIALS = service_account.Credentials.from_service_account_info(
+    GOOGLE_SERVICE_ACCOUNT_INFO
+)
+
+
+dispatcher = get_dispatcher(__name__)
+
+
+class Models(str, Enum):
+    SEMANTIC_RERANK_512_003 = "semantic-ranker-512-003"
+
+
+class GoogleRerank(BaseNodePostprocessor):
+    top_n: int = Field(default=2, description="Top N nodes to return.")
+    rerank_model_name: str = Field(
+        default=Models.SEMANTIC_RERANK_512_003.value,
+        description="The modelId of the VertexAI model to use.",
+    )
+    _client: discoveryengine.RankServiceClient = PrivateAttr()
+    _ranking_config: str = PrivateAttr()
+
+    def __init__(
+        self,
+        top_n: int = 2,
+        rerank_model_name: str = Models.SEMANTIC_RERANK_512_003.value,
+        client: Optional[discoveryengine.RankServiceClient] = None,
+        ranking_config: Optional[Any] = "default_ranking_config",
+        **kwargs: Any,
+    ):
+        super().__init__(**kwargs)
+        self.top_n = top_n
+        self.rerank_model_name = rerank_model_name
+
+        if client:
+            self._client = client
+        else:
+            self._client = discoveryengine.RankServiceClient(
+                credentials=GOOGLE_CREDENTIALS
+            )
+
+        self._ranking_config = self._client.ranking_config_path(
+            project=GOOGLE_SERVICE_ACCOUNT_INFO["project_id"],
+            location="global",
+            ranking_config=ranking_config,
+        )
+
+    @classmethod
+    def class_name(cls) -> str:
+        return "GoogleRerank"
+
+    def _postprocess_nodes(
+        self,
+        nodes: List[NodeWithScore],
+        query_bundle: Optional[QueryBundle] = None,
+    ) -> List[NodeWithScore]:
+        if dispatcher:
+            dispatcher.event(
+                ReRankStartEvent(
+                    query=query_bundle,
+                    nodes=nodes,
+                    top_n=self.top_n,
+                    model_name=self.rerank_model_name,
+                )
+            )
+
+        if query_bundle is None:
+            raise ValueError("Missing query bundle in extra info.")
+        if len(nodes) == 0:
+            return []
+
+        with self.callback_manager.event(
+            CBEventType.RERANKING,
+            payload={
+                EventPayload.NODES: nodes,
+                EventPayload.MODEL_NAME: self.rerank_model_name,
+                EventPayload.QUERY_STR: query_bundle.query_str,
+                EventPayload.TOP_K: self.top_n,
+            },
+        ) as event:
+
+            # Prepare the text sources for Google Reranker
+            text_sources = []
+            for index, node in enumerate(nodes):
+                text_sources.append(
+                    discoveryengine.RankingRecord(
+                        id=str(index),
+                        content=node.node.get_content(metadata_mode=MetadataMode.EMBED),
+                    ),
+                )
+            # change top_n if the number of nodes is less than top_n
+            if len(nodes) < self.top_n:
+                self.top_n = len(nodes)
+
+            try:
+                request = discoveryengine.RankRequest(
+                    ranking_config=self._ranking_config,
+                    model=self.rerank_model_name,
+                    top_n=self.top_n,
+                    query=query_bundle.query_str,
+                    records=text_sources,
+                )
+                response = self._client.rank(request=request)
+
+                results = response.records
+            except Exception as e:
+                raise RuntimeError(f"Failed to invoke VertexAI model: {e}")
+
+            new_nodes = []
+            for result in results:
+                index = int(result.id)
+                relevance_score = result.score
+                new_node_with_score = NodeWithScore(
+                    node=nodes[index].node,
+                    score=relevance_score,
+                )
+                new_nodes.append(new_node_with_score)
+
+            event.on_end(payload={EventPayload.NODES: new_nodes})
+
+        dispatcher.event(ReRankEndEvent(nodes=new_nodes))
+        return new_nodes
Original file line number	Diff line number	Diff line change
		@@ -0,0 +1 @@
		poetry_requirements(name="poetry", module_mapping={"google-genai": ["google"]})
Original file line number	Diff line number	Diff line change
		@@ -0,0 +1,3 @@
		from llama_index.postprocessor.google_rerank.base import GoogleRerank

		__all__ = ["GoogleRerank"]