Updated pr.

lu-ohai · lu-ohai · commit 25c26f2278d4 · 2024-12-06T12:56:29.000-05:00
diff --git a/tests/unitary/with_extras/langchain/chat_models/test_oci_data_science.py b/tests/unitary/with_extras/langchain/chat_models/test_oci_data_science.py
@@ -10,9 +10,6 @@
 from typing import Any, AsyncGenerator, Dict, Generator
 from unittest import mock
 
-from ads.llm.langchain.plugins.chat_models.oci_data_science import (
-    DEFAULT_INFERENCE_ENDPOINT_CHAT,
-)
 import pytest
 
 
@@ -29,6 +26,7 @@
 CONST_ENDPOINT = "https://oci.endpoint/ocid/predict"
 CONST_PROMPT = "This is a prompt."
 CONST_COMPLETION = "This is a completion."
+CONST_ENDPOINT = "/v1/chat/completions"
 CONST_COMPLETION_RESPONSE = {
     "id": "chat-123456789",
     "object": "chat.completion",
@@ -126,7 +124,7 @@ def mocked_requests_post(url: str, **kwargs: Any) -> MockResponse:
 def test_invoke_vllm(*args: Any) -> None:
     """Tests invoking vLLM endpoint."""
     llm = ChatOCIModelDeploymentVLLM(endpoint=CONST_ENDPOINT, model=CONST_MODEL_NAME)
-    assert llm.headers == {"route": DEFAULT_INFERENCE_ENDPOINT_CHAT}
+    assert llm.headers == {"route": CONST_ENDPOINT}
     output = llm.invoke(CONST_PROMPT)
     assert isinstance(output, AIMessage)
     assert output.content == CONST_COMPLETION
@@ -139,7 +137,7 @@ def test_invoke_vllm(*args: Any) -> None:
 def test_invoke_tgi(*args: Any) -> None:
     """Tests invoking TGI endpoint using OpenAI Spec."""
     llm = ChatOCIModelDeploymentTGI(endpoint=CONST_ENDPOINT, model=CONST_MODEL_NAME)
-    assert llm.headers == {"route": DEFAULT_INFERENCE_ENDPOINT_CHAT}
+    assert llm.headers == {"route": CONST_ENDPOINT}
     output = llm.invoke(CONST_PROMPT)
     assert isinstance(output, AIMessage)
     assert output.content == CONST_COMPLETION
@@ -154,7 +152,7 @@ def test_stream_vllm(*args: Any) -> None:
     llm = ChatOCIModelDeploymentVLLM(
         endpoint=CONST_ENDPOINT, model=CONST_MODEL_NAME, streaming=True
     )
-    assert llm.headers == {"route": DEFAULT_INFERENCE_ENDPOINT_CHAT}
+    assert llm.headers == {"route": CONST_ENDPOINT}
     output = None
     count = 0
     for chunk in llm.stream(CONST_PROMPT):
@@ -193,7 +191,7 @@ async def test_stream_async(*args: Any) -> None:
     llm = ChatOCIModelDeploymentVLLM(
         endpoint=CONST_ENDPOINT, model=CONST_MODEL_NAME, streaming=True
     )
-    assert llm.headers == {"route": DEFAULT_INFERENCE_ENDPOINT_CHAT}
+    assert llm.headers == {"route": CONST_ENDPOINT}
     with mock.patch.object(
         llm,
         "_aiter_sse",
diff --git a/tests/unitary/with_extras/langchain/llms/test_oci_model_deployment_endpoint.py b/tests/unitary/with_extras/langchain/llms/test_oci_model_deployment_endpoint.py
@@ -10,9 +10,6 @@
 from typing import Any, AsyncGenerator, Dict, Generator
 from unittest import mock
 
-from ads.llm.langchain.plugins.llms.oci_data_science_model_deployment_endpoint import (
-    DEFAULT_INFERENCE_ENDPOINT,
-)
 import pytest
 
 if sys.version_info < (3, 9):
@@ -27,6 +24,7 @@
 CONST_ENDPOINT = "https://oci.endpoint/ocid/predict"
 CONST_PROMPT = "This is a prompt."
 CONST_COMPLETION = "This is a completion."
+CONST_ENDPOINT = "/v1/completions"
 CONST_COMPLETION_RESPONSE = {
     "choices": [
         {
@@ -119,7 +117,7 @@ async def mocked_async_streaming_response(
 def test_invoke_vllm(*args: Any) -> None:
     """Tests invoking vLLM endpoint."""
     llm = OCIModelDeploymentVLLM(endpoint=CONST_ENDPOINT, model=CONST_MODEL_NAME)
-    assert llm.headers == {"route": DEFAULT_INFERENCE_ENDPOINT}
+    assert llm.headers == {"route": CONST_ENDPOINT}
     output = llm.invoke(CONST_PROMPT)
     assert output == CONST_COMPLETION
 
@@ -132,7 +130,7 @@ def test_stream_tgi(*args: Any) -> None:
     llm = OCIModelDeploymentTGI(
         endpoint=CONST_ENDPOINT, model=CONST_MODEL_NAME, streaming=True
     )
-    assert llm.headers == {"route": DEFAULT_INFERENCE_ENDPOINT}
+    assert llm.headers == {"route": CONST_ENDPOINT}
     output = ""
     count = 0
     for chunk in llm.stream(CONST_PROMPT):
@@ -150,7 +148,7 @@ def test_generate_tgi(*args: Any) -> None:
     llm = OCIModelDeploymentTGI(
         endpoint=CONST_ENDPOINT, api="/generate", model=CONST_MODEL_NAME
     )
-    assert llm.headers == {"route": DEFAULT_INFERENCE_ENDPOINT}
+    assert llm.headers == {"route": CONST_ENDPOINT}
     output = llm.invoke(CONST_PROMPT)
     assert output == CONST_COMPLETION
 
@@ -169,7 +167,7 @@ async def test_stream_async(*args: Any) -> None:
     llm = OCIModelDeploymentTGI(
         endpoint=CONST_ENDPOINT, model=CONST_MODEL_NAME, streaming=True
     )
-    assert llm.headers == {"route": DEFAULT_INFERENCE_ENDPOINT}
+    assert llm.headers == {"route": CONST_ENDPOINT}
     with mock.patch.object(
         llm,
         "_aiter_sse",