ray-project
diff --git a/‎doc/BUILD
Lines changed: 0 additions & 1 deletion b/‎doc/BUILD
Lines changed: 0 additions & 1 deletion
diff --git a/‎doc/source/cluster/kubernetes/examples/vllm-rayservice.md
Lines changed: 1 addition & 1 deletion b/‎doc/source/cluster/kubernetes/examples/vllm-rayservice.md
Lines changed: 1 addition & 1 deletion
diff --git a/‎doc/source/serve/doc_code/vllm_openai_example.py
Lines changed: 0 additions & 205 deletions b/‎doc/source/serve/doc_code/vllm_openai_example.py
Lines changed: 0 additions & 205 deletions
diff --git a/‎doc/source/serve/examples.yml
Lines changed: 0 additions & 8 deletions b/‎doc/source/serve/examples.yml
Lines changed: 0 additions & 8 deletions
diff --git a/‎doc/source/serve/tutorials/vllm-example.md
Lines changed: 0 additions & 52 deletions b/‎doc/source/serve/tutorials/vllm-example.md
Lines changed: 0 additions & 52 deletions
@@ -222,7 +222,6 @@ py_test_run_all_subdirectory(
         "source/serve/doc_code/intel_gaudi_inference_client.py",
         "source/serve/doc_code/distilbert.py",
         "source/serve/doc_code/stable_diffusion.py",
-        "source/serve/doc_code/vllm_openai_example.py",
         "source/serve/doc_code/object_detection.py",
         "source/serve/doc_code/http_guide/streaming_example.py",
         "source/serve/doc_code/http_guide/websockets_example.py",
 
@@ -2,7 +2,7 @@
 
 # Serve a Large Language Model with vLLM on Kubernetes
 
-This guide demonstrates how to [Serve a Large Language Model with vLLM](https://docs.ray.io/en/latest/serve/tutorials/vllm-example.html) on Kubernetes using KubeRay. The example in this guide deploys the `meta-llama/Meta-Llama-3-8B-Instruct` model from Hugging Face on Google Kubernetes Engine (GKE).
+This guide demonstrates how to Serve a Large Language Model with vLLM on Kubernetes using KubeRay. The example in this guide deploys the `meta-llama/Meta-Llama-3-8B-Instruct` model from Hugging Face on Google Kubernetes Engine (GKE).
 
 ## Prerequisites
 
 
@@ -16,14 +16,6 @@ examples:
       - generative ai
     link: tutorials/stable-diffusion
     related_technology: ml applications
-  - title: Serve a Large Language Model (LLM)
-    skill_level: beginner
-    use_cases:
-      - generative ai
-      - large language models
-      - natural language processing
-    link: tutorials/vllm-example
-    related_technology: ml applications
   - title: Serve a Text Classification Model
     skill_level: beginner
     use_cases: