character-tech · rohingarg-c · Jul 16, 2025 · Jul 3, 2025 · Jul 4, 2025 · Jul 7, 2025
diff --git a/.github/workflows/docker-publish.yml b/.github/workflows/docker-publish.yml
@@ -0,0 +1,72 @@
+name: Build & Publish vLLM Docker
+
+on:
+  push:
+    branches:
+      - main
+  workflow_dispatch:
+
+permissions:
+  id-token: write
+  contents: read
+
+concurrency:
+  group: deployment
+  cancel-in-progress: false
+
+jobs:
+  build-and-push:
+    runs-on: ubuntu-22.04
+    timeout-minutes: 360
+
+    env:
+      REGION: us-central1
+      REPO: vllm
+      IMAGE: vllm-forked
+      STAGING_PROJECT: character-ai-staging
+      PROD_PROJECT: character-ai
+
+    steps:
+      - name: Checkout code
+        uses: actions/checkout@v4
+
+      - name: Authenticate to GCP
+        uses: google-github-actions/auth@v2
+        with:
+          workload_identity_provider: ${{ secrets.GCP_WORKLOAD_IDENTITY_PROVIDER }}
+          service_account:           ${{ secrets.GCP_SA_EMAIL }}
+
+      - name: "Set up Cloud SDK"
+        uses: "google-github-actions/setup-gcloud@v2"
+        with:
+          install_components: "beta"
+
+      - name: Configure Docker credential helper
+        run: |
+          gcloud --quiet auth configure-docker ${REGION}-docker.pkg.dev
+          gcloud --quiet auth configure-docker gcr.io
+
+      - name: Determine tags
+        id: tags
+        run: |
+          SHA=$(git rev-parse --short=7 HEAD)
+          echo "sha=$SHA" >> $GITHUB_OUTPUT
+          echo "tags=${SHA},latest" >> $GITHUB_OUTPUT
+
+      - name: Build & Push to Staging, Prod, and GCR
+        uses: docker/build-push-action@v5
+        with:
+          context: .
+          file: ./docker/Dockerfile_internal
+          platforms: linux/amd64
+          push: true
+          build-args: |
+            HF_HOME=/huggingface/cache
+          tags: |
+            ${REGION}-docker.pkg.dev/${{ env.STAGING_PROJECT }}/${{ env.REPO }}/${{ env.IMAGE }}:${{ steps.tags.outputs.sha }}
+            ${REGION}-docker.pkg.dev/${{ env.STAGING_PROJECT }}/${{ env.REPO }}/${{ env.IMAGE }}:latest
+            ${REGION}-docker.pkg.dev/${{ env.STAGING_PROJECT }}/${{ env.REPO }}/${{ env.IMAGE }}:${{ steps.tags.outputs.sha }}
+            ${REGION}-docker.pkg.dev/${{ env.PROD_PROJECT }}/${{ env.REPO }}/${{ env.IMAGE }}:latest
+            gcr.io/${{ env.PROD_PROJECT }}/vllm/${{ env.IMAGE }}:${{ steps.tags.outputs.sha }}
+            gcr.io/${{ env.PROD_PROJECT }}/vllm/${{ env.IMAGE }}:latest
+
diff --git a/docker/Dockerfile_internal b/docker/Dockerfile_internal
@@ -0,0 +1,10 @@
+FROM us-central1-docker.pkg.dev/character-ai/vllm/vllm-forked:latest as builder
+
+COPY . /tmp/vllm
+RUN pip uninstall -y vllm
+RUN pip install /tmp/vllm
+RUN rm -rf /tmp/vllm
+RUN python3 -c "import vllm; print('Custom vLLM loaded successfully')"
+
+
+ENV HF_HOME=/huggingface/cache