[V1] Defragmentation support #1568

madamczyk-intel · 2025-07-10T12:37:56Z

extension PR: HabanaAI/vllm-hpu-extension#275

madamczyk-intel · 2025-07-10T12:38:11Z

/run-gaudi-tests

madamczyk-intel · 2025-07-17T12:37:11Z

/run-gaudi-tests

madamczyk-intel · 2025-07-17T12:41:28Z

/run-gaudi-tests

Copilot

Pull Request Overview

This PR adds support for memory defragmentation in the HPU model runner, introduces step-based profiling in the HPU worker, and ensures runtime configuration is finalized.

Invoke and import finalize_config to apply updated runtime settings.
Add setup_step_profiler and debug logging to track per-step profiling in HPUWorker.
Integrate OnlineDefragmenter into HPUModelRunner to resolve, track, and defragment block IDs.
Update HPU extension dependency to the defragmentation-enabled branch.

Reviewed Changes

Copilot reviewed 4 out of 4 changed files in this pull request and generated 4 comments.

File	Description
vllm/worker/hpu_model_runner.py	Import and call `finalize_config` after setting VLLM config.
vllm/v1/worker/hpu_worker.py	Add `setup_step_profiler`, per-step profiling, and debug logging.
vllm/v1/worker/hpu_model_runner.py	Initialize and use `OnlineDefragmenter` throughout model runner.
requirements/hpu.txt	Point `vllm-hpu-extension` to `dev/madamczyk/v1_defrag` branch.

Comments suppressed due to low confidence (5)

vllm/v1/worker/hpu_worker.py:36

[nitpick] The helper setup_step_profiler lacks a docstring; add a brief description of its purpose and the meaning of its parameters.

def setup_step_profiler(steps):

vllm/v1/worker/hpu_worker.py:104

[nitpick] The attribute name step_debug may not clearly convey its purpose; consider renaming it to step_logger or similar for clarity.

        self.step_debug = init_debug_logger('steps')

vllm/v1/worker/hpu_worker.py:101

[nitpick] The variable step is quite generic; renaming to current_step or step_counter could improve readability.

        self.step = 0

vllm/v1/worker/hpu_model_runner.py:619

The integration of OnlineDefragmenter is significant but currently untested; consider adding unit tests for its resolve, update_state, and defragment flows.

        self.defragmenter = OnlineDefragmenter()

vllm/worker/hpu_model_runner.py:990

[nitpick] The indentation of finalize_config() is inconsistent with the surrounding block; align it with the environment.set_vllm_config call for clarity.

        finalize_config()

vllm/worker/hpu_model_runner.py

vllm/v1/worker/hpu_worker.py

vllm/v1/worker/hpu_model_runner.py

requirements/hpu.txt

vllm/v1/worker/hpu_worker.py

vllm/v1/worker/hpu_model_runner.py

Signed-off-by: Michal Adamczyk <madamczyk@habana.ai>

madamczyk-intel · 2025-07-29T11:37:57Z

/run-gaudi-tests

Signed-off-by: Michal Adamczyk <madamczyk@habana.ai>

madamczyk-intel · 2025-07-29T11:43:40Z

/run-gaudi-tests

madamczyk-intel · 2025-07-29T11:44:20Z

/run-gaudi-tests

madamczyk-intel · 2025-07-30T07:30:16Z

/skip-gaudi-tests

madamczyk-intel · 2025-07-30T07:31:44Z

CI tests already passed before sha update: ef7cbbc

madamczyk-intel force-pushed the dev/madamczyk/v1_defrag branch 2 times, most recently from 2a8407a to a3b8961 Compare July 17, 2025 12:11

madamczyk-intel requested a review from Copilot July 17, 2025 12:41

Copilot AI reviewed Jul 17, 2025

View reviewed changes

vllm/worker/hpu_model_runner.py Show resolved Hide resolved

vllm/v1/worker/hpu_worker.py Show resolved Hide resolved

vllm/v1/worker/hpu_model_runner.py Show resolved Hide resolved

requirements/hpu.txt Outdated Show resolved Hide resolved

madamczyk-intel marked this pull request as ready for review July 17, 2025 12:55

madamczyk-intel requested review from kzawora-intel, michalkuligowski, mgawarkiewicz-intel, vivekgoe, afierka-intel, xuechendi, jikunshang, mswiniarsk and PatrykWo as code owners July 17, 2025 12:55

madamczyk-intel mentioned this pull request Jul 18, 2025

[V1] Defragmentation support HabanaAI/vllm-hpu-extension#275

Merged

mswiniarsk requested changes Jul 18, 2025

View reviewed changes

vllm/v1/worker/hpu_worker.py Outdated Show resolved Hide resolved

vllm/v1/worker/hpu_model_runner.py Show resolved Hide resolved

madamczyk-intel added 3 commits July 29, 2025 11:48

[V1] KV-cache defragmentation support

d9ec5f7

Signed-off-by: Michal Adamczyk <madamczyk@habana.ai>

Remove assertion

3698d43

Signed-off-by: Michal Adamczyk <madamczyk@habana.ai>

Exclude empty new_block_ids

dde41a0

Signed-off-by: Michal Adamczyk <madamczyk@habana.ai>

madamczyk-intel force-pushed the dev/madamczyk/v1_defrag branch from ab51d58 to dde41a0 Compare July 29, 2025 10:11

Oopsie

058e432

Signed-off-by: Michal Adamczyk <madamczyk@habana.ai>

Merge branch 'habana_main' into dev/madamczyk/v1_defrag

ef7cbbc

mswiniarsk approved these changes Jul 30, 2025

View reviewed changes

Set vllm-hpu-extension to cd79204

3294bb3

madamczyk-intel merged commit 046343b into habana_main Jul 30, 2025
6 checks passed

madamczyk-intel deleted the dev/madamczyk/v1_defrag branch July 30, 2025 07:32

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Uh oh!

[V1] Defragmentation support #1568

[V1] Defragmentation support #1568

Uh oh!

madamczyk-intel commented Jul 10, 2025 •

edited

Loading

Uh oh!

madamczyk-intel commented Jul 10, 2025

Uh oh!

madamczyk-intel commented Jul 17, 2025

Uh oh!

madamczyk-intel commented Jul 17, 2025

Uh oh!

Copilot AI left a comment

Uh oh!

Uh oh!

Uh oh!

Uh oh!

Uh oh!

Uh oh!

Uh oh!

madamczyk-intel commented Jul 29, 2025

Uh oh!

madamczyk-intel commented Jul 29, 2025

Uh oh!

madamczyk-intel commented Jul 29, 2025

Uh oh!

madamczyk-intel commented Jul 30, 2025

Uh oh!

madamczyk-intel commented Jul 30, 2025

Uh oh!

Uh oh!

Uh oh!

[V1] Defragmentation support #1568

[V1] Defragmentation support #1568

Uh oh!

Conversation

madamczyk-intel commented Jul 10, 2025 • edited Loading Uh oh! There was an error while loading. Please reload this page.

Uh oh!

Uh oh!

madamczyk-intel commented Jul 10, 2025

Uh oh!

madamczyk-intel commented Jul 17, 2025

Uh oh!

madamczyk-intel commented Jul 17, 2025

Uh oh!

Copilot AI left a comment

Choose a reason for hiding this comment

Pull Request Overview

Reviewed Changes

Uh oh!

Uh oh!

Uh oh!

Uh oh!

Uh oh!

Uh oh!

Uh oh!

madamczyk-intel commented Jul 29, 2025

Uh oh!

madamczyk-intel commented Jul 29, 2025

Uh oh!

madamczyk-intel commented Jul 29, 2025

Uh oh!

madamczyk-intel commented Jul 30, 2025

Uh oh!

madamczyk-intel commented Jul 30, 2025

Uh oh!

Uh oh!

Uh oh!

madamczyk-intel commented Jul 10, 2025 •

edited

Loading