vLLM for SBERT #1575

david-koleckar · 2023-11-06T21:24:40Z

david-koleckar
Nov 6, 2023

Hi there,
would it be possible to add sbert model (eg. paraphrase-multilingual-mpnet-base-v2) to vLLM as described in adding a new model?
Thank you, David

WoosukKwon · 2023-11-07T00:58:56Z

WoosukKwon
Nov 7, 2023
Maintainer

Hi @david-koleckar, thanks for the proposal. For now, we are not planning to support SBERT model or other embedding/encoder models. vLLM is optimized for generative (auto-regressive) Transformers. Its core technologies like PagedAttention cannot be used for embedding/encoder models.

0 replies

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Uh oh!

Uh oh!

vLLM for SBERT #1575

Uh oh!

{{title}}

Uh oh!

Replies: 1 comment

Uh oh!

{{title}}

Uh oh!

Select a reply

Uh oh!

Uh oh!

vLLM for SBERT #1575

Uh oh!

david-koleckar Nov 6, 2023

Replies: 1 comment

Uh oh!

WoosukKwon Nov 7, 2023 Maintainer

david-koleckar
Nov 6, 2023

WoosukKwon
Nov 7, 2023
Maintainer