Support batched generation for llama.cpp #102

Closed

Closed

Support batched generation for llama.cpp#102

Labels

the-crypt-keeper

opened

on Oct 11, 2023

Batch generation has landed: ggml-org/llama.cpp#3228

This should make our test suite ~10x faster on GGUF models.

Metadata

Assignees

No one assigned

Labels

Projects

No projects

Milestone

No milestone

Relationships

None yet

Development

No branches or pull requests