need summarize all(all videocards) gpu memory count when rpc #11194

lexasub · 2025-01-11T16:50:25Z

lexasub
Jan 11, 2025

Hello, we need summarize all(all videocards) gpu memory count when rpc. When rpc server running, we may have any count of gpu, we need count all memory. https://github.com/ggerganov/llama.cpp/blob/c05e8c9934f94fde49bc1bc9dc51eed282605150/examples/rpc/rpc-server.cpp#L116

lexasub · 2025-01-11T17:08:16Z

lexasub
Jan 11, 2025
Author

the task seems to be more complicated than I thought, in the first approximation, it will be necessary to raise several backends ggml_backend_rpc_start_server(backend, endpoint.c_str(), free_mem, total_mem), which is not good, it is necessary to “adapt” ggml_backend_cuda_init/ggml_backend.

0 replies

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Uh oh!

need summarize all(all videocards) gpu memory count when rpc #11194

Uh oh!

{{title}}

Uh oh!

Uh oh!

{{editor}}'s edit

{{editor}}'s edit

Uh oh!

Replies: 1 comment

Uh oh!

{{title}}

Uh oh!

Select a reply

Uh oh!

need summarize all(all videocards) gpu memory count when rpc #11194

Uh oh!

Uh oh!

lexasub Jan 11, 2025

Replies: 1 comment

Uh oh!

lexasub Jan 11, 2025 Author

lexasub
Jan 11, 2025

lexasub
Jan 11, 2025
Author