[Feature] Hot-swap between multiple models

### Problem

Currently switching models in Parallax requires reinitializing the cluster (#80) — scheduler reassigns layers, every worker reloads weights. Fine for occasional switches, but too slow for agent workloads that pick a model per request (small model for routing, larger model for reasoning, etc.).

### Request

Support keeping multiple models loaded at the same time and routing each request to the right one based on the `model` field. True hot-swap, no cluster restart.


Provide feedback

Saved searches

Use saved searches to filter your results more quickly

[Feature] Hot-swap between multiple models #486

Problem

Request

Metadata

Assignees

Labels

Type

Fields

Projects

Milestone

Relationships

Development

[Feature] Hot-swap between multiple models #486

Description

Problem

Request

Metadata

Metadata

Assignees

Labels

Type

Fields

Projects

Milestone

Relationships

Development

Issue actions