Fix batch inference by makaveli10 · Pull Request #511 · collabora/WhisperLive

makaveli10 · 2026-06-16T10:30:17Z

The batched inference path in _process_multi decoded only at temperature=0.0 with no quality gating, causing 224-token hallucination loops on short/silent inputs.
Mirror faster_whisper.transcribe()'s per-item fallback: re-decode failed items at higher temperatures based on compression_ratio, avg_logprob, and no_speech_prob thresholds. Accept empty result for high-no_speech + low-logprob items as silence.

Signed-off-by: makaveli10 <vineet.suryan@collabora.com>

makaveli10 added 2 commits June 16, 2026 15:54

Enable single-model mode for stock models when batch_inference is set

55bb5da

Signed-off-by: makaveli10 <vineet.suryan@collabora.com>

fix(batch): add temperature fallback to prevent decoder runaway

67f8ccf

Signed-off-by: makaveli10 <vineet.suryan@collabora.com>

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Fix batch inference#511

Fix batch inference#511
makaveli10 wants to merge 2 commits into
collabora:mainfrom
makaveli10:fix-batch-inference

makaveli10 commented Jun 16, 2026

Uh oh!

Reviewers

Assignees

Labels

Milestone

Development

Uh oh!

1 participant

Conversation

makaveli10 commented Jun 16, 2026

Uh oh!

Reviewers

Assignees

Labels

Milestone

Development

Uh oh!

1 participant