xx

wangxiaoxin-sherie · wangxiaoxin-sherie · commit 6b5ca13aba91 · 2025-10-21T17:29:16.000+08:00
diff --git a/vllm_ascend/worker/model_runner_v1.py b/vllm_ascend/worker/model_runner_v1.py
@@ -2271,6 +2271,9 @@ def _build_dummy_attn_metadata(
             self.seq_lens_np[:num_reqs] = seq_lens
             self.seq_lens_np[num_reqs:] = 0
 
+            self.query_start_loc[:num_reqs + 1] = torch.arange(num_reqs + 1)
+            self.query_start_loc_cpu[:num_reqs + 1] = torch.arange(num_reqs + 1)
+
             num_computed_tokens_cpu = (
                 self.input_batch.num_computed_tokens_cpu_tensor[:num_reqs])