fix dsa as num_block is correct

MengqingCao · MengqingCao · commit 8c58f9d7809a · 2025-10-30T14:33:51.000Z
Signed-off-by: MengqingCao &lt;cmq0113@163.com&gt;
diff --git a/vllm_ascend/worker/model_runner_v1.py b/vllm_ascend/worker/model_runner_v1.py
@@ -3355,26 +3355,14 @@ def _reshape_kv_cache_tensors(
                     else:
                         # k_cache: nope_cache    v_cache: rope_cache
                         mla_num_blocks, mla_block_size, num_kv_heads, _ = kv_cache_shape
-                        if not self.use_sparse:
-                            k_shape = [
-                                mla_num_blocks, mla_block_size, num_kv_heads,
-                                self.model_config.hf_text_config.kv_lora_rank
-                            ]
-                            v_shape = [
-                                mla_num_blocks, mla_block_size, num_kv_heads,
-                                self.model_config.hf_text_config.
-                                qk_rope_head_dim
-                            ]
-                        else:
-                            k_shape = [
-                                mla_num_blocks, mla_block_size, num_kv_heads,
-                                self.model_config.hf_text_config.kv_lora_rank
-                            ]
-                            v_shape = [
-                                mla_num_blocks, mla_block_size, num_kv_heads,
-                                self.model_config.hf_text_config.
-                                qk_rope_head_dim
-                            ]
+                        k_shape = [
+                            mla_num_blocks, mla_block_size, num_kv_heads,
+                            self.model_config.hf_text_config.kv_lora_rank
+                        ]
+                        v_shape = [
+                            mla_num_blocks, mla_block_size, num_kv_heads,
+                            self.model_config.hf_text_config.qk_rope_head_dim
+                        ]
                     k_cache = raw_k_tensor.view(dtype).view(k_shape)
                     k_cache = self._convert_torch_format(k_cache)
                     v_cache = raw_v_tensor.view(dtype).view(v_shape)