vllm-project
diff --git a/‎examples/offline_dualbatch_overlap_npu.py‎
Lines changed: 0 additions & 52 deletions b/‎examples/offline_dualbatch_overlap_npu.py‎
Lines changed: 0 additions & 52 deletions
diff --git a/‎tests/ut/attention/test_mla_v1.py‎
Lines changed: 0 additions & 20 deletions b/‎tests/ut/attention/test_mla_v1.py‎
Lines changed: 0 additions & 20 deletions
diff --git a/‎tests/ut/multistream/test_base.py‎
Lines changed: 0 additions & 32 deletions b/‎tests/ut/multistream/test_base.py‎
Lines changed: 0 additions & 32 deletions
diff --git a/‎tests/ut/multistream/test_decorator.py‎
Lines changed: 0 additions & 47 deletions b/‎tests/ut/multistream/test_decorator.py‎
Lines changed: 0 additions & 47 deletions
diff --git a/‎tests/ut/multistream/test_layers.py‎
Lines changed: 0 additions & 198 deletions b/‎tests/ut/multistream/test_layers.py‎
Lines changed: 0 additions & 198 deletions
@@ -623,11 +623,8 @@ def test_exec_kv_decode(self, mock_kv_rmsnorm_rope_cache):
         self.assertEqual(k_nope.shape[-1], self.impl.kv_lora_rank)
 
     @patch('vllm_ascend.attention.mla_v1.get_forward_context')
-    @patch("torch.npu.stream")
-    @patch("vllm_ascend.attention.mla_v1.get_multistream_comm_context")
     @patch("torch_npu.npu_fused_infer_attention_score")
     def test_forward_decode(self, mock_npu_fused_infer_attention_score,
-                            mock_get_multistream_comm_context, mock_npu_stream,
                             mock_get_forward_context):
         B = 2
         N = self.impl.num_kv_heads
@@ -651,27 +648,10 @@ def test_forward_decode(self, mock_npu_fused_infer_attention_score,
         mock_npu_fused_infer_attention_score.return_value = [
             torch.randn(B, N, self.impl.kv_lora_rank), None
         ]
-        mock_get_multistream_comm_context.return_value = None
-
         mock_get_forward_context.return_value = MagicMock(capturing=False)
         result = self.impl._forward_decode(q_nope, q_pe, k_nope, k_pe, BS,
                                            attn_metadata)
 
         self.assertEqual(result.shape[0], B)
         self.assertEqual(result.shape[1], N)
         self.assertEqual(result.shape[2], HD)
-
-        self.impl.enable_kv_nz = False
-        attn_metadata.attn_state = None
-        mock_return_value = MagicMock()
-        mock_get_multistream_comm_context.return_value = mock_return_value
-        mock_return_value.before_comm_event = MagicMock()
-        mock_return_value.comm_stream = MagicMock()
-        mock_npu_stream.return_value = MagicMock()
-
-        result = self.impl._forward_decode(q_nope, q_pe, k_nope, k_pe, BS,
-                                           attn_metadata)
-
-        self.assertEqual(result.shape[0], B)
-        self.assertEqual(result.shape[1], N)
-        self.assertEqual(result.shape[2], HD)