use triton_util instaed of triton

Lord_of_Ironhill · Lord_of_Ironhill · commit 16cad8ad6364 · 2025-11-28T20:03:49.000+08:00
diff --git a/vllm_ascend/sample/rejection_sampler.py b/vllm_ascend/sample/rejection_sampler.py
@@ -9,19 +9,10 @@
                                               apply_sampling_constraints,
                                               generate_uniform_probs)
 from vllm.v1.spec_decode.metadata import SpecDecodeMetadata
+from vllm.triton_utils import HAS_TRITON, triton
+from vllm.triton_utils import triton.language as tl
 
-<<<<<<< HEAD
-from vllm_ascend.utils import vllm_version_is
 
-if vllm_version_is("0.11.0"):
-    from vllm.v1.sample.rejection_sampler import compute_probs
-else:
-    from vllm.v1.sample.rejection_sampler import apply_sampling_constraints
-
-import triton.language as tl
-
-=======
->>>>>>> a1f142b... Drop 0.11.0 support (#4377)
 PLACEHOLDER_TOKEN_ID = -1
 GREEDY_TEMPERATURE = -1
 # Maximum number of speculative draft tokens allowed per request in a single