get model device

eitanturok · eitanturok · commit 0c59e9da82c9 · 2025-09-05T21:26:09.000Z
diff --git a/vllm/v1/spec_decode/eagle.py b/vllm/v1/spec_decode/eagle.py
@@ -654,7 +654,9 @@ def load_model(self, target_model: nn.Module) -> None:
         self.hot_token_ids = None
         if self.vllm_config.speculative_config.draft_vocab_pruned:
             logger.info(f"Loading pruned draft model vocabulary from {self.vllm_config.speculative_config.draft_vocab_pruned}")
-            self.hot_token_ids = load_draft_vocab_pruned(self.vllm_config.speculative_config.draft_vocab_pruned).to(self.model.device)
+            self.hot_token_ids = load_draft_vocab_pruned(self.vllm_config.speculative_config.draft_vocab_pruned)
+            device = next(self.model.model.parameters()).device
+            self.hot_token_ids = self.hot_token_ids.to(device)
             head = self.model.model.embed_tokens.weight