[Bugfix] Fix logic for choosing default prefix caching setting (vllm-project#29393)

tdoublep · web-flow · commit 516c3f784723 · 2025-11-25T14:05:10.000Z
Signed-off-by: Thomas Parnell &lt;tpa@zurich.ibm.com&gt;
diff --git a/tests/engine/test_arg_utils.py b/tests/engine/test_arg_utils.py
@@ -277,8 +277,9 @@ def test_prefix_cache_default():
     parser = EngineArgs.add_cli_args(FlexibleArgumentParser())
     args = parser.parse_args([])
 
+    # should be None by default (depends on model).
     engine_args = EngineArgs.from_cli_args(args=args)
-    assert engine_args.enable_prefix_caching, "prefix caching should default to on."
+    assert engine_args.enable_prefix_caching is None
 
     # with flag to turn it on.
     args = parser.parse_args(["--enable-prefix-caching"])
diff --git a/vllm/engine/arg_utils.py b/vllm/engine/arg_utils.py
@@ -880,7 +880,11 @@ def add_cli_args(parser: FlexibleArgumentParser) -> FlexibleArgumentParser:
             "--num-gpu-blocks-override", **cache_kwargs["num_gpu_blocks_override"]
         )
         cache_group.add_argument(
-            "--enable-prefix-caching", **cache_kwargs["enable_prefix_caching"]
+            "--enable-prefix-caching",
+            **{
+                **cache_kwargs["enable_prefix_caching"],
+                "default": None,
+            },
         )
         cache_group.add_argument(
             "--prefix-caching-hash-algo", **cache_kwargs["prefix_caching_hash_algo"]

Original file line number	Diff line number	Diff line change
`@@ -880,7 +880,11 @@ def add_cli_args(parser: FlexibleArgumentParser) -> FlexibleArgumentParser:`
`880`	`880`	`"--num-gpu-blocks-override", **cache_kwargs["num_gpu_blocks_override"]`
`881`	`881`	`)`
`882`	`882`	`cache_group.add_argument(`
`883`		`- "--enable-prefix-caching", **cache_kwargs["enable_prefix_caching"]`
	`883`	`+ "--enable-prefix-caching",`
	`884`	`+ **{`
	`885`	`+ **cache_kwargs["enable_prefix_caching"],`
	`886`	`+ "default": None,`
	`887`	`+ },`
`884`	`888`	`)`
`885`	`889`	`cache_group.add_argument(`
`886`	`890`	`"--prefix-caching-hash-algo", **cache_kwargs["prefix_caching_hash_algo"]`