ROCm · pabloantoniom · Dec 1, 2025 · Dec 1, 2025 · Dec 1, 2025 · Dec 3, 2025
@@ -74,7 +74,10 @@ def verify_kernel_with_perfconfig(perfconfig, config, paths: Paths, options: Opt
         ] + mlir_cpu_runner_args
 
     if options.debug:
+        print('Running commands:', file=sys.stderr)
         print(rocmlir_gen_command, file=sys.stderr)
+        print(rocmlir_driver_command, file=sys.stderr)
+        print(profiler_command, file=sys.stderr)
 
     prevdir = os.getcwd()
     with tempfile.TemporaryDirectory() as tmpdir:
@@ -123,7 +126,9 @@ def get_winning_config(tuning_output, test_vector, config, all_data, paths: Path
     max_tflops = -np.inf
     min_ns = np.inf
     winning_config = "None"
-    for i, result in enumerate(tuning_output):
+    num_tuning_outputs = 0
+    for i, result in enumerate(tuning_output.splitlines()):
+        num_tuning_outputs += 1
         result = result.decode('utf-8').strip()
         if not options.quiet and not options.compact_print and i > 0 and i % 100 == 0:
             print(
@@ -165,6 +170,8 @@ def get_winning_config(tuning_output, test_vector, config, all_data, paths: Path
                     f"Tested {i} configs, best perf {max_tflops} TFlops {min_ns} ns on perf_config {winning_config}",
                     file=sys.stderr)
 
+    if (num_tuning_outputs == 0):
-    if (num_tuning_outputs == 0):
+    if num_tuning_outputs == 0:
-    if (num_tuning_outputs == 0):
+    if num_tuning_outputs == 0:
+        raise RuntimeError('tuning output is empty')
     return winning_config, max_tflops
 
 
@@ -194,7 +201,16 @@ def tune_mlir_kernels(configs, conf_class, paths: Paths, options: Options):
                                            stdin=kernel_gen.stdout,
                                            stdout=subprocess.PIPE,
                                            stderr=subprocess.PIPE)
-            kernel_gen.stdout.close()
+
+            # Wait for both processes to finish.
+            tuning_loop_stdout, _ = tuning_loop.communicate()
+            kernel_gen.communicate()
+
+            # Make sure both processes finished successfully.
+            if kernel_gen.returncode != 0:
+                raise RuntimeError(f'rocmlir-gen command failed: {kernel_gen_command}')
+            if tuning_loop.returncode != 0:
+                raise RuntimeError(f'rocmlir-tuning-driver command failed: {paths.mlir_paths.rocmlir_tuning_driver_path} {tuning_driver_args}')
         else:
             # pipe to rocmlir_gen --emit-tuning-key
             tuning_key = subprocess.Popen(
@@ -211,8 +227,13 @@ def tune_mlir_kernels(configs, conf_class, paths: Paths, options: Options):
                                            stdout=subprocess.PIPE,
                                            stderr=subprocess.PIPE)
 
+            # Wait and make sure the process finished successfully.
+            tuning_loop_stdout, _ = tuning_loop.communicate()
+            if tuning_loop.returncode != 0:
+                raise RuntimeError(f'rocmlir-tuning-driver command failed: {paths.mlir_paths.rocmlir_tuning_driver_path} {tuning_driver_args}')
+
         # Tune, printing progress as we go to avoid CI timeouts
-        winning_config, max_tflops = get_winning_config(tuning_loop.stdout, test_vector, config,
+        winning_config, max_tflops = get_winning_config(tuning_loop_stdout, test_vector, config,
                                                         all_data, paths, options)
 
         if options.verify_mode != "none":