MiroMindAI · BinWang28 · Oct 16, 2025 · Oct 16, 2025 · Copilot · Oct 16, 2025
diff --git a/docs/mkdocs/docs/hle_text_only.md b/docs/mkdocs/docs/hle_text_only.md
@@ -9,7 +9,7 @@ More details: [HLE text only Dataset on HuggingFace](https://huggingface.co/data
 ## Dataset Overview
 
 !!! info "HLE Dataset (text only)"
-    The dataset is a text-only subset of HLE. 
+    The experiments are conducted on the **500 text-only subset** of the HLE dataset, available from [WebThinker](https://github.com/RUC-NLPIR/WebThinker/blob/main/data/HLE/test.json).
 
 ---
 

diff --git a/utils/prepare_benchmark/gen_hle_text_only.py b/utils/prepare_benchmark/gen_hle_text_only.py
@@ -2,29 +2,31 @@
 #
 # SPDX-License-Identifier: Apache-2.0
 
+
+import json
 from typing import Generator, MutableMapping
 
-from datasets import load_dataset
+import requests
 
 from utils.prepare_benchmark.common import Task
 
 
 def gen_hle_text_only(hf_token: str) -> Generator[Task, None, None]:
-    dataset = load_dataset("macabdul9/hle_text_only", split="test", token=hf_token)
-    for x in dataset:
-        metadata: MutableMapping = x  # type: ignore
-        task_id = metadata.pop("id")
-        question = metadata.pop("question")
-        gt = metadata.pop("answer")
-        metadata.pop("image_preview")
-        metadata.pop("rationale_image")
+    response = requests.get(
+        "https://raw.githubusercontent.com/RUC-NLPIR/WebThinker/refs/heads/main/data/HLE/test.json"
+    )
-    )
+    )
+    response.raise_for_status()
-    )
+    )
+    response.raise_for_status()
+    dataset = json.loads(response.content)
-    dataset = json.loads(response.content)
+    dataset = response.json()
-    dataset = json.loads(response.content)
+    dataset = response.json()
+    for row in dataset:
+        metadata: MutableMapping = row
+        task_id = str(metadata.pop("id", ""))
-        task_id = str(metadata.pop("id", ""))
+        try:
+            task_id = str(metadata.pop("id"))
+        except KeyError:
+            raise ValueError(f"Missing 'id' field in row: {row}")
-        task_id = str(metadata.pop("id", ""))
+        try:
+            task_id = str(metadata.pop("id"))
+        except KeyError:
+            raise ValueError(f"Missing 'id' field in row: {row}")
+        question = metadata.pop("Question", "")
+        answer = metadata.pop("answer", "")
         task = Task(
             task_id=task_id,
             task_question=question,
-            ground_truth=gt,
+            ground_truth=answer,
             file_path=None,
             metadata=metadata,
         )
         yield task
-
     return