fix(trainer): correct token count calculation for 2D activation in LORSA training

Frankstein73 · Frankstein73 · commit 65c956afc985 · 2025-12-02T16:41:46.000+08:00
diff --git a/src/lm_saes/trainer.py b/src/lm_saes/trainer.py
@@ -213,7 +213,8 @@ def _initialize_trainer(
         activation_stream: Iterable[dict[str, Tensor]],
         wandb_logger: Run | None = None,
     ):
-        bs = batch_size(next(iter(activation_stream)))
+        batch = next(iter(activation_stream))
+        bs = batch["tokens"].numel() if batch.get("mask") is None else int(item(batch["mask"].sum()))
         self.total_training_steps = self.cfg.total_training_tokens // bs
 
         def calculate_warmup_steps(warmup_steps: float | int) -> int: