Merge pull request #190 from kylebgorman/unique

This enforces uniqueness on --eval_metric.
CUNY-CL · May 8, 2024 · c064067 · c064067
2 parents a71a46e + 1beeca7
commit c064067
Show file tree

Hide file tree

Showing 8 changed files with 72 additions and 30 deletions.
diff --git a/README.md b/README.md
@@ -97,15 +97,16 @@ information.
 
 ### Validation
 
-Validation is run at intervals requested by the user using the lightning interface.
-See `--val_check_interval` and `--check_val_every_n_epoch`
+Validation is run at intervals requested by the user. See
+`--val_check_interval` and `--check_val_every_n_epoch`
 [here](https://lightning.ai/docs/pytorch/stable/common/trainer.html#trainer-class-api).
-Particular evaluation metrics can also be requested with `--eval_metric`. For example
+Additional evaluation metrics can also be requested with `--eval_metric`. For
+example
 
-    yoyodyne-train --eval_metric accuracy --eval_metric ser ...
+    yoyodyne-train --eval_metric ser ...
 
-will compute both accuracy and symbol error rate (SER) each time validation is
-requested. Additional metrics can be added in
+will additionally compute symbol error rate (SER) each time validation is
+performed. Additional metrics can be added to
 [`evaluators.py`](yoyodyne/evaluators.py).
 
 ### Prediction

diff --git a/yoyodyne/__init__.py b/yoyodyne/__init__.py
@@ -5,5 +5,6 @@
     "ignore", ".*does not have many workers which may be a bottleneck.*"
 )
 warnings.filterwarnings(
-    "ignore", ".*option adds dropout after all but last recurrent layer*."
+    "ignore", ".*option adds dropout after all but last recurrent layer.*"
 )
+warnings.filterwarnings("ignore", ".*is a wandb run already in progress.*")
diff --git a/yoyodyne/defaults.py b/yoyodyne/defaults.py
@@ -22,7 +22,7 @@
 HIDDEN_SIZE = 512
 MAX_SOURCE_LENGTH = 128
 MAX_TARGET_LENGTH = 128
-EVAL_METRICS = ["accuracy"]
+EVAL_METRICS = set()
 
 # Training arguments.
 BATCH_SIZE = 32

diff --git a/yoyodyne/evaluators.py b/yoyodyne/evaluators.py
@@ -10,7 +10,7 @@
 import torch
 from torch.nn import functional
 
-from . import defaults
+from . import defaults, util
 
 
 class Error(Exception):
@@ -311,7 +311,7 @@ def get_evaluator(eval_metric: str) -> Evaluator:
     """
     try:
         return _eval_factory[eval_metric]
-    except KeyError(eval_metric):
+    except KeyError:
         raise Error(f"No evaluation metric {eval_metric}")
 
 
@@ -323,8 +323,8 @@ def add_argparse_args(parser: argparse.ArgumentParser) -> None:
     """
     parser.add_argument(
         "--eval_metric",
-        action="append",
+        action=util.UniqueAddAction,
         choices=_eval_factory.keys(),
         default=defaults.EVAL_METRICS,
-        help="Which evaluation metrics to use. Default: %(default)s.",
+        help="Additional metrics to compute. Default: %(default)s.",
     )
diff --git a/yoyodyne/metrics.py b/yoyodyne/metrics.py
@@ -21,8 +21,9 @@ def __init__(self, metric):
         """Initializes the metrics.
 
         Args:
-            metric (str): one of "accuracy" (maximizes validation accuracy)
-                or "loss" (minimizes validation loss).
+            metric (str): one of "accuracy" (maximizes validation accuracy),
+                "loss" (minimizes validation loss), or "ser" (minimizes
+                symbol error rate).
 
         Raises:
             Error: Unknown metric.
@@ -35,5 +36,9 @@ def __init__(self, metric):
             self.filename = "model-{epoch:03d}-{val_loss:.3f}"
             self.mode = "min"
             self.monitor = "val_loss"
+        elif metric == "ser":
+            self.filename = "model-{epoch:03d}-{val_ser:.3f}"
+            self.mode = "min"
+            self.monitor = "val_ser"
         else:
             raise Error(f"Unknown metric: {metric}")
diff --git a/yoyodyne/models/base.py b/yoyodyne/models/base.py
@@ -4,7 +4,7 @@
 """
 
 import argparse
-from typing import Callable, Dict, List, Optional
+from typing import Callable, Dict, Optional, Set
 
 import pytorch_lightning as pl
 import torch
@@ -51,7 +51,7 @@ class BaseEncoderDecoder(pl.LightningModule):
     source_encoder_cls: modules.base.BaseModule
     # Constructed inside __init__.
     dropout_layer: nn.Dropout
-    eval_metrics: List[evaluators.Evaluator]
+    eval_metrics: Set[evaluators.Evaluator]
     loss: Callable[[torch.Tensor, torch.Tensor], torch.Tensor]
 
     def __init__(

diff --git a/yoyodyne/train.py b/yoyodyne/train.py
@@ -14,7 +14,7 @@ class Error(Exception):
     pass
 
 
-def _get_logger(experiment: str, model_dir: str, log_wandb: bool) -> List:
+def _get_loggers(experiment: str, model_dir: str, log_wandb: bool) -> List:
     """Creates the logger(s).
 
     Args:
@@ -25,21 +25,20 @@ def _get_logger(experiment: str, model_dir: str, log_wandb: bool) -> List:
     Returns:
         List: logger.
     """
-    trainer_logger = [loggers.CSVLogger(model_dir, name=experiment)]
+    trainer_loggers = [loggers.CSVLogger(model_dir, name=experiment)]
     if log_wandb:
-        trainer_logger.append(loggers.WandbLogger(project=experiment))
-        # Tells PTL to log the best validation accuracy.
-        wandb.define_metric("val_accuracy", summary="max")
+        trainer_loggers.append(loggers.WandbLogger(project=experiment))
         # Logs the path to local artifacts made by PTL.
-        wandb.config["local_run_dir"] = trainer_logger[0].log_dir
-    return trainer_logger
+        wandb.config["local_run_dir"] = trainer_loggers[0].log_dir
+    return trainer_loggers
 
 
 def _get_callbacks(
     num_checkpoints: int = defaults.NUM_CHECKPOINTS,
     checkpoint_metric: str = defaults.CHECKPOINT_METRIC,
     patience: Optional[int] = None,
     patience_metric: str = defaults.PATIENCE_METRIC,
+    log_wandb: bool = False,
 ) -> List[callbacks.Callback]:
     """Creates the callbacks.
 
@@ -56,6 +55,7 @@ def _get_callbacks(
             early stopping.
         patience_metric (string, optional): validation metric used to
             trigger early stopping.
+        log_wandb (bool).
 
     Returns:
         List[callbacks.Callback]: callbacks.
@@ -85,6 +85,9 @@ def _get_callbacks(
             save_top_k=num_checkpoints,
         )
     )
+    # Logs the best value for the checkpointing metric.
+    if log_wandb:
+        wandb.define_metric(metric.monitor, summary=metric.mode)
     return trainer_callbacks
 
 
@@ -106,10 +109,11 @@ def get_trainer_from_argparse_args(
             args.checkpoint_metric,
             args.patience,
             args.patience_metric,
+            args.log_wandb,
         ),
         default_root_dir=args.model_dir,
         enable_checkpointing=True,
-        logger=_get_logger(args.experiment, args.model_dir, args.log_wandb),
+        logger=_get_loggers(args.experiment, args.model_dir, args.log_wandb),
     )
 
 
@@ -167,6 +171,7 @@ def get_model_from_argparse_args(
     source_encoder_cls = models.modules.get_encoder_cls(
         encoder_arch=args.source_encoder_arch, model_arch=args.arch
     )
+    # Loads expert if needed.
     expert = (
         models.expert.get_expert(
             datamodule.train_dataloader().dataset,
@@ -198,6 +203,12 @@ def get_model_from_argparse_args(
         if not separate_features
         else datamodule.index.source_vocab_size
     )
+    # This makes sure we compute all metrics that'll be needed.
+    eval_metrics = args.eval_metric.copy()
+    if args.checkpoint_metric != "loss":
+        eval_metrics.add(args.checkpoint_metric)
+    if args.patience_metric != "loss":
+        eval_metrics.add(args.patience_metric)
     # Please pass all arguments by keyword and keep in lexicographic order.
     return model_cls(
         arch=args.arch,
@@ -211,7 +222,7 @@ def get_model_from_argparse_args(
         embedding_size=args.embedding_size,
         encoder_layers=args.encoder_layers,
         end_idx=datamodule.index.end_idx,
-        eval_metrics=args.eval_metric,
+        eval_metrics=eval_metrics,
         expert=expert,
         features_encoder_cls=features_encoder_cls,
         features_vocab_size=features_vocab_size,
@@ -298,10 +309,10 @@ def add_argparse_args(parser: argparse.ArgumentParser) -> None:
     )
     parser.add_argument(
         "--checkpoint_metric",
-        choices=["accuracy", "loss"],
+        choices=["accuracy", "loss", "ser"],
         default=defaults.CHECKPOINT_METRIC,
-        help="Selects checkpoints to maximize validation `accuracy` "
-        "or minimize validation `loss`. "
+        help="Selects checkpoints to maximize validation `accuracy`, "
+        "or to minimize validation `loss` or `ser`. "
         "Default: %(default)s.",
     )
     parser.add_argument(
@@ -313,10 +324,11 @@ def add_argparse_args(parser: argparse.ArgumentParser) -> None:
     )
     parser.add_argument(
         "--patience_metric",
-        choices=["accuracy", "loss"],
+        choices=["accuracy", "loss", "ser"],
         default=defaults.PATIENCE_METRIC,
         help="Stops early when validation `accuracy` stops increasing or "
-        "when validation `loss` stops decreasing. Default: %(default)s.",
+        "when validation `loss` or `ser` stops decreasing. "
+        "Default: %(default)s.",
     )
     parser.add_argument("--seed", type=int, help="Random seed.")
     parser.add_argument(
@@ -366,6 +378,8 @@ def main() -> None:
     add_argparse_args(parser)
     args = parser.parse_args()
     util.log_arguments(args)
+    if args.log_wandb:
+        wandb.init()
     pl.seed_everything(args.seed)
     trainer = get_trainer_from_argparse_args(args)
     datamodule = get_datamodule_from_argparse_args(args)

diff --git a/yoyodyne/util.py b/yoyodyne/util.py
@@ -3,6 +3,27 @@
 import argparse
 import sys
 
+from typing import Any, Optional
+
+
+# Argument parsing.
+
+
+class UniqueAddAction(argparse.Action):
+    """Custom action that enforces uniqueness using a set."""
+
+    def __call__(
+        self,
+        parser: argparse.ArgumentParser,
+        namespace: argparse.Namespace,
+        values: Any,
+        option_string: Optional[str] = None,
+    ) -> None:
+        getattr(namespace, self.dest).add(values)
+
+
+# Logging.
+
 
 def log_info(msg: str) -> None:
     """Logs msg to sys.stderr.