microsoft · Aishwarya-Tonpe · Aug 5, 2025 · Aug 11, 2025 · Aug 11, 2025 · Aug 11, 2025
@@ -0,0 +1,109 @@
+# Copyright (c) Microsoft Corporation.
+# Licensed under the MIT license.
+
+"""Unified PyTorch deterministic training example for all supported models.
+
+Commands to run:
+Generate log:
+
+CUBLAS_WORKSPACE_CONFIG=:4096:8 python3 examples/benchmarks/pytorch_deterministic_example.py
+--model <model_from_MODEL_CHOICES> --generate-log --log-path ./outputs/determinism_ref.json
+
+CUBLAS_WORKSPACE_CONFIG=:4096:8 python3 examples/benchmarks/pytorch_deterministic_example.py
+--model bert-large --generate-log --log-path ./outputs/determinism_ref.json
+
+
+
+Compare log:
+
+CUBLAS_WORKSPACE_CONFIG=:4096:8 python3 examples/benchmarks/pytorch_deterministic_example.py
+--model <model_from_MODEL_CHOICES> --compare-log ./outputs/determinism_ref.json
+
+
+CUBLAS_WORKSPACE_CONFIG=:4096:8 python3 examples/benchmarks/pytorch_deterministic_example.py
+--model bert-large --compare-log ./outputs/determinism_ref.json
+"""
+
+import argparse
+from superbench.benchmarks import BenchmarkRegistry, Framework
+
+MODEL_CHOICES = [
+    "bert-large",
+    "gpt2-small",
+    "llama2-7b",
+    "mixtral-8x7b",
+    "resnet101",
+    "lstm",
+]
+
+DEFAULT_PARAMS = {
+    "bert-large": "--batch_size 1 --seq_len 128 --num_warmup 1 --num_steps 300 --precision float32 "
+    "--model_action train --deterministic --deterministic_seed 42 --check_frequency 20",
+    "gpt2-small": "--batch_size 1 --num_steps 300 --num_warmup 1 --seq_len 128 --precision float32 "
+    "--model_action train --deterministic --deterministic_seed 42 --check_frequency 20",
+    "llama2-7b": "--batch_size 1 --num_steps 300 --num_warmup 1 --seq_len 512 --precision float32 --model_action train "
+    "--deterministic --deterministic_seed 42 --check_frequency 20",
+    "mixtral-8x7b": "--hidden_size=4096 --num_hidden_layers=32 --num_attention_heads=32 --intermediate_size=14336 "
+    "--num_key_value_heads=8 --max_position_embeddings=32768 --router_aux_loss_coef=0.02 "
+    "--deterministic --deterministic_seed 42 --check_frequency 20",
+    "resnet101": "--batch_size 192 --precision float32 float32 --num_warmup 64 --num_steps 512 --sample_count 8192 "
+    "--pin_memory --model_action train --deterministic --deterministic_seed 42 --check_frequency 20",
+    "lstm": "--batch_size 1 --num_steps 300 --num_warmup 1 --seq_len 256 --precision float16 "
+    "--model_action train --deterministic --deterministic_seed 42 --check_frequency 20",
+}
+
+
+def main():
+    parser = argparse.ArgumentParser(
+        description="Unified PyTorch deterministic training example."
+    )
+    parser.add_argument(
+        "--model", type=str, choices=MODEL_CHOICES, required=True, help="Model to run."
+    )
+    parser.add_argument(
+        "--generate-log", action="store_true", help="Enable fingerprint log generation."
+    )
+    parser.add_argument(
+        "--log-path", type=str, default=None, help="Path to save fingerprint log."
+    )
+    parser.add_argument(
+        "--compare-log",
+        type=str,
+        default=None,
+        help="Path to reference fingerprint log for comparison.",
+    )
+    parser.add_argument(
+        "--deterministic-seed",
+        type=int,
+        default=42,
+        help="Seed for deterministic training.",
+    )
+    args = parser.parse_args()
+
+    parameters = DEFAULT_PARAMS[args.model]
+    parameters = parameters.replace("--deterministic_seed", "--deterministic_seed")
+    if args.deterministic_seed:
+        parameters += f" --deterministic_seed {args.deterministic_seed}"
+    if args.generate_log:
+        parameters += " --generate-log"
+        if args.log_path:
+            parameters += f" --log-path {args.log_path}"
+    if args.compare_log:
+        parameters += f" --compare-log {args.compare_log}"
+
+    print(f"Running {args.model} with parameters: {parameters}")
+    context = BenchmarkRegistry.create_benchmark_context(
+        args.model, parameters=parameters, framework=Framework.PYTORCH
+    )
+    benchmark = BenchmarkRegistry.launch_benchmark(context)
+    print(f"Benchmark finished. Return code: {benchmark.return_code}")
+    if hasattr(benchmark, "_model_run_metadata"):
+        print("Run metadata:", benchmark._model_run_metadata)
+    if hasattr(benchmark, "_model_run_losses"):
+        print("Losses:", benchmark._model_run_losses[:5], "...")
+    if hasattr(benchmark, "_model_run_periodic"):
+        print("Periodic:", benchmark._model_run_periodic)
+
+
+if __name__ == "__main__":
+    main()