foundation-model-stack · BrandonGroth · Jul 3, 2025 · Jul 3, 2025
@@ -92,7 +92,8 @@ This end-to-end example utilizes the common set of interfaces provided by `fms_m
 
     ```python
     from llmcompressor.modifiers.quantization import QuantizationModifier
-    from llmcompressor.transformers import SparseAutoModelForCausalLM, oneshot
+    from llmcompressor.transformers import SparseAutoModelForCausalLM
+    from llmcompressor import oneshot
 
     model = SparseAutoModelForCausalLM.from_pretrained(model_args.model_name_or_path, torch_dtype=model_args.torch_dtype)
     tokenizer = AutoTokenizer.from_pretrained(model_args.model_name_or_path)

@@ -198,8 +198,9 @@ def run_fp8(model_args, data_args, opt_args, fp8_args):
     """
 
     # Third Party
+    from llmcompressor import oneshot
     from llmcompressor.modifiers.quantization import QuantizationModifier
-    from llmcompressor.transformers import SparseAutoModelForCausalLM, oneshot
+    from llmcompressor.transformers import SparseAutoModelForCausalLM
 
     logger = set_log_level(opt_args.log_level, "fms_mo.run_fp8")