Update README.md

Files changed (1) hide show

README.md CHANGED Viewed

@@ -97,7 +97,7 @@ from transformers import (
 from torchao.quantization.quant_api import (
     IntxWeightOnlyConfig,
     Int8DynamicActivationIntxWeightConfig,
-    ModuleToFqnConfig,
     quantize_,
 )
 from torchao.quantization.granularity import PerGroup, PerAxis
@@ -119,7 +119,7 @@ linear_config = Int8DynamicActivationIntxWeightConfig(
     weight_granularity=PerGroup(32),
     weight_scale_dtype=torch.bfloat16,
 )
-quant_config = ModuleToFqnConfig({"_default": linear_config, "model.embed_tokens": embedding_config})
 quantization_config = TorchAoConfig(quant_type=quant_config, include_embedding=True, untie_embedding_weights=True, modules_to_not_convert=[])
 # either use `untied_model_id` or `untied_model_local_path`

 from torchao.quantization.quant_api import (
     IntxWeightOnlyConfig,
     Int8DynamicActivationIntxWeightConfig,
+    ModuleFqnToConfig,
     quantize_,
 )
 from torchao.quantization.granularity import PerGroup, PerAxis
     weight_granularity=PerGroup(32),
     weight_scale_dtype=torch.bfloat16,
 )
+quant_config = ModuleFqnToConfig({"_default": linear_config, "model.embed_tokens": embedding_config})
 quantization_config = TorchAoConfig(quant_type=quant_config, include_embedding=True, untie_embedding_weights=True, modules_to_not_convert=[])
 # either use `untied_model_id` or `untied_model_local_path`