Command-R

Runtime error

minhdang commited on Mar 29, 2024

Commit

179b4d7

verified ·

1 Parent(s): d67e122

Update app.py

Files changed (1) hide show

app.py CHANGED Viewed

@@ -25,7 +25,8 @@ tokenizer = AutoTokenizer.from_pretrained(model_id)
 model = AutoModelForCausalLM.from_pretrained(model_id,
                                              # load_in_8bit=True,
                                              quantization_config=nf4_config,
-                                             torch_dtype = torch.bfloat16,
                                              device_map="auto"
                                             )

 model = AutoModelForCausalLM.from_pretrained(model_id,
                                              # load_in_8bit=True,
                                              quantization_config=nf4_config,
+                                            attn_implementation="flash_attention_2",
+                                             # torch_dtype = torch.bfloat16,
                                              device_map="auto"
                                             )