Spaces:

rcook
/

humanities_papers

Sleeping

rcook commited on Feb 16

Commit

69b0eca

verified ·

1 Parent(s): 0070066

Update app.py

Files changed (1) hide show

app.py CHANGED Viewed

@@ -54,7 +54,26 @@ def summarize():
         return {k: round(v, 4) for k, v in result.items()}
     model = AutoModelForSeq2SeqLM.from_pretrained(checkpoint)
     return data_collator
 #    return type(tokenized_billsum)

         return {k: round(v, 4) for k, v in result.items()}
     model = AutoModelForSeq2SeqLM.from_pretrained(checkpoint)
+    training_args = Seq2SeqTrainingArguments(
+        output_dir="my_awesome_billsum_model",
+        eval_strategy="no",
+        learning_rate=2e-5,
+        per_device_train_batch_size=16,  # Increase batch size
+        per_device_eval_batch_size=16,
+        weight_decay=0.01,
+        save_total_limit=3,
+        num_train_epochs=1,  # Reduce epochs
+        predict_with_generate=True,
+        fp16=True,  # Keep mixed precision
+        push_to_hub=False,
+    #    optim="adamw_bnb_8bit",  # Use 8-bit optimizer
+        logging_steps=100,  # Reduce logging overhead
+        dataloader_num_workers=4,  # Speed up data loading
+        save_strategy="epoch",  # Reduce checkpointing overhead
+        gradient_accumulation_steps=4  # Effective larger batch size
+    )
     return data_collator
 #    return type(tokenized_billsum)