LIFineTuned

Paused

App Files Files Community

alexkueck commited on Aug 14, 2023

Commit

6a058ad

1 Parent(s): b37c716

Update app.py

Browse files

Files changed (1) hide show

app.py +8 -8

app.py CHANGED Viewed

@@ -129,13 +129,13 @@ base_model = "EleutherAI/gpt-neo-1.3B"    #load_8bit = False (in load_tokenizer_
 # Load model directly
 #####################################################
 #Tokenizer und Model laden
-tokenizer,model,device = load_tokenizer_and_model(base_model,  False)
 #################################################
 # Few-Shot Training!!!!!!!!!
 #################################################
 # Load SetFit model from Hub
-#tokenizer,model,device = load_tokenizer_and_model_setFit(base_model,  False)
 #tokenizer.add_special_tokens({'pad_token': '[PAD]'}) #not necessary with fast Toekenizers like GPT2
@@ -250,7 +250,7 @@ training_args = TrainingArguments(
 #Trainer zusammenstellen
 print ("################################")
 print ("trainer")
 trainer = Trainer(
         model=model,
         args=training_args,
@@ -262,7 +262,7 @@ trainer = Trainer(
         tokenizer=tokenizer,
         compute_metrics=compute_metrics,
 )
 ###############################################
 # Special QA Trainer...#
@@ -280,7 +280,7 @@ trainer = QuestionAnsweringTrainer(
     )
 '''
 #################################################
-'''
 #################################################
 # Few-Shot Training!!!!!!!!!
@@ -289,15 +289,15 @@ trainer = QuestionAnsweringTrainer(
 # Create Few-Shot trainer
 trainer = SetFitTrainer(
     model=model,
-    train_dataset=train_ds,
-    eval_dataset=test_ds,
     loss_class=CosineSimilarityLoss,
     batch_size=16,
     num_iterations=20, # Number of text pairs to generate for contrastive learning
     num_epochs=1 # Number of epochs to use for contrastive learning
 )
 #################################################
 # special Trainer Baize Model
 # Parameters für Model 7b: 7b 32 0.0002

 # Load model directly
 #####################################################
 #Tokenizer und Model laden
+#tokenizer,model,device = load_tokenizer_and_model(base_model,  False)
 #################################################
 # Few-Shot Training!!!!!!!!!
 #################################################
 # Load SetFit model from Hub
+tokenizer,model,device = load_tokenizer_and_model_setFit(base_model,  False)
 #tokenizer.add_special_tokens({'pad_token': '[PAD]'}) #not necessary with fast Toekenizers like GPT2
 #Trainer zusammenstellen
 print ("################################")
 print ("trainer")
+'''
 trainer = Trainer(
         model=model,
         args=training_args,
         tokenizer=tokenizer,
         compute_metrics=compute_metrics,
 )
+'''
 ###############################################
 # Special QA Trainer...#
     )
 '''
 #################################################
 #################################################
 # Few-Shot Training!!!!!!!!!
 # Create Few-Shot trainer
 trainer = SetFitTrainer(
     model=model,
+    train_dataset=lm_datasets["train"],
+    eval_dataset=lm_datasets["test"],
     loss_class=CosineSimilarityLoss,
     batch_size=16,
     num_iterations=20, # Number of text pairs to generate for contrastive learning
     num_epochs=1 # Number of epochs to use for contrastive learning
 )
+'''
 #################################################
 # special Trainer Baize Model
 # Parameters für Model 7b: 7b 32 0.0002