LIFineTuned

Paused

alexkueck commited on Aug 14, 2023

Commit

3f1c59e

1 Parent(s): ee00be9

Update app.py

Files changed (1) hide show

app.py CHANGED Viewed

@@ -178,7 +178,7 @@ tokenized_datasets = dataset_neu.map(tokenize_function, batched=True, num_proc=4
 #Probe ansehen - zum überprüfen...
 print('##################Beispiel Datensatz ################')
 print (tokenized_datasets["train"][4])
 #den Text nun zusammenführen (concatenieren) und anschließend in kleine Häppchen aufteilen (block_size=128), die verarbeitet werden können
 #das macht die map-Funktion und das Attribut batched = True
@@ -234,7 +234,7 @@ training_args = TrainingArguments(
     logging_strategy="epoch",   #oder steps
     #logging_steps=10,
     logging_dir='logs',
-    learning_rate=2e-5,
     weight_decay=0.01,
     save_total_limit = 2,
     #predict_with_generate=True,

 #Probe ansehen - zum überprüfen...
 print('##################Beispiel Datensatz ################')
 print (tokenized_datasets["train"][4])
+print (tokenizer.decode(tokenized_datasets["train"][4]["input_ids"]))
 #den Text nun zusammenführen (concatenieren) und anschließend in kleine Häppchen aufteilen (block_size=128), die verarbeitet werden können
 #das macht die map-Funktion und das Attribut batched = True
     logging_strategy="epoch",   #oder steps
     #logging_steps=10,
     logging_dir='logs',
+    learning_rate= e-5,  #2e-5,
     weight_decay=0.01,
     save_total_limit = 2,
     #predict_with_generate=True,