Spaces:

BabelSeniorDesignTeam
/

babel-router-api

Sleeping

Confused404 commited on 4 days ago

Commit

a40fe7a

verified ·

1 Parent(s): e9592ef

added a prepend >>nob<< for Norwegian right before tokenization

Files changed (1) hide show

app.py CHANGED Viewed

@@ -96,6 +96,10 @@ async def translate(request: Request):
         full_translation = []
         for chunk in chunks:
             inputs  = tokenizer(chunk, return_tensors="pt", padding=True, truncation=True)
             inputs  = {k: v.to(model.device) for k, v in inputs.items()}
             outputs = model.generate(**inputs, num_beams=5, length_penalty=1.2, early_stopping=True)

         full_translation = []
         for chunk in chunks:
+            if model_id == "Confused404/eng-gmq-finetuned_v2-no":
+                chunk = f">>nob<< {chunk}"
             inputs  = tokenizer(chunk, return_tensors="pt", padding=True, truncation=True)
             inputs  = {k: v.to(model.device) for k, v in inputs.items()}
             outputs = model.generate(**inputs, num_beams=5, length_penalty=1.2, early_stopping=True)