Spaces:

mileskidev
/

ouvir-para-ver

Sleeping

mileski-dev commited on Jun 4

Commit

a214e53

1 Parent(s): 7309205

ajustar para pt-br com helsinki 3

Files changed (1) hide show

app.py CHANGED Viewed

@@ -7,8 +7,9 @@ from transformers import BlipProcessor, BlipForConditionalGeneration, pipeline
 processor = BlipProcessor.from_pretrained("Salesforce/blip-image-captioning-base")
 model     = BlipForConditionalGeneration.from_pretrained("Salesforce/blip-image-captioning-base")
-# 2) Carrega pipeline de tradução Inglês → Português (pt-BR)
-translator = pipeline("translation", model="Helsinki-NLP/opus-mt-en-pt-br")
 def infer_caption(image):
     # 1) Redimensiona mantendo proporção para max 1024×1024
@@ -24,20 +25,20 @@ def infer_caption(image):
     outputs = model.generate(**inputs)
     english_caption = processor.decode(outputs[0], skip_special_tokens=True)
-    # 3) Traduz para pt-BR
     translated = translator(english_caption, max_length=128)
     portuguese_caption = translated[0]["translation_text"]
     return portuguese_caption
-# 3) Cria interface Gradio
 interface = gr.Interface(
     fn=infer_caption,
     inputs=gr.Image(type="pil"),
     outputs="text",
     title="Ouvir Para Ver",
-    description="Envie uma imagem e receba a descrição."
 )
 if __name__ == "__main__":
-    interface.launch(server_name="0.0.0.0", share=False)

 processor = BlipProcessor.from_pretrained("Salesforce/blip-image-captioning-base")
 model     = BlipForConditionalGeneration.from_pretrained("Salesforce/blip-image-captioning-base")
+# 2) Carrega pipeline de tradução Inglês → Português
+#    usando o modelo Helsinki-NLP/opus-mt-tc-big-en-pt
+translator = pipeline("translation", model="Helsinki-NLP/opus-mt-tc-big-en-pt")
 def infer_caption(image):
     # 1) Redimensiona mantendo proporção para max 1024×1024
     outputs = model.generate(**inputs)
     english_caption = processor.decode(outputs[0], skip_special_tokens=True)
+    # 3) Traduz para português (pt)
     translated = translator(english_caption, max_length=128)
     portuguese_caption = translated[0]["translation_text"]
     return portuguese_caption
+# 4) Cria interface Gradio
 interface = gr.Interface(
     fn=infer_caption,
     inputs=gr.Image(type="pil"),
     outputs="text",
     title="Ouvir Para Ver",
+    description="Envie uma imagem e receba a descrição em português brasileiro."
 )
 if __name__ == "__main__":
+    interface.launch(server_name="0.0.0.0", share=False)