Spaces:

SaadNadeem07
/

BLIP_2-VLM-Finetuning

Running

Saadi07 commited on May 1

Commit

20989f7

1 Parent(s): 1e72677

Model Deployed

Files changed (2) hide show

app.py ADDED Viewed

+import gradio as gr
+from PIL import Image
+import torch
+from transformers import BlipProcessor, BlipForConditionalGeneration
+# Load model and processor
+processor = BlipProcessor.from_pretrained("Salesforce/blip-image-captioning-base")
+model = BlipForConditionalGeneration.from_pretrained("Salesforce/blip-image-captioning-base")
+device = torch.device('cuda' if torch.cuda.is_available() else 'cpu')
+model = model.to(device)
+# Define the function to generate caption
+def generate_caption(image):
+    inputs = processor(images=image, return_tensors="pt").to(device)
+    generated_ids = model.generate(pixel_values=inputs.pixel_values, max_length=25)
+    caption = processor.batch_decode(generated_ids, skip_special_tokens=True)[0]
+    return caption
+# Create Gradio interface
+iface = gr.Interface(
+    fn=generate_caption,
+    inputs=gr.Image(type="pil"),
+    outputs="text",
+    title="Image Caption Generator",
+    description="Upload an image to generate a caption."
+)
+# Launch
+iface.launch()

requirements.txt ADDED Viewed

+torch
+transformers
+gradio
+Pillow