Spaces:

24Sureshkumar
/

Tam_to_Eng_Translation_and_Image_Generation_Model

Running

App Files Files Community

24Sureshkumar commited on Jul 3

Commit

cbc840b

verified ·

1 Parent(s): 98be749

Update app.py

Browse files

Files changed (1) hide show

app.py +77 -40

app.py CHANGED Viewed

@@ -1,77 +1,114 @@
-import os
 import torch
-from transformers import MBartForConditionalGeneration, MBart50Tokenizer, AutoTokenizer, AutoModelForCausalLM
 from diffusers import StableDiffusionPipeline
 from PIL import Image
 import tempfile
 import time
-import streamlit as st
-# Use CPU (Hugging Face Spaces free tier)
 device = "cuda" if torch.cuda.is_available() else "cpu"
-# Load translation model
-translator_tokenizer = MBart50Tokenizer.from_pretrained("facebook/mbart-large-50-many-to-many-mmt")
 translator_model = MBartForConditionalGeneration.from_pretrained("facebook/mbart-large-50-many-to-many-mmt").to(device)
 translator_tokenizer.src_lang = "ta_IN"
-# Load text generation model
-gen_tokenizer = AutoTokenizer.from_pretrained("gpt2")
 gen_model = AutoModelForCausalLM.from_pretrained("gpt2").to(device)
-# Load image generation model
 pipe = StableDiffusionPipeline.from_pretrained(
-    "stabilityai/stable-diffusion-2-1-base",
     torch_dtype=torch.float32,
-    safety_checker=None
 ).to(device)
-def translate_tamil_to_english(text):
     inputs = translator_tokenizer(text, return_tensors="pt").to(device)
-    output = translator_model.generate(
         **inputs,
         forced_bos_token_id=translator_tokenizer.lang_code_to_id["en_XX"]
     )
-    translated = translator_tokenizer.batch_decode(output, skip_special_tokens=True)[0]
-    return translated
 def generate_creative_text(prompt, max_length=100):
     input_ids = gen_tokenizer.encode(prompt, return_tensors="pt").to(device)
-    output = gen_model.generate(
-        input_ids, max_length=max_length, do_sample=True, top_k=50, temperature=0.9
-    )
-    return gen_tokenizer.decode(output[0], skip_special_tokens=True)
 def generate_image(prompt):
-    image = pipe(prompt).images[0]
-    temp_file = tempfile.NamedTemporaryFile(suffix=".png", delete=False)
-    image.save(temp_file.name)
-    return temp_file.name
 # Streamlit UI
-st.set_page_config(page_title="Tamil → English + AI", layout="centered")
-st.title("🌐 Tamil to English + AI Image Generator")
-tamil_input = st.text_area("✍️ Enter Tamil Text", height=150)
-if st.button("🚀 Generate"):
     if not tamil_input.strip():
         st.warning("Please enter Tamil text.")
     else:
-        with st.spinner("Translating..."):
-            translated = translate_tamil_to_english(tamil_input)
-            st.success("✅ Translated!")
-            st.markdown(f"**English:** `{translated}`")
-        with st.spinner("Generating creative text..."):
-            creative_text = generate_creative_text(translated)
-            st.success("✅ Creative text generated!")
-            st.markdown(f"**Creative Prompt:** `{creative_text}`")
-        with st.spinner("Generating image..."):
-            image_path = generate_image(translated)
-            st.success("✅ Image generated!")
-            st.image(Image.open(image_path), caption="🖼️ AI Generated Image", use_column_width=True)
 st.markdown("---")
-st.markdown("🔧 Powered by MBart, GPT2 & Stable Diffusion - Deployed on Hugging Face 🤗")

+import streamlit as st
 import torch
+from transformers import MBartForConditionalGeneration, MBart50TokenizerFast
+from transformers import AutoTokenizer, AutoModelForCausalLM
 from diffusers import StableDiffusionPipeline
+from rouge_score import rouge_scorer
 from PIL import Image
 import tempfile
+import os
 import time
+# Use CUDA if available
 device = "cuda" if torch.cuda.is_available() else "cpu"
+# Load translation model (Tamil to English)
 translator_model = MBartForConditionalGeneration.from_pretrained("facebook/mbart-large-50-many-to-many-mmt").to(device)
+translator_tokenizer = MBart50TokenizerFast.from_pretrained("facebook/mbart-large-50-many-to-many-mmt")
 translator_tokenizer.src_lang = "ta_IN"
+# Load GPT-2 for creative text generation
 gen_model = AutoModelForCausalLM.from_pretrained("gpt2").to(device)
+gen_tokenizer = AutoTokenizer.from_pretrained("gpt2")
+# Load a lightweight image generation model (for CPU)
 pipe = StableDiffusionPipeline.from_pretrained(
+    "OFA-Sys/small-stable-diffusion-v0",
     torch_dtype=torch.float32,
+    use_auth_token=os.getenv("HF_TOKEN")  # Set this in Hugging Face Space secrets
 ).to(device)
+pipe.safety_checker = None  # Optional: disable safety checker for speed
+# Translation Function
+def translate_tamil_to_english(text, reference=None):
+    start = time.time()
     inputs = translator_tokenizer(text, return_tensors="pt").to(device)
+    outputs = translator_model.generate(
         **inputs,
         forced_bos_token_id=translator_tokenizer.lang_code_to_id["en_XX"]
     )
+    translated = translator_tokenizer.batch_decode(outputs, skip_special_tokens=True)[0]
+    duration = round(time.time() - start, 2)
+    rouge_l = None
+    if reference:
+        scorer = rouge_scorer.RougeScorer(['rougeL'], use_stemmer=True)
+        score = scorer.score(reference.lower(), translated.lower())
+        rouge_l = round(score["rougeL"].fmeasure, 4)
+    return translated, duration, rouge_l
+# Creative Text Generator
 def generate_creative_text(prompt, max_length=100):
+    start = time.time()
     input_ids = gen_tokenizer.encode(prompt, return_tensors="pt").to(device)
+    output = gen_model.generate(input_ids, max_length=max_length, do_sample=True, top_k=50, temperature=0.9)
+    text = gen_tokenizer.decode(output[0], skip_special_tokens=True)
+    duration = round(time.time() - start, 2)
+    tokens = text.split()
+    repetition_rate = sum(t1 == t2 for t1, t2 in zip(tokens, tokens[1:])) / len(tokens)
+    return text, duration, len(tokens), round(repetition_rate, 4)
+# AI Image Generator
 def generate_image(prompt):
+    try:
+        start = time.time()
+        result = pipe(prompt)
+        image = result.images[0].resize((256, 256))
+        tmp_file = tempfile.NamedTemporaryFile(delete=False, suffix=".png")
+        image.save(tmp_file.name)
+        return tmp_file.name, round(time.time() - start, 2)
+    except Exception as e:
+        return None, f"Image generation failed: {str(e)}"
 # Streamlit UI
+st.set_page_config(page_title="Tamil → English + AI Art", layout="centered")
+st.title("🧠 Tamil → English + 🎨 Creative Text + AI Image")
+tamil_input = st.text_area("✍️ Enter Tamil text here", height=150)
+reference_input = st.text_input("📘 Optional: Reference English translation for ROUGE")
+if st.button("🚀 Generate Output"):
     if not tamil_input.strip():
         st.warning("Please enter Tamil text.")
     else:
+        with st.spinner("🔄 Translating Tamil to English..."):
+            english_text, t_time, rouge_l = translate_tamil_to_english(tamil_input, reference_input)
+        st.success(f"✅ Translated in {t_time} seconds")
+        st.markdown(f"**📝 English Translation:** `{english_text}`")
+        if rouge_l is not None:
+            st.markdown(f"📊 **ROUGE-L Score:** `{rouge_l}`")
+        else:
+            st.info("ℹ️ ROUGE-L not calculated. Reference not provided.")
+        with st.spinner("🎨 Generating image..."):
+            image_path, img_time = generate_image(english_text)
+        if image_path:
+            st.success(f"🖼️ Image generated in {img_time} seconds")
+            st.image(Image.open(image_path), caption="AI-Generated Image", use_column_width=True)
+        else:
+            st.error(image_path)
+        with st.spinner("💡 Generating creative text..."):
+            creative, c_time, tokens, rep_rate = generate_creative_text(english_text)
+        st.success(f"✨ Creative text generated in {c_time} seconds")
+        st.markdown(f"**🧠 Creative Output:** `{creative}`")
+        st.markdown(f"📌 Tokens: `{tokens}`, Repetition Rate: `{rep_rate}`")
 st.markdown("---")
+st.caption("Built by Sureshkumar R using MBart, GPT-2 & Stable Diffusion on Hugging Face")