Spaces:

pr0ximaCent
/

bangla-disaster

Sleeping

App Files Files Community

pr0ximaCent commited on May 26

Commit

f64a78f

verified ·

1 Parent(s): efdbf4b

Update app.py

Browse files

Files changed (1) hide show

app.py +57 -50

app.py CHANGED Viewed

@@ -48,20 +48,15 @@ class MultimodalBanglaClassifier(nn.Module):
         fused = self.transformer_fusion(fused).squeeze(1)
         return self.classifier(fused)
-# Cache model and tokenizer
-@st.cache_resource(max_entries=1)
 def load_model_and_tokenizer():
     """Load model and tokenizer once and cache them"""
-    device = torch.device("cuda" if torch.cuda.is_available() else "cpu")
     model = MultimodalBanglaClassifier()
-    model.load_state_dict(torch.load(MODEL_PATH, map_location=device))
-    # Apply dynamic quantization for CPU
-    if device == torch.device("cpu"):
-        model = torch.quantization.quantize_dynamic(model, {nn.Linear}, dtype=torch.qint8)
-    model.to(device)
     model.eval()
     tokenizer = AutoTokenizer.from_pretrained("sagorsarker/bangla-bert-base")
-    return model, tokenizer, device
 def get_bangla_response(class_name):
     responses = {
@@ -73,68 +68,70 @@ def get_bangla_response(class_name):
     }
     return responses.get(class_name, "🤔 শ্রেণিবিন্যাস করা যায়নি।")
-def predict_fast(model, tokenizer, image, caption, device):
-    """Optimized prediction with smaller image size and shorter text"""
     transform = transforms.Compose([
-        transforms.Resize((128, 128)),  # Reduced from 160x160
         transforms.ToTensor(),
-        transforms.Normalize(mean=[0.485, 0.456, 0.406], std=[0.229, 0.224, 0.225])
     ])
-    image = transform(image).unsqueeze(0).to(device)
     encoded = tokenizer(
         caption,
         padding='max_length',
         truncation=True,
-        max_length=32,  # Reduced from 64
         return_tensors='pt'
     )
-    input_ids = encoded['input_ids'].to(device)
-    attention_mask = encoded['attention_mask'].to(device)
     with torch.no_grad():
-        output = model(input_ids=input_ids, attention_mask=attention_mask, image=image)
         pred_class = output.argmax(dim=1).item()
         confidence_scores = output.softmax(dim=1).squeeze().tolist()
-    return classes[pred_class], confidence_scores
-def predict_full_quality(model, tokenizer, image, caption, device):
     """Full quality prediction with original settings"""
     transform = transforms.Compose([
-        transforms.Resize((224, 224)),
         transforms.ToTensor(),
-        transforms.Normalize(mean=[0.485, 0.456, 0.406], std=[0.229, 0.224, 0.225])
     ])
-    image = transform(image).unsqueeze(0).to(device)
     encoded = tokenizer(
         caption,
         padding='max_length',
         truncation=True,
-        max_length=128,
         return_tensors='pt'
     )
-    input_ids = encoded['input_ids'].to(device)
-    attention_mask = encoded['attention_mask'].to(device)
     with torch.no_grad():
-        output = model(input_ids=input_ids, attention_mask=attention_mask, image=image)
         pred_class = output.argmax(dim=1).item()
         confidence_scores = output.softmax(dim=1).squeeze().tolist()
-    return classes[pred_class], confidence_scores
 # === Streamlit UI ===
 st.set_page_config(page_title="Bangla Disaster Classifier", layout="centered")
 st.title("🌪️🇧🇩 Bangla Disaster Classifier")
 st.markdown("এই অ্যাপটি একটি multimodal deep learning মডেল ব্যবহার করে ছবির সাথে বাংলা ক্যাপশন বিশ্লেষণ করে দুর্যোগ শনাক্ত করে।")
-# Initialize session state
-if 'prediction' not in st.session_state:
-    st.session_state.prediction = None
-    st.session_state.probs = None
-# Load model, tokenizer, and device
 with st.spinner("🔄 মডেল লোড হচ্ছে... (Loading model...)"):
-    model, tokenizer, device = load_model_and_tokenizer()
 uploaded_file = st.file_uploader("🖼️ একটি দুর্যোগের ছবি আপলোড করুন", type=['jpg', 'png', 'jpeg'])
 caption = st.text_area("✍️ বাংলায় একটি ক্যাপশন লিখুন", "")
@@ -143,7 +140,7 @@ caption = st.text_area("✍️ বাংলায় একটি ক্যা
 prediction_mode = st.radio(
     "🎯 পূর্বাভাস মোড নির্বাচন করুন:",
     ["⚡ দ্রুত পূর্বাভাস (Fast Prediction)", "🎯 উচ্চ নির্ভুলতা (High Accuracy)"],
-    help="দ্রুত মোডে কম সময় লাগে কিন্তু সামান্য কম নির্ভুল হতে পারে (~3-5%)"
 )
 col1, col2 = st.columns([1, 1])
@@ -151,31 +148,41 @@ submit = col1.button("🔍 পূর্বাভাস দিন")
 clear = col2.button("🧹 রিসেট করুন")
 if clear:
-    st.session_state.prediction = None
-    st.session_state.probs = None
-    st.rerun()
 if submit and uploaded_file and caption:
     img = Image.open(uploaded_file).convert("RGB")
-    st.image(img, caption="আপলোড করা ছবি", width=300)
     with st.spinner("🧠 মডেল পূর্বাভাস দিচ্ছে... (Model processing...)"):
         if "দ্রুত" in prediction_mode:
-            st.session_state.prediction, st.session_state.probs = predict_fast(model, tokenizer, img, caption, device)
             mode_info = "⚡ দ্রুত মোড (Fast Mode)"
         else:
-            st.session_state.prediction, st.session_state.probs = predict_full_quality(model, tokenizer, img, caption, device)
             mode_info = "🎯 উচ্চ নির্ভুলতা মোড (High Accuracy Mode)"
-if st.session_state.prediction:
-    st.markdown(f"### ✅ পূর্বাভাস: {get_bangla_response(st.session_state.prediction)}")
     col1, col2 = st.columns([2, 1])
     with col1:
-        st.markdown(f"#### 📊 সম্ভাব্যতা: **{st.session_state.probs[classes.index(st.session_state.prediction)]:.2%}**")
     with col2:
         st.caption(mode_info)
     with st.expander("📈 বিস্তারিত সম্ভাব্যতা (Detailed Probabilities)"):
         class_names = {
             'HYD': 'জলসম্পর্কিত দুর্যোগ',
@@ -184,8 +191,8 @@ if st.session_state.prediction:
             'EQ': 'ভূমিকম্প',
             'OTHD': 'কোনো দুর্যোগ নয়'
         }
         for i, class_code in enumerate(classes):
-            percentage = st.session_state.probs[i] * 100
             st.write(f"**{class_names[class_code]}**: {percentage:.1f}%")
-            st.progress(st.session_state.probs[i])

         fused = self.transformer_fusion(fused).squeeze(1)
         return self.classifier(fused)
+# 🚀 OPTIMIZATION 1: Cache both model and tokenizer together (No accuracy impact)
+@st.cache_resource
 def load_model_and_tokenizer():
     """Load model and tokenizer once and cache them"""
     model = MultimodalBanglaClassifier()
+    model.load_state_dict(torch.load(MODEL_PATH, map_location=torch.device('cpu')))
     model.eval()
     tokenizer = AutoTokenizer.from_pretrained("sagorsarker/bangla-bert-base")
+    return model, tokenizer
 def get_bangla_response(class_name):
     responses = {
     }
     return responses.get(class_name, "🤔 শ্রেণিবিন্যাস করা যায়নি।")
+def predict_fast(model, tokenizer, image, caption):
+    """Optimized prediction function with smaller image size and shorter text"""
+    # 🚀 OPTIMIZATION 2: Smaller image size (Minimal accuracy impact: ~1-3%)
     transform = transforms.Compose([
+        transforms.Resize((160, 160)),  # Reduced from 224x224 for faster processing
         transforms.ToTensor(),
+        transforms.Normalize(mean=[0.485, 0.456, 0.406],
+                             std=[0.229, 0.224, 0.225])
     ])
+    image = transform(image).unsqueeze(0)
+    # 🚀 OPTIMIZATION 3: Shorter text length (Only affects very long captions)
     encoded = tokenizer(
         caption,
         padding='max_length',
         truncation=True,
+        max_length=64,  # Reduced from 128 for faster processing
         return_tensors='pt'
     )
     with torch.no_grad():
+        output = model(
+            input_ids=encoded['input_ids'],
+            attention_mask=encoded['attention_mask'],
+            image=image
+        )
         pred_class = output.argmax(dim=1).item()
         confidence_scores = output.softmax(dim=1).squeeze().tolist()
+        return classes[pred_class], confidence_scores
+def predict_full_quality(model, tokenizer, image, caption):
     """Full quality prediction with original settings"""
     transform = transforms.Compose([
+        transforms.Resize((224, 224)),  # Original size
         transforms.ToTensor(),
+        transforms.Normalize(mean=[0.485, 0.456, 0.406],
+                             std=[0.229, 0.224, 0.225])
     ])
+    image = transform(image).unsqueeze(0)
     encoded = tokenizer(
         caption,
         padding='max_length',
         truncation=True,
+        max_length=128,  # Original length
         return_tensors='pt'
     )
     with torch.no_grad():
+        output = model(
+            input_ids=encoded['input_ids'],
+            attention_mask=encoded['attention_mask'],
+            image=image
+        )
         pred_class = output.argmax(dim=1).item()
         confidence_scores = output.softmax(dim=1).squeeze().tolist()
+        return classes[pred_class], confidence_scores
 # === Streamlit UI ===
 st.set_page_config(page_title="Bangla Disaster Classifier", layout="centered")
 st.title("🌪️🇧🇩 Bangla Disaster Classifier")
 st.markdown("এই অ্যাপটি একটি multimodal deep learning মডেল ব্যবহার করে ছবির সাথে বাংলা ক্যাপশন বিশ্লেষণ করে দুর্যোগ শনাক্ত করে।")
+# 🚀 OPTIMIZATION 4: Load model and tokenizer once at startup
 with st.spinner("🔄 মডেল লোড হচ্ছে... (Loading model...)"):
+    model, tokenizer = load_model_and_tokenizer()
 uploaded_file = st.file_uploader("🖼️ একটি দুর্যোগের ছবি আপলোড করুন", type=['jpg', 'png', 'jpeg'])
 caption = st.text_area("✍️ বাংলায় একটি ক্যাপশন লিখুন", "")
 prediction_mode = st.radio(
     "🎯 পূর্বাভাস মোড নির্বাচন করুন:",
     ["⚡ দ্রুত পূর্বাভাস (Fast Prediction)", "🎯 উচ্চ নির্ভুলতা (High Accuracy)"],
+    help="দ্রুত মোডে কম সময় লাগে কিন্তু সামান্য কম নির্ভুল হতে পারে"
 )
 col1, col2 = st.columns([1, 1])
 clear = col2.button("🧹 রিসেট করুন")
 if clear:
+    st.rerun()  # Fixed deprecated function
 if submit and uploaded_file and caption:
     img = Image.open(uploaded_file).convert("RGB")
+    st.image(img, caption="আপলোড করা ছবি", use_container_width=True)  # Fixed deprecated parameter
+    # 🚀 OPTIMIZATION 5: Enhanced progress indicators
     with st.spinner("🧠 মডেল পূর্বাভাস দিচ্ছে... (Model processing...)"):
+        progress_bar = st.progress(0, text="ছবি প্রক্রিয়াকরণ... (Processing image...)")
+        # Choose prediction function based on mode
         if "দ্রুত" in prediction_mode:
+            progress_bar.progress(50, text="দ্রুত বিশ্লেষণ... (Fast analysis...)")
+            prediction, probs = predict_fast(model, tokenizer, img, caption)
             mode_info = "⚡ দ্রুত মোড (Fast Mode)"
         else:
+            progress_bar.progress(50, text="উচ্চ নির্ভুলতা বিশ্লেষণ... (High accuracy analysis...)")
+            prediction, probs = predict_full_quality(model, tokenizer, img, caption)
             mode_info = "🎯 উচ্চ নির্ভুলতা মোড (High Accuracy Mode)"
+        progress_bar.progress(100, text="সম্পূর্ণ! (Complete!)")
+    # Clear progress bar
+    progress_bar.empty()
+    # Display results
+    st.markdown(f"### ✅ পূর্বাভাস: {get_bangla_response(prediction)}")
     col1, col2 = st.columns([2, 1])
     with col1:
+        st.markdown(f"#### 📊 সম্ভাব্যতা: **{probs[classes.index(prediction)]:.2%}**")
     with col2:
         st.caption(mode_info)
+    # Show detailed probabilities
     with st.expander("📈 বিস্তারিত সম্ভাব্যতা (Detailed Probabilities)"):
         class_names = {
             'HYD': 'জলসম্পর্কিত দুর্যোগ',
             'EQ': 'ভূমিকম্প',
             'OTHD': 'কোনো দুর্যোগ নয়'
         }
         for i, class_code in enumerate(classes):
+            percentage = probs[i] * 100
             st.write(f"**{class_names[class_code]}**: {percentage:.1f}%")
+            st.progress(probs[i])