Spaces:

Krishna086
/

Multi-language-translation-with-MarianMT

Running

App Files Files Community

Krishna086 commited on Apr 15

Commit

ac21c0e

verified ·

1 Parent(s): 33c7f69

Update translation.py

Browse files

Files changed (1) hide show

translation.py +5 -22

translation.py CHANGED Viewed

@@ -20,7 +20,8 @@ def load_model(src_lang, tgt_lang):
         model = MarianMTModel.from_pretrained(model_name)
         return tokenizer, model
     except Exception as e:
-        raise Exception(f"Model for {src_lang} to {tgt_lang} not available: {str(e)}")
 # Preload default model globally
 DEFAULT_TOKENIZER, DEFAULT_MODEL = _load_default_model()
@@ -33,15 +34,8 @@ def translate(text, source_lang, target_lang):
     src_code = LANGUAGES.get(source_lang, "en")
     tgt_code = LANGUAGES.get(target_lang, "fr")
-    # Check if the language pair is supported
-    if tgt_code not in SUPPORTED_PAIRS.get(src_code, []):
-        raise Exception(f"Translation from {source_lang} to {target_lang} is not supported. Supported pairs: {SUPPORTED_PAIRS.get(src_code, [])}")
-    # Use preloaded model if en-fr, else load dynamically
-    if src_code == "en" and tgt_code == "fr":
-        tokenizer, model = DEFAULT_TOKENIZER, DEFAULT_MODEL
-    else:
-        tokenizer, model = load_model(src_code, tgt_code)
     # Perform translation
     inputs = tokenizer(text, return_tensors="pt", padding=True, truncation=True, max_length=400)
@@ -61,15 +55,4 @@ LANGUAGES = {
     "Japanese": "ja"
 }
-# Dictionary of supported source-target pairs (based on available MarianMT models)
-SUPPORTED_PAIRS = {
-    "en": ["fr", "es", "de", "zh", "ru"],  # English to French, Spanish, German, Chinese, Russian
-    "fr": ["en"],  # French to English (limited support)
-    "es": ["en"],  # Spanish to English
-    "de": ["en"],  # German to English
-    "zh": ["en"],  # Chinese to English
-    "ru": ["en"],  # Russian to English
-    "hi": [],      # Hindi not supported as source
-    "ar": [],      # Arabic not supported as source
-    "ja": [],      # Japanese not supported as source
-}

         model = MarianMTModel.from_pretrained(model_name)
         return tokenizer, model
     except Exception as e:
+        st.warning(f"Model for {src_lang} to {tgt_lang} not available. Falling back to en-fr.")
+        return _load_default_model()  # Fallback to preloaded en-fr model
 # Preload default model globally
 DEFAULT_TOKENIZER, DEFAULT_MODEL = _load_default_model()
     src_code = LANGUAGES.get(source_lang, "en")
     tgt_code = LANGUAGES.get(target_lang, "fr")
+    # Attempt to load the specific model, fall back to en-fr if it fails
+    tokenizer, model = load_model(src_code, tgt_code)
     # Perform translation
     inputs = tokenizer(text, return_tensors="pt", padding=True, truncation=True, max_length=400)
     "Japanese": "ja"
 }
+# Removed SUPPORTED_PAIRS to revert to original behavior