Spaces:

das1mtb56
/

yt_trans

Running

App Files Files Community

das1mtb56 commited on May 30

Commit

b057493

verified ·

1 Parent(s): 0a4f03c

Update app.py

Browse files

Files changed (1) hide show

app.py +49 -41

app.py CHANGED Viewed

@@ -1,23 +1,34 @@
 import os
 import gradio as gr
 import yt_dlp
 import whisper
 from transformers import pipeline, MarianMTModel, MarianTokenizer
-import torch
-import shutil
-import warnings
-# Suppress harmless CPU warning from Whisper
 warnings.filterwarnings("ignore", message="FP16 is not supported on CPU; using FP32 instead")
-# Load models
-whisper_model = whisper.load_model("small")
-summarizer = pipeline("summarization", model="Falconsai/text_summarization")
-translation_tokenizer = MarianTokenizer.from_pretrained("Helsinki-NLP/opus-mt-mul-en")
-translation_model = MarianMTModel.from_pretrained("Helsinki-NLP/opus-mt-mul-en")
 COOKIES_PATH = "cookies.txt"
 def save_cookies(file):
     if file:
         shutil.copy(file.name, COOKIES_PATH)
@@ -25,26 +36,29 @@ def save_cookies(file):
     return "⚠️ Please upload a valid cookies.txt file."
 def download_audio(youtube_url):
-    output_file = "audio.webm"
     ydl_opts = {
         'format': 'bestaudio/best',
-        'outtmpl': output_file,
         'quiet': True,
     }
     if os.path.exists(COOKIES_PATH):
         ydl_opts['cookiefile'] = COOKIES_PATH
     with yt_dlp.YoutubeDL(ydl_opts) as ydl:
         ydl.download([youtube_url])
-    return output_file
 def get_thumbnail(youtube_url):
-    ydl_opts = {'quiet': True}
-    if os.path.exists(COOKIES_PATH):
-        ydl_opts['cookiefile'] = COOKIES_PATH
-    with yt_dlp.YoutubeDL(ydl_opts) as ydl:
-        info = ydl.extract_info(youtube_url, download=False)
-        return info.get("thumbnail", "")
-    return ""
 def translate_to_english(text):
     chunks = [text[i:i+500] for i in range(0, len(text), 500)]
@@ -56,23 +70,29 @@ def translate_to_english(text):
     return " ".join(translated)
 def process_video(url):
-    audio_path = download_audio(url)
-    result = whisper_model.transcribe(audio_path)
-    transcription = result["text"]
-    translated_text = translate_to_english(transcription)
-    summary = summarizer(translated_text, max_length=130, min_length=30, do_sample=False)[0]["summary_text"]
-    thumbnail_url = get_thumbnail(url)
-    return transcription, translated_text, summary, thumbnail_url
 def download_summary(text):
-    filename = "summary.txt"
     with open(filename, "w", encoding="utf-8") as f:
         f.write(text)
     return filename
-# UI
 with gr.Blocks(theme=gr.themes.Soft(), title="🎥 YouTube Video Summarizer") as demo:
     gr.Markdown("## 🧠 Multilingual YouTube Summarizer")
     gr.Markdown("Upload a video link and get the transcript, English translation, and summary.")
@@ -103,16 +123,4 @@ with gr.Blocks(theme=gr.themes.Soft(), title="🎥 YouTube Video Summarizer") as
         outputs=[transcript_output, translation_output, summary_output, video_thumb]
     )
-    download_btn.click(
-        fn=download_summary,
-        inputs=[summary_output],
-        outputs=[download_file]
-    )
-    upload_btn.click(
-        fn=save_cookies,
-        inputs=[cookies_file],
-        outputs=[cookie_status]
-    )
-demo.launch(share=True)

 import os
+import tempfile
+import uuid
+import shutil
+import warnings
+import logging
 import gradio as gr
 import yt_dlp
 import whisper
 from transformers import pipeline, MarianMTModel, MarianTokenizer
+# Suppress Whisper CPU warning
 warnings.filterwarnings("ignore", message="FP16 is not supported on CPU; using FP32 instead")
+# Setup logging
+logging.basicConfig(level=logging.INFO)
+logger = logging.getLogger(__name__)
+# Constants
+WHISPER_MODEL_SIZE = "small"
+SUMMARIZER_MODEL_NAME = "Falconsai/text_summarization"
+TRANSLATION_MODEL_NAME = "Helsinki-NLP/opus-mt-mul-en"
 COOKIES_PATH = "cookies.txt"
+# Load models once at startup
+whisper_model = whisper.load_model(WHISPER_MODEL_SIZE)
+summarizer = pipeline("summarization", model=SUMMARIZER_MODEL_NAME)
+translation_tokenizer = MarianTokenizer.from_pretrained(TRANSLATION_MODEL_NAME)
+translation_model = MarianMTModel.from_pretrained(TRANSLATION_MODEL_NAME)
 def save_cookies(file):
     if file:
         shutil.copy(file.name, COOKIES_PATH)
     return "⚠️ Please upload a valid cookies.txt file."
 def download_audio(youtube_url):
+    temp_file = tempfile.NamedTemporaryFile(delete=False, suffix=".webm")
     ydl_opts = {
         'format': 'bestaudio/best',
+        'outtmpl': temp_file.name,
         'quiet': True,
     }
     if os.path.exists(COOKIES_PATH):
         ydl_opts['cookiefile'] = COOKIES_PATH
     with yt_dlp.YoutubeDL(ydl_opts) as ydl:
         ydl.download([youtube_url])
+    return temp_file.name
 def get_thumbnail(youtube_url):
+    try:
+        ydl_opts = {'quiet': True}
+        if os.path.exists(COOKIES_PATH):
+            ydl_opts['cookiefile'] = COOKIES_PATH
+        with yt_dlp.YoutubeDL(ydl_opts) as ydl:
+            info = ydl.extract_info(youtube_url, download=False)
+            return info.get("thumbnail", "")
+    except Exception as e:
+        logger.error(f"Thumbnail fetch error: {e}")
+        return ""
 def translate_to_english(text):
     chunks = [text[i:i+500] for i in range(0, len(text), 500)]
     return " ".join(translated)
 def process_video(url):
+    try:
+        audio_path = download_audio(url)
+        result = whisper_model.transcribe(audio_path)
+        transcription = result["text"]
+        translated_text = translate_to_english(transcription)
+        summary = summarizer(translated_text, max_length=130, min_length=30, do_sample=False)[0]["summary_text"]
+        thumbnail_url = get_thumbnail(url)
+        os.remove(audio_path)  # Clean up temp audio file
+        return transcription, translated_text, summary, thumbnail_url
+    except Exception as e:
+        logger.exception("Error processing video")
+        return f"❌ Error: {str(e)}", "", "", ""
 def download_summary(text):
+    filename = os.path.join(tempfile.gettempdir(), f"summary_{uuid.uuid4().hex}.txt")
     with open(filename, "w", encoding="utf-8") as f:
         f.write(text)
     return filename
+# Gradio UI
 with gr.Blocks(theme=gr.themes.Soft(), title="🎥 YouTube Video Summarizer") as demo:
     gr.Markdown("## 🧠 Multilingual YouTube Summarizer")
     gr.Markdown("Upload a video link and get the transcript, English translation, and summary.")
         outputs=[transcript_output, translation_output, summary_output, video_thumb]
     )
+    dow