Spaces:

kevalfst
/

visionary-ai

Running

kevalfst commited on May 9

Commit

a72f0f9

verified ·

1 Parent(s): 8b7349d

Update app.py

Files changed (1) hide show

app.py CHANGED Viewed

@@ -1,6 +1,5 @@
 import gradio as gr
 from transformers import Qwen2_5OmniModel, AutoProcessor
-from qwen_omni_utils import process_mm_info
 import torch
 # Load model and processor
@@ -22,13 +21,13 @@ def process_input(text_input, image_input=None, audio_input=None, video_input=No
         conversation[0]["content"].append({"video": video_input})
     # Process conversation
-    model_inputs = processor.process_chat_conversation(conversation, return_tensors="pt").to(device)
     # Generate response
     outputs = model.generate(**model_inputs, max_length=200)
     response_text = processor.decode(outputs[0], skip_special_tokens=True)
-    # Audio output is not implemented for simplicity
     response_audio = None
     return response_text, response_audio

 import gradio as gr
 from transformers import Qwen2_5OmniModel, AutoProcessor
 import torch
 # Load model and processor
         conversation[0]["content"].append({"video": video_input})
     # Process conversation
+    model_inputs = processor.apply_chat_template(conversation, return_tensors="pt").to(device)
     # Generate response
     outputs = model.generate(**model_inputs, max_length=200)
     response_text = processor.decode(outputs[0], skip_special_tokens=True)
+    # Audio output not implemented
     response_audio = None
     return response_text, response_audio