Spaces:

gitgato
/

speecht-to-speech

Runtime error

gitgato commited on May 10, 2024

Commit

14fc461

verified ·

1 Parent(s): ab3c33f

Update app.py

Files changed (1) hide show

app.py CHANGED Viewed

@@ -1,14 +1,14 @@
 import torch
 from transformers import pipeline
 from datasets import load_dataset
 from transformers import SpeechT5Processor, Speech2Text2Speech, SpeechT5HifiGan
 import numpy as np
 import gradio as gr
 # Configurar el pipeline de reconocimiento automático de voz
-pipe = pipeline(
-    "automatic-speech-recognition", model="openai/whisper-base"
-)
 # Función para traducir texto
 def translate(audio):
@@ -17,7 +17,7 @@ def translate(audio):
 # Cargar el procesador y el modelo de SpeechT5
 processor = SpeechT5Processor.from_pretrained("microsoft/speecht5_tts")
-model = Speech2Text2Speech.from_pretrained("gitgato/mabama")
 vocoder = SpeechT5HifiGan.from_pretrained("microsoft/speecht5_hifigan")
 # Cargar los datos de embeddings del hablante

 import torch
 from transformers import pipeline
 from datasets import load_dataset
+from transformers import AutoModel
 from transformers import SpeechT5Processor, Speech2Text2Speech, SpeechT5HifiGan
 import numpy as np
 import gradio as gr
 # Configurar el pipeline de reconocimiento automático de voz
+pipe = pipeline("automatic-speech-recognition", model="openai/whisper-base")
+# Load model directly
 # Función para traducir texto
 def translate(audio):
 # Cargar el procesador y el modelo de SpeechT5
 processor = SpeechT5Processor.from_pretrained("microsoft/speecht5_tts")
+model = AutoModel.from_pretrained("gitgato/mabama")
 vocoder = SpeechT5HifiGan.from_pretrained("microsoft/speecht5_hifigan")
 # Cargar los datos de embeddings del hablante