Spaces:

Hodely
/

AmsideAi

Runtime error

App Files Files Community

Hodely commited on May 27

Commit

acceed5

verified ·

1 Parent(s): d3f31fd

Update app.py

Browse files

Files changed (1) hide show

app.py +69 -86

app.py CHANGED Viewed

@@ -1,87 +1,70 @@
-from flask import Flask, request, jsonify
-from flask_cors import CORS
-from transformers import pipeline
-import os # Necesario para acceder a variables de entorno
-app = Flask(__name__)
-CORS(app) # Habilita CORS para permitir peticiones desde tu frontend
-# Nombre del modelo de Hugging Face
-MODEL_ID = "sarvamai/sarvam-m"
-# Variable para almacenar el pipeline de la IA
-pipe = None
-# Función para cargar el modelo
-# Se llama al inicio para que el modelo esté listo
-def load_model():
-    global pipe
-    try:
-        print(f"Cargando modelo '{MODEL_ID}'. Esto puede tardar unos minutos...")
-        # El token de Hugging Face se obtiene automáticamente de la variable de entorno HF_TOKEN
-        # que configuras como un "Secret" en Hugging Face Spaces.
-        # No necesitas pasarlo explícitamente aquí si está en los Secrets.
-        # device=-1 usa CPU, device=0 usa GPU si está disponible (en Spaces, se elegirá automáticamente si el hardware lo soporta)
-        pipe = pipeline("text-generation", model=MODEL_ID, device=-1)
-        print(f"Modelo '{MODEL_ID}' cargado con éxito.")
-    except Exception as e:
-        print(f"Error al cargar el modelo '{MODEL_ID}': {e}")
-        pipe = None
-        print("El servidor no podrá responder a las solicitudes de IA.")
-# Cargar el modelo cuando la aplicación Flask se inicia
-# Usamos app.before_first_request para asegurar que se carga una vez al inicio
-@app.before_first_request
-def init_model():
-    load_model()
-@app.route('/chat', methods=['POST'])
-def chat():
-    if pipe is None:
-        return jsonify({"error": "El modelo de IA no está cargado. Por favor, revisa el log del servidor."}), 503
-    data = request.json
-    messages = data.get('messages') # El frontend envía el historial completo
-    if not messages:
-        return jsonify({"error": "No se proporcionaron mensajes."}), 400
-    try:
-        # Construimos un prompt simple para el modelo de text-generation
-        # concatenando el historial de mensajes.
-        # Esta es una una simplificación; los modelos de chat suelen tener un formato específico.
-        prompt = ""
-        for msg in messages:
-            if msg['role'] == 'user':
-                prompt += f"Usuario: {msg['content']}\n"
-            elif msg['role'] == 'assistant':
-                prompt += f"Asistente: {msg['content']}\n"
-        prompt += "Asistente:" # Indicamos que esperamos la respuesta del asistente
-        # Ajusta parámetros como max_new_tokens, temperature, do_sample según tu necesidad
-        response = pipe(prompt, max_new_tokens=250, temperature=0.7, do_sample=True, clean_up_tokenization_spaces=True)
-        # La respuesta del pipe es una lista. Tomamos el primer elemento.
-        generated_text = response[0]['generated_text']
-        # Extraemos la parte de la respuesta de la IA.
-        # Esto puede ser complicado con text-generation si el modelo repite el prompt.
-        # Aquí asumimos que la respuesta de la IA comienza después del último "Asistente:"
-        ai_response_content = generated_text.split("Asistente:", 1)[-1].strip()
-        # A veces el modelo puede generar texto vacío o solo espacios.
-        if not ai_response_content:
-            ai_response_content = "Lo siento, no pude generar una respuesta clara. ¿Puedes intentarlo de nuevo?"
-        return jsonify({"response": ai_response_content})
-    except Exception as e:
-        print(f"Error en la inferencia de la IA: {e}")
-        return jsonify({"error": f"Error interno del servidor: {str(e)}"}), 500
-if __name__ == '__main__':
-    # Obtener el puerto de la variable de entorno que proporciona Hugging Face Spaces
-    # Por defecto, en Gradio Spaces, es 7860
-    port = int(os.environ.get('PORT', 7860))
-    # ¡NUNCA USES debug=True EN PRODUCCIÓN! Solo para desarrollo.
     app.run(debug=False, host='0.0.0.0', port=port)

+from flask import Flask, request, jsonify
+from flask_cors import CORS
+from transformers import pipeline
+import os
+app = Flask(__name__)
+CORS(app) # Habilita CORS para permitir peticiones desde tu frontend
+# Nombre del modelo de Hugging Face
+MODEL_ID = "sarvamai/sarvam-m"
+# Variable para almacenar el pipeline de la IA
+pipe = None
+# Función para cargar el modelo
+def load_model():
+    global pipe
+    try:
+        print(f"Cargando modelo '{MODEL_ID}'. Esto puede tardar unos minutos...")
+        # El token de Hugging Face se obtiene automáticamente de la variable de entorno HF_TOKEN
+        # que configuras como un "Secret" en Hugging Face Spaces.
+        pipe = pipeline("text-generation", model=MODEL_ID, device=-1) # device=-1 usa CPU
+        print(f"Modelo '{MODEL_ID}' cargado con éxito.")
+    except Exception as e:
+        print(f"Error al cargar el modelo '{MODEL_ID}': {e}")
+        pipe = None
+        print("El servidor no podrá responder a las solicitudes de IA.")
+# Cargar el modelo inmediatamente después de crear la aplicación Flask
+# Esto se asegura de que el modelo se cargue al inicio del servidor
+with app.app_context():
+    load_model()
+@app.route('/chat', methods=['POST'])
+def chat():
+    if pipe is None:
+        return jsonify({"error": "El modelo de IA no está cargado. Por favor, revisa el log del servidor."}), 503
+    data = request.json
+    messages = data.get('messages') # El frontend envía el historial completo
+    if not messages:
+        return jsonify({"error": "No se proporcionaron mensajes."}), 400
+    try:
+        prompt = ""
+        for msg in messages:
+            if msg['role'] == 'user':
+                prompt += f"Usuario: {msg['content']}\n"
+            elif msg['role'] == 'assistant':
+                prompt += f"Asistente: {msg['content']}\n"
+        prompt += "Asistente:"
+        response = pipe(prompt, max_new_tokens=250, temperature=0.7, do_sample=True, clean_up_tokenization_spaces=True)
+        generated_text = response[0]['generated_text']
+        ai_response_content = generated_text.split("Asistente:", 1)[-1].strip()
+        if not ai_response_content:
+            ai_response_content = "Lo siento, no pude generar una respuesta clara. ¿Puedes intentarlo de nuevo?"
+        return jsonify({"response": ai_response_content})
+    except Exception as e:
+        print(f"Error en la inferencia de la IA: {e}")
+        return jsonify({"error": f"Error interno del servidor: {str(e)}"}), 500
+if __name__ == '__main__':
+    port = int(os.environ.get('PORT', 7860))
     app.run(debug=False, host='0.0.0.0', port=port)