Spaces:

Hodely
/

AmsideAi

Runtime error

App Files Files Community

Hodely commited on May 27

Commit

6c92216

verified ·

1 Parent(s): acceed5

Update app.py

Browse files

Files changed (1) hide show

app.py +73 -60

app.py CHANGED Viewed

@@ -1,70 +1,83 @@
-from flask import Flask, request, jsonify
-from flask_cors import CORS
-from transformers import pipeline
-import os
-app = Flask(__name__)
-CORS(app) # Habilita CORS para permitir peticiones desde tu frontend
-# Nombre del modelo de Hugging Face
-MODEL_ID = "sarvamai/sarvam-m"
-# Variable para almacenar el pipeline de la IA
-pipe = None
-# Función para cargar el modelo
-def load_model():
-    global pipe
-    try:
-        print(f"Cargando modelo '{MODEL_ID}'. Esto puede tardar unos minutos...")
-        # El token de Hugging Face se obtiene automáticamente de la variable de entorno HF_TOKEN
-        # que configuras como un "Secret" en Hugging Face Spaces.
-        pipe = pipeline("text-generation", model=MODEL_ID, device=-1) # device=-1 usa CPU
-        print(f"Modelo '{MODEL_ID}' cargado con éxito.")
-    except Exception as e:
-        print(f"Error al cargar el modelo '{MODEL_ID}': {e}")
-        pipe = None
-        print("El servidor no podrá responder a las solicitudes de IA.")
-# Cargar el modelo inmediatamente después de crear la aplicación Flask
-# Esto se asegura de que el modelo se cargue al inicio del servidor
-with app.app_context():
-    load_model()
-@app.route('/chat', methods=['POST'])
-def chat():
-    if pipe is None:
-        return jsonify({"error": "El modelo de IA no está cargado. Por favor, revisa el log del servidor."}), 503
-    data = request.json
-    messages = data.get('messages') # El frontend envía el historial completo
-    if not messages:
-        return jsonify({"error": "No se proporcionaron mensajes."}), 400
-    try:
-        prompt = ""
-        for msg in messages:
-            if msg['role'] == 'user':
-                prompt += f"Usuario: {msg['content']}\n"
-            elif msg['role'] == 'assistant':
-                prompt += f"Asistente: {msg['content']}\n"
-        prompt += "Asistente:"
-        response = pipe(prompt, max_new_tokens=250, temperature=0.7, do_sample=True, clean_up_tokenization_spaces=True)
-        generated_text = response[0]['generated_text']
-        ai_response_content = generated_text.split("Asistente:", 1)[-1].strip()
-        if not ai_response_content:
-            ai_response_content = "Lo siento, no pude generar una respuesta clara. ¿Puedes intentarlo de nuevo?"
-        return jsonify({"response": ai_response_content})
-    except Exception as e:
-        print(f"Error en la inferencia de la IA: {e}")
-        return jsonify({"error": f"Error interno del servidor: {str(e)}"}), 500
-if __name__ == '__main__':
-    port = int(os.environ.get('PORT', 7860))
-    app.run(debug=False, host='0.0.0.0', port=port)

+from transformers import AutoTokenizer, AutoModelForCausalLM
+import gradio as gr
+import torch
+# --- Cargar el tokenizador y el modelo ---
+# Se cargan una sola vez al inicio de la aplicación para mayor eficiencia.
+# 'device_map="auto"' es crucial para que Hugging Face Spaces lo asigne correctamente
+# a la GPU (si está disponible) o a la CPU.
+# 'torch_dtype=torch.bfloat16' optimiza el uso de memoria en GPUs modernas.
+tokenizer = AutoTokenizer.from_pretrained("tiiuae/Falcon-H1-1.5B-Deep-Instruct")
+model = AutoModelForCausalLM.from_pretrained(
+    "tiiuae/Falcon-H1-1.5B-Deep-Instruct",
+    torch_dtype=torch.bfloat16, # Puedes probar con torch.float16 si da problemas
+    device_map="auto"
+)
+# --- Definir la función de generación de texto ---
+def generate_text(user_input, history):
+    # Personalidad de Amside AI
+    # Este es un "system prompt" que ayuda al modelo a mantener el personaje.
+    # Se añade al inicio de cada conversación o antes de cada turno.
+    # Ajusta esta parte para afinar la personalidad de Amside.
+    system_message = (
+        "Eres Amside AI, una inteligencia artificial creada por Hodelygil. "
+        "Tu propósito principal es asistir en el estudio y el aprendizaje, "
+        "proporcionando información y explicaciones detalladas. "
+        "Sin embargo, también eres amigable y puedes mantener conversaciones informales y agradables. "
+        "Responde de manera informativa y útil, pero con un tono conversacional."
+    )
+    # Formatear los mensajes para el modelo, incluyendo el historial de chat
+    # El formato del "chat_template" es crucial para que el modelo entienda el diálogo.
+    messages = [{"role": "system", "content": system_message}] # El system message va primero
+    for human, bot in history:
+        messages.append({"role": "user", "content": human})
+        messages.append({"role": "assistant", "content": bot})
+    messages.append({"role": "user", "content": user_input})
+    # Codificar los mensajes en IDs de tokens
+    input_ids = tokenizer.apply_chat_template(messages, return_tensors="pt")
+    # Mover los IDs de tokens al mismo dispositivo donde se cargó el modelo (GPU/CPU)
+    input_ids = input_ids.to(model.device)
+    # Generar la respuesta del modelo
+    outputs = model.generate(
+        input_ids,
+        max_new_tokens=500,  # Máximo de tokens para la respuesta del modelo
+        do_sample=True,      # Activa el muestreo para respuestas más creativas
+        temperature=0.7,     # Controla la aleatoriedad (menor = más predecible)
+        top_p=0.9,           # Controla la diversidad de las palabras elegidas
+        repetition_penalty=1.1 # Penaliza la repetición de frases
+    )
+    # Decodificar la respuesta y eliminar el prompt original para solo mostrar la respuesta de Amside
+    # outputs[0] es la secuencia completa, input_ids.shape[1] es la longitud del prompt
+    response = tokenizer.decode(outputs[0][input_ids.shape[1]:], skip_special_tokens=True)
+    return response
+# --- Configurar la interfaz de Gradio ---
+# gr.ChatInterface es una forma sencilla de crear una interfaz de chatbot.
+iface = gr.ChatInterface(
+    fn=generate_text,
+    chatbot=gr.Chatbot(height=400), # Altura de la ventana de chat
+    textbox=gr.Textbox(placeholder="Escribe tu mensaje para Amside AI...", container=False, scale=7),
+    title="Amside AI - Tu Compañero de Estudio y Conversación",
+    description="Soy Amside AI, una inteligencia artificial creada por Hodelygil. Estoy aquí para ayudarte a estudiar y conversar.",
+    examples=[
+        "¿Qué es la fotosíntesis?",
+        "Cuéntame un dato interesante.",
+        "¿Cómo funciona la gravedad?",
+        "Hola Amside, ¿cómo estás?",
+        "Dame un resumen de la historia de España."
+    ],
+    theme="soft", # Un tema visual más suave para la interfaz
+    retry_btn="Reintentar",
+    undo_btn="Deshacer",
+    clear_btn="Limpiar Historial"
+)
+# Lanzar la aplicación Gradio
+iface.launch()