Spaces:

JuanCabs
/

Historical_Languages_LLMs

Runtime error

JuanCabs commited on Oct 5, 2024

Commit

ec02098

verified ·

1 Parent(s): d0224d5

Update app.py

Files changed (1) hide show

app.py CHANGED Viewed

@@ -1,27 +1,24 @@
-import gradio as gr
-from transformers import AutoModelForCausalLM, AutoTokenizer
-# Cargar el modelo sin optimización de 8 bits (usa más memoria)
-model = AutoModelForCausalLM.from_pretrained(
-    "JuanCabs/lapepav0",
-    device_map="auto"  # Asigna automáticamente el dispositivo CPU/GPU disponible
-)
-tokenizer = AutoTokenizer.from_pretrained("JuanCabs/lapepav0")
-# Definir la función para generar texto
-def generate_text(prompt):
-    inputs = tokenizer(prompt, return_tensors="pt")
     outputs = model.generate(**inputs, max_length=100)
     return tokenizer.decode(outputs[0], skip_special_tokens=True)
-# Crear la interfaz de Gradio
-interface = gr.Interface(
-    fn=generate_text,  # Función que se ejecutará cuando el usuario envíe un prompt
-    inputs="text",     # Entrada de texto
-    outputs="text",    # Salida de texto
-    title="Text Generation with Model",  # Título del Space
-    description="Introduce un prompt para generar texto usando el modelo"  # Descripción
-)
-# Lanzar la aplicación
-interface.launch()

+from transformers import AutoTokenizer, AutoModelForCausalLM
+import torch
+# Cargar el tokenizer del modelo base
+tokenizer = AutoTokenizer.from_pretrained("unsloth/meta-llama-3.1-8b-bnb-4bit")
+# Cargar el modelo base
+model = AutoModelForCausalLM.from_pretrained("unsloth/meta-llama-3.1-8b-bnb-4bit",
+                                             load_in_4bit=True,
+                                             device_map="auto")
+# Cargar el adaptador LoRA
+model.load_adapter("JuanCabs/lapepav1", source="hf")
+# Prueba de generación de texto
+def generar_respuesta(prompt):
+    inputs = tokenizer(prompt, return_tensors="pt").to("cuda")
     outputs = model.generate(**inputs, max_length=100)
     return tokenizer.decode(outputs[0], skip_special_tokens=True)
+# Ejemplo de uso
+prompt = "¿Cómo será el futuro de la inteligencia artificial?"
+respuesta = generar_respuesta(prompt)
+print(respuesta)