Spaces:

JuanCabs
/

Historical_Languages_LLMs

Runtime error

File size: 900 Bytes

from transformers import AutoTokenizer, AutoModelForCausalLM
import torch

# Cargar el tokenizer del modelo base
tokenizer = AutoTokenizer.from_pretrained("unsloth/meta-llama-3.1-8b-bnb-4bit")

# Cargar el modelo base
model = AutoModelForCausalLM.from_pretrained("unsloth/meta-llama-3.1-8b-bnb-4bit", 
                                             load_in_4bit=True, 
                                             device_map="auto")

# Cargar el adaptador LoRA
model.load_adapter("JuanCabs/lapepav1", source="hf")

# Prueba de generación de texto
def generar_respuesta(prompt):
    inputs = tokenizer(prompt, return_tensors="pt").to("cuda")
    outputs = model.generate(**inputs, max_length=100)
    return tokenizer.decode(outputs[0], skip_special_tokens=True)

# Ejemplo de uso
prompt = "¿Cómo será el futuro de la inteligencia artificial?"
respuesta = generar_respuesta(prompt)
print(respuesta)