Spaces:
Runtime error
Runtime error
from transformers import AutoTokenizer, AutoModelForCausalLM | |
import torch | |
# Cargar el tokenizer del modelo base | |
tokenizer = AutoTokenizer.from_pretrained("unsloth/meta-llama-3.1-8b-bnb-4bit") | |
# Cargar el modelo base | |
model = AutoModelForCausalLM.from_pretrained("unsloth/meta-llama-3.1-8b-bnb-4bit", | |
load_in_4bit=True, | |
device_map="auto") | |
# Cargar el adaptador LoRA | |
model.load_adapter("JuanCabs/lapepav1", source="hf") | |
# Prueba de generaci贸n de texto | |
def generar_respuesta(prompt): | |
inputs = tokenizer(prompt, return_tensors="pt").to("cuda") | |
outputs = model.generate(**inputs, max_length=100) | |
return tokenizer.decode(outputs[0], skip_special_tokens=True) | |
# Ejemplo de uso | |
prompt = "驴C贸mo ser谩 el futuro de la inteligencia artificial?" | |
respuesta = generar_respuesta(prompt) | |
print(respuesta) | |