JuanCabs's picture
Update app.py
ec02098 verified
raw
history blame
900 Bytes
from transformers import AutoTokenizer, AutoModelForCausalLM
import torch
# Cargar el tokenizer del modelo base
tokenizer = AutoTokenizer.from_pretrained("unsloth/meta-llama-3.1-8b-bnb-4bit")
# Cargar el modelo base
model = AutoModelForCausalLM.from_pretrained("unsloth/meta-llama-3.1-8b-bnb-4bit",
load_in_4bit=True,
device_map="auto")
# Cargar el adaptador LoRA
model.load_adapter("JuanCabs/lapepav1", source="hf")
# Prueba de generaci贸n de texto
def generar_respuesta(prompt):
inputs = tokenizer(prompt, return_tensors="pt").to("cuda")
outputs = model.generate(**inputs, max_length=100)
return tokenizer.decode(outputs[0], skip_special_tokens=True)
# Ejemplo de uso
prompt = "驴C贸mo ser谩 el futuro de la inteligencia artificial?"
respuesta = generar_respuesta(prompt)
print(respuesta)