Spaces:

VietCat
/

gpt2-vietnamese-api

Sleeping

File size: 1,083 Bytes

import os
os.environ["TRANSFORMERS_CACHE"] = "/app/cache"

import gradio as gr
from transformers import GPT2Tokenizer, GPT2LMHeadModel

model_id = "NlpHUST/gpt2-vietnamese"

tokenizer = GPT2Tokenizer.from_pretrained(model_id)
model = GPT2LMHeadModel.from_pretrained(model_id)

def generate(prompt, max_length=100, temperature=0.8):
    input_ids = tokenizer.encode(prompt, return_tensors="pt")
    output = model.generate(
        input_ids,
        max_length=max_length,
        do_sample=True,
        temperature=temperature,
        top_p=0.95
    )
    return tokenizer.decode(output[0], skip_special_tokens=True)

demo = gr.Interface(
    fn=generate,
    inputs=[
        gr.Textbox(label="Nhập nội dung đầu vào"),
        gr.Slider(50, 200, value=100, step=10, label="Độ dài tối đa"),
        gr.Slider(0.1, 1.0, value=0.8, step=0.05, label="Temperature")
    ],
    outputs="text",
    title="Sinh văn bản tiếng Việt bằng GPT-2",
    description="Dùng mô hình GPT-2 Vietnamese từ NlpHUST để sinh văn bản tiếng Việt."
)

demo.launch()