Spaces:

VietCat
/

gpt2-vietnamese-api

Sleeping

App Files Files Community

VietCat commited on May 6

Commit

2454010

1 Parent(s): 4bf4a35

fix runtime error

Browse files

Files changed (3) hide show

Dockerfile +2 -18
app.py +16 -56
requirements.txt +3 -5

Dockerfile CHANGED Viewed

@@ -1,27 +1,11 @@
-# Use lightweight Python image
 FROM python:3.10-slim
-# Prevent interactive prompts during package install
-ENV DEBIAN_FRONTEND=noninteractive
-# Set working directory
 WORKDIR /app
-# Install basic dependencies
-RUN apt-get update && apt-get install -y \
-    git \
-    && rm -rf /var/lib/apt/lists/*
-# Copy requirements and install Python packages
 COPY requirements.txt .
-RUN pip install --no-cache-dir --upgrade pip \
-    && pip install --no-cache-dir -r requirements.txt
-# Copy application code
-COPY app.py .
-# Expose Gradio default port
-EXPOSE 7860
-# Run the app
 CMD ["python", "app.py"]

 FROM python:3.10-slim
 WORKDIR /app
 COPY requirements.txt .
+RUN pip install --no-cache-dir -r requirements.txt
+COPY . .
 CMD ["python", "app.py"]

app.py CHANGED Viewed

@@ -1,64 +1,24 @@
 import gradio as gr
-from transformers import AutoTokenizer, AutoModelForCausalLM
-import torch
-from fastapi import FastAPI, Request
-import uvicorn
-from threading import Thread
-# -------- Load model --------
-model_name = "VietAI/gpt-neo-1.3B-vietnamese-news"
-tokenizer = AutoTokenizer.from_pretrained(model_name)
-model = AutoModelForCausalLM.from_pretrained(model_name)
-model.eval()
-device = torch.device("cuda" if torch.cuda.is_available() else "cpu")
-model.to(device)
-# -------- Inference function --------
-def generate_text(prompt, max_tokens=100, temperature=0.9, top_p=0.95):
-    inputs = tokenizer(prompt, return_tensors="pt").to(device)
-    outputs = model.generate(
-        **inputs,
-        max_new_tokens=max_tokens,
         do_sample=True,
         temperature=temperature,
-        top_p=top_p,
-        pad_token_id=tokenizer.eos_token_id,
     )
-    return tokenizer.decode(outputs[0], skip_special_tokens=True)
-# -------- Gradio UI --------
-def launch_gradio():
-    with gr.Blocks() as demo:
-        gr.Markdown("## 🇻🇳 VietAI GPT-Neo 1.3B - Sinh văn bản tiếng Việt")
-        prompt = gr.Textbox(label="Prompt", placeholder="Nhập đoạn mở đầu văn bản...")
-        max_tokens = gr.Slider(10, 200, value=100, label="Số tokens sinh ra")
-        temperature = gr.Slider(0.1, 1.5, value=0.9, label="Temperature")
-        top_p = gr.Slider(0.1, 1.0, value=0.95, label="Top-p sampling")
-        output = gr.Textbox(label="Kết quả", lines=10)
-        btn = gr.Button("Sinh văn bản")
-        btn.click(fn=generate_text, inputs=[prompt, max_tokens, temperature, top_p], outputs=output)
-    demo.launch(server_name="0.0.0.0", server_port=7860, share=False)
-# -------- FastAPI for REST API --------
-app = FastAPI()
-@app.post("/generate")
-async def generate(request: Request):
-    body = await request.json()
-    prompt = body.get("prompt", "")
-    max_tokens = body.get("max_tokens", 100)
-    temperature = body.get("temperature", 0.9)
-    top_p = body.get("top_p", 0.95)
-    output = generate_text(prompt, max_tokens, temperature, top_p)
-    return {"response": output}
-# -------- Start Gradio in background --------
-if __name__ == "__main__":
-    # Run Gradio in another thread
-    thread = Thread(target=launch_gradio)
-    thread.start()
-    # Start FastAPI
-    uvicorn.run(app, host="0.0.0.0", port=8000)

 import gradio as gr
+from transformers import GPT2Tokenizer, GPT2LMHeadModel
+model_id = "NlpHUST/gpt2-vietnamese"
+tokenizer = GPT2Tokenizer.from_pretrained(model_id)
+model = GPT2LMHeadModel.from_pretrained(model_id)
+def generate(prompt, max_length=100, temperature=0.8):
+    input_ids = tokenizer.encode(prompt, return_tensors="pt")
+    output = model.generate(
+        input_ids,
+        max_length=max_length,
         do_sample=True,
         temperature=temperature,
+        top_p=0.95
     )
+    return tokenizer.decode(output[0], skip_special_tokens=True)
+demo = gr.Interface(fn=generate,
+                    inputs=["text", gr.Slider(50, 200, value=100), gr.Slider(0.1, 1.0, value=0.8)],
+                    outputs="text",
+                    title="Sinh văn bản tiếng Việt bằng GPT-2")
+demo.launch()

requirements.txt CHANGED Viewed

@@ -1,5 +1,3 @@
-transformers>=4.40.0
-torch
-gradio>=4.26.0
-uvicorn
-fastapi

+transformers==4.39.3
+torch==2.1.2
+gradio==4.27.0